벡터 저장소

메뉴얼웍스는 AI 제공자의 임베딩 모델을 API로 호출하여 매뉴얼웍스로 작성한 문서를 벡터화해 저장합니다. 챗봇을 사용하려면 문서를 임베딩하여 벡터 저장소(매뉴얼웍스의 내부 모듈)에 저장해야 합니다.

<AI | 벡터 저장소> 메뉴는 “관리” 권한이 있는 사용자만 사용할 수 있습니다.

벡터 저장소(Vector Store)란?

벡터 저장소는 텍스트, 이미지, 오디오 같은 비정형 데이터를 벡터로 변환해 저장하고, 유사도 검색을 통해 의미적으로 유사한 데이터를 찾아주는 특수한 데이터베이스입니다. AI 기반 검색 시스템, 추천 엔진, RAG(Retrieval-Augmented Generation, 검색 증강 생성) 애플리케이션 등에 활용됩니다.

매뉴얼웍스의 챗봇은 벡터 저장소를 이용한 RAG를 지원합니다.

문서 임베딩 및 저장하기

AI 어시스턴트를 사용할 때와 마찬가지로, 문서를 임베딩할 때도 비용이 발생합니다. 자세한 사항은 사용하는 AI 제공자의 문서를 참고합니다.

다음 순서로 문서를 임베딩하고 그 결과를 벡터 저장소에 저장합니다.

  1. <AI | 벡터 저장소> 메뉴로 이동합니다.

  2. <문서 추가> 링크를 클릭하여 임베딩할 문서를 선택합니다.

  3. ‘임베딩용 AI 모델’을 선택하고 <문서 임베딩 및 저장> 링크를 클릭합니다.

    • AI 제공자에서 설정한 임베딩용 AI 모델 중에서 선택할 수 있습니다.

  4. 임베딩된 문서가 벡터 저장소 목록에 추가됩니다.

임베딩을 위한 AI 모델이 필요합니다. 매뉴얼웍스가 지원하는 AI 제공자 중 Claude와 Grok은 임베딩용 AI 모델을 지원하지 않습니다. Gemini, OpenAI, Voyage AI 등은 임베딩용 AI 모델을 지원합니다.

문서 변경 사항 벡터 저장소에 반영하기

임베딩한 문서의 내용에 변경 사항이 생겼을 때, 자동으로 벡터 저장소에 변경 사항을 반영하지 않습니다. 바뀐 내용을 PDF 문서에 반영할 때와 마찬가지로 수동으로 작업해야 합니다.

  1. <AI | 벡터 저장소> 메뉴로 이동합니다.

  2. 목록에서 변경 사항을 반영할 문서의 <임베딩 동기화> 링크를 클릭합니다.

  3. 슬라이딩 패널의 버튼을 클릭하면 벡터 저장소에 변경 사항을 반영합니다.

<이력 비교> 링크를 클릭하면 문서를 임베딩(또는 임베딩 동기화)한 후 바뀐 내용을 확인할 수 있습니다.

저장된 문서 삭제하기

임베딩하여 벡터 저장소에 저장한 문서를 삭제할 수 있습니다.

  1. <AI | 벡터 저장소> 메뉴로 이동합니다.

  2. 삭제할 문서의 <삭제> 링크를 클릭합니다.

  3. 벡터 저장소 문서 목록에서 해당 문서가 삭제됩니다.

삭제 후 문서를 다시 임베딩할 경우 비용이 발생하므로, 삭제 시 주의가 필요합니다.

임베딩 대상 문서 내용

문서 공개와 임베딩

한 문서를 여러 AI 모델로 임베딩할 수 있습니다. 하지만 임베딩 대상이 되는 문서 내용은 최신 내용 또는 공개한 태그만을 대상으로 합니다. 따라서 태그별로 문서를 임베딩할 수 없고 공개한 태그 내용을 임베딩합니다. 공개한 태그가 없을 때는 최신 내용을 임베딩합니다. 이는 문서를 임베딩(또는 임베딩 동기화)하는 시점을 기준으로 결정합니다.

웹 뷰어 기준

웹 뷰어를 기준으로 문서를 임베딩합니다. 따라서 웹 뷰어에서 숨겨진 장과 숨겨진 단락(교정 단락)은 임베딩하지 않습니다. 그리고 참조한 장이나 다른 단락 가져오기로 포함한 단락도 임베딩합니다.

VECTOR_STORE_CACHE_SIZE 옵션으로 자바 힙 메모리 캐시 크기 설정

유사도 측정 검사 성능 향상을 위해 자바 힙 메모리에 임베딩한 문서를 10개까지 캐시합니다. 이 숫자를 변경하려면 콘솔에서 다음 명령어를 실행합니다.

set-preference -name VECTOR_STORE_CACHE_SIZE -value 5