RAG를 위한 파일 최적화 방법 | 이미지와 표

강의

초급

나의 첫 번째 AI 에이전트

Studio 인터페이스

중급

고급

이번 강의에서

텍스트 최적화에 대해 많이 이야기했지만, 문서에 이미지나 표가 포함되어 있다면 이러한 요소들도 에이전트가 활용할 수 있도록 추가적인 준비가 필요합니다. 비텍스트 콘텐츠인 이미지, 차트, 표 등에는 중요한 정보가 담겨 있을 수 있지만, 제대로 준비하지 않으면 LLM이 이 정보를 무시하거나 잘못 해석할 수 있습니다.

먼저 이미지를 살펴보겠습니다. 문서에 제품 사진이나 매우 스타일화된 텍스트 등 이미지가 포함되어 있다면, 파일을 업로드하기 전에 이를 일반 텍스트로 변환하는 것이 좋습니다. Botpress는 파일을 업로드하면 자동으로 사전 처리하지만, 일관된 답변을 얻으려면 직접 변환하는 것이 가장 좋습니다.

예를 들어, 이 스타일이 적용된 레스토랑 메뉴를 보겠습니다. 일반 텍스트 파일로 변환하기 전에는 LLM이 사용할 수 있는 정보가 이렇게 파싱된 형태로 보입니다. 반면, 업로드 전에 마크다운으로 변환하거나 Botpress의 내장 리치 텍스트 에디터를 사용하면 훨씬 더 신뢰할 수 있는 결과를 얻을 수 있습니다.

다음은 표와 구조화된 데이터에 대해 이야기해보겠습니다. 문서에 표를 포함할 경우, RAG를 수행하기 전에 파일이 마크다운으로 변환된다는 점을 기억하세요. 여기에는 두 가지 방법이 있습니다. 내장된 Botpress 표를 지식 베이스로 지정해 정보를 구조화할 수 있고, 또는 다음과 같이 마크다운 형식의 표를 사용할 수도 있습니다.

비텍스트 콘텐츠를 최적화하려면 이미지는 OCR로 처리하고, 복잡한 시각 자료에는 설명을 추가하며, 표는 AI 에이전트가 활용할 수 있도록 적절하게 제시해야 합니다. 여기서 목표는 텍스트와 비텍스트 콘텐츠 모두를 포함한 전체 데이터셋을 LLM이 쉽게 읽을 수 있도록 만드는 것입니다.

‍

요약

이미지와 스타일이 적용된 문서를 일반 텍스트로 변환하고, 표는 구조화된 형식이나 마크다운으로 최적화하며, 비텍스트 콘텐츠도 처리하여 AI 에이전트가 데이터셋의 모든 정보를 정확하게 해석하고 활용할 수 있도록 합니다.

이 과정의 모든 강의