We hebben het al vaak gehad over het optimaliseren van tekst, maar als je documenten afbeeldingen of tabellen bevatten, is het belangrijk om een paar extra stappen te nemen om ervoor te zorgen dat deze elementen ook bruikbaar zijn voor je agent. Niet-tekstuele inhoud zoals afbeeldingen, grafieken en tabellen kunnen waardevolle informatie bevatten, maar zonder zorgvuldige voorbereiding kan een LLM de informatie die ze bevatten negeren of verkeerd interpreteren.
Laten we beginnen met afbeeldingen. Als je documenten afbeeldingen bevatten, bijvoorbeeld een foto van een product of zelfs erg gestileerde tekst, is het een goed idee om die te converteren naar platte tekst voordat je je bestand uploadt. Botpress zal je bestanden sowieso voorbewerken zodra je ze uploadt, dus de beste manier om consistente antwoorden uit je bestanden te krijgen is door ze zelf te converteren.
Laten we als voorbeeld dit gestileerde restaurantmenu nemen. Voordat we het converteren naar een platte tekst bestand, ziet de informatie waarmee de LLM moet werken er zo uit, nadat het is geparsed. Als we het in plaats daarvan converteren naar markdown voordat we het uploaden (of de ingebouwde Botpress rich text editor gebruiken), dan krijgen we veel betrouwbaardere resultaten.
Laten we het vervolgens hebben over tabellen en gestructureerde gegevens. Als je tabellen opneemt in je documenten, vergeet dan niet dat je bestanden, voordat je RAG uitvoert, worden geconverteerd naar markdown. Hier heb je twee opties. Je kunt een ingebouwde Botpress tabel aanwijzen als kennisbank, zodat je informatie gestructureerd is, of je kunt een markdown-geformatteerde tabel zoals deze gebruiken.
Het optimaliseren van niet-tekstuele inhoud betekent het verwerken van afbeeldingen met OCR, het toevoegen van beschrijvingen voor complexe visuals en ervoor zorgen dat tabellen worden gepresenteerd op een manier die je AI-agent kan gebruiken. Hier is ons doel om de hele dataset, inclusief zowel tekst als niet-tekstuele inhoud, gemakkelijk leesbaar te maken voor een LLM .