Neste curso, aprenderemos a otimizar ficheiros e dados para a Geração Aumentada por Recuperação, ou RAG.
Ao final deste curso, você terá etapas práticas que podem ser seguidas para melhorar a qualidade das respostas que um LLM gera ao usar uma fonte de conhecimento personalizada.
O RAG combina dois conceitos poderosos: recuperação e geração. Permite ao seu agente de IA obter informações precisas de vastas fontes de dados, como um catálogo de produtos ou uma lista de apólices, e depois utilizar modelos de linguagem para gerar respostas naturais e informativas. Isto significa um agente que não só dá uma resposta, como também fornece a resposta correta a partir de uma fonte fiável, de forma rápida e precisa.
Mas a questão é a seguinte: a qualidade das respostas do seu agente depende muito da qualidade e da estrutura dos dados que lhe são fornecidos. Se os dados recebidos forem desordenados, redundantes ou não estruturados, as respostas do seu agente reflectirão isso mesmo. É aqui que o pré-processamento de dados se torna crucial. Ao preparar cuidadosamente os seus dados, está a estabelecer a base para respostas de alta qualidade, significativas e precisas.
Nesta série, iremos guiá-lo por tudo o que precisa de saber para preparar os seus ficheiros e dados para o RAG. Iremos abordar:
- Como estruturar os seus documentos para maior clareza,
- Melhores práticas para limpar e simplificar o texto,
- Adição de metadados e resumos para um contexto mais rico,
- Otimização de dados não textuais, como imagens e tabelas,
- Validação e manutenção dos dados.
Cada vídeo irá detalhar estes passos com exemplos, fornecendo-lhe informações acionáveis para aplicar diretamente aos seus projectos de IA. No final desta série, terá as ferramentas para pegar em qualquer conjunto de dados, transformá-lo para RAG e otimizar o desempenho dos seus agentes de IA.