Nesta lição

Neste curso, aprenderemos a otimizar ficheiros e dados para a Geração Aumentada por Recuperação, ou RAG.

Ao final deste curso, você terá etapas práticas que podem ser seguidas para melhorar a qualidade das respostas que um LLM gera ao usar uma fonte de conhecimento personalizada.

O RAG combina dois conceitos poderosos: recuperação e geração. Permite ao seu agente de IA obter informações precisas de vastas fontes de dados, como um catálogo de produtos ou uma lista de apólices, e depois utilizar modelos de linguagem para gerar respostas naturais e informativas. Isto significa um agente que não só dá uma resposta, como também fornece a resposta correta a partir de uma fonte fiável, de forma rápida e precisa.

Mas a questão é a seguinte: a qualidade das respostas do seu agente depende muito da qualidade e da estrutura dos dados que lhe são fornecidos. Se os dados recebidos forem desordenados, redundantes ou não estruturados, as respostas do seu agente reflectirão isso mesmo. É aqui que o pré-processamento de dados se torna crucial. Ao preparar cuidadosamente os seus dados, está a estabelecer a base para respostas de alta qualidade, significativas e precisas.

Nesta série, iremos guiá-lo por tudo o que precisa de saber para preparar os seus ficheiros e dados para o RAG. Iremos abordar:

  • Como estruturar os seus documentos para maior clareza,
  • Melhores práticas para limpar e simplificar o texto,
  • Adição de metadados e resumos para um contexto mais rico,
  • Otimização de dados não textuais, como imagens e tabelas,
  • Validação e manutenção dos dados.

Cada vídeo irá detalhar estes passos com exemplos, fornecendo-lhe informações acionáveis para aplicar diretamente aos seus projectos de IA. No final desta série, terá as ferramentas para pegar em qualquer conjunto de dados, transformá-lo para RAG e otimizar o desempenho dos seus agentes de IA.

Resumo
Cada vídeo irá detalhar estes passos com exemplos, fornecendo-lhe informações acionáveis para aplicar diretamente aos seus projectos de IA. No final desta série, terá as ferramentas para pegar em qualquer conjunto de dados, transformá-lo para RAG e otimizar o desempenho dos seus agentes de IA.
todas as lições deste curso