# Integração do Apify Web Scraping

Esta integração permite-lhe executar tarefas de raspagem da Web utilizando o Apify diretamente nas suas conversas de chatbot. Pode optar por recolher sites, perfis Instagram ou vídeos e curtas do YouTube. Vídeo explicativo :

Configuração

  • apiKey: A sua chave de API da Apify.

Acções

Raspar o site

Esta ação recolhe um site ou uma página utilizando o Apify.

Entrada
  • conversationId: ID da conversa: ``.
  • startUrls: Matriz de URLs para iniciar o rastreamento. Uma ou mais URLs de páginas onde o crawler irá começar. Por padrão, o Ator também irá rastrear sub-páginas destas URLs. Por exemplo, para o URL de início https://example.com/blog, ele também rastreará https://example.com/blog/post ou https://example.com/blog/article. A opção Incluir URLs (globs) anula este comportamento de automação.
  • useSitemaps: (Opcional) Se deve usar sitemaps para rastreamento. O padrão é false.
  • crawlerType: (Opcional) Tipo de crawler a ser utilizado. O padrão é playwright:adaptive.
Saída
  • runId: ID da execução de raspagem.

Raspar Instagram

Esta ação faz scraping de um perfil ou posts de Instagram .

Entrada
  • conversationId: ID da conversa: ``.
  • instagramUrl: Instagram URL para raspar.
  • scrapeType: Escolhe se quer coletar detalhes do perfil ou posts. O padrão é posts.
  • maxItems: (Opcional) Número máximo de itens a serem coletados. O padrão é 1.
Saída
  • runId: ID da execução de raspagem.

Raspar o YouTube

Esta ação recolhe vídeos e curtas do YouTube.

Entrada
  • conversationId: ID da conversa: ``.
  • searchTerm: (Opcional) Introduza um termo de pesquisa tal como o introduziria na barra de pesquisa do YouTube.
  • youtubeUrl: (Opcional) Introduza uma hiperligação para um vídeo, canal, lista de reprodução ou página de resultados de pesquisa do YouTube. Observe que a entrada do Termo de pesquisa será ignorada ao usar esta opção.
  • maxSearchResult: (Opcional) Limita o número de vídeos que pretende recolher. Se você rastrear um canal, funciona como um limite para vídeos regulares. O padrão é 5.
  • maxShorts: (Opcional) Limita o número de vídeos curtos que você deseja rastrear. O padrão é 0.
Saída
  • runId: ID da execução de raspagem.

Eventos

Raspagem do Apify concluída

Este evento é acionado quando uma tarefa de raspagem do Apify é concluída.

Esquema
  • conversationId: ID da conversa.

  • type: Tipo de tarefa de recolha de dados. Pode ser útil para criar filtros em eventos

  • data:

  • defaultDatasetId: ID do conjunto de dados com resultados de scraping.

  • results: Resultados do scraping. A estrutura depende do scraping escolhido. Veja o vídeo de apresentação para saber mais sobre o assunto

  • Alguns exemplos :

  • Texto do site : ``

  • Perfil Instagram : ``

  • Youtube : ``