# Integración con Apify Web Scraping
Esta integración le permite realizar tareas de web scraping utilizando Apify directamente dentro de sus conversaciones chatbot. Puedes elegir entre raspar sitios web, perfiles de Instagram , o videos y cortos de YouTube.
Video explicativo :
Configuración
apiKey
: Tu clave API de Apify.
Acciones
Scrapear Sitio Web
Esta acción raspa un sitio web o una página usando Apify.
Entrada
conversationId
: ID de la conversación: ``.
startUrls
: Array de URLs desde las que empezar a rastrear. Una o más URLs de páginas donde el rastreador comenzará. Por defecto, el Actor también rastreará las subpáginas de estas URLs. Por ejemplo, para la URL de inicio https://example.com/blog
, también rastreará https://example.com/blog/post
o https://example.com/blog/article
. La opción Incluir URLs (globs) anula este comportamiento automático.
- UseSitemaps": (Opcional) Indica si se deben utilizar mapas de sitio para el rastreo. Por defecto es
false
.
crawlerType
: (Opcional) Tipo de rastreador a utilizar. Por defecto es playwright:adaptive
.
Salida
runId
: ID de la ejecución de raspado.
Scrape Instagram
Esta acción raspa un perfil o entradas de Instagram .
Entrada
conversationId
: ID de la conversación: ``.
instagramUrl
: Instagram URL a raspar.
scrapeType
: Escoge entre los detalles del perfil o las publicaciones. Por defecto es posts
.
maxItems
: (Opcional) Número máximo de elementos a raspar. Por defecto es 1
.
Salida
runId
: ID de la ejecución de raspado.
Scrape YouTube
Esta acción recupera vídeos y cortos de YouTube.
Entrada
conversationId
: ID de la conversación: ``.
searchTerm
: (Opcional) Introduce un término de búsqueda tal y como lo harías en la barra de búsqueda de YouTube.
youtubeUrl
: (Opcional) Introduce un enlace a un vídeo, canal, lista de reproducción o página de resultados de búsqueda de YouTube. Tenga en cuenta que la entrada del término de búsqueda se ignorará al utilizar esta opción.
maxSearchResult
: (Opcional) Limite el número de vídeos que desea rastrear. Si rastrea un canal, actúa como límite para los vídeos normales. El valor predeterminado es "5".
- (Opcional) Limita el número de vídeos cortos que desea rastrear. El valor predeterminado es "0".
Salida
runId
: ID de la ejecución de raspado.
Eventos
Apify Scraping Completed
Este evento se activa cuando se completa una tarea de scraping de Apify.
Esquema
conversationId
: ID de la conversación.
type
: Tipo de tarea de scraping. Puede ser útil para crear filtros sobre eventos
data
:
defaultDatasetId
: ID del conjunto de datos con los resultados del scraping.
results
: Resultados del scraping. La estructura depende del scraping elegido. Vea el vídeo de presentación para obtener más información
Algunos ejemplos :
Texto del sitio web : ``
Instagram perfil : ``
Youtube : ``
# Integración con Apify Web Scraping
Esta integración le permite realizar tareas de web scraping utilizando Apify directamente dentro de sus conversaciones chatbot. Puedes elegir entre raspar sitios web, perfiles de Instagram , o videos y cortos de YouTube.
Video explicativo :
## Configuración
- `apiKey`: Tu clave API de Apify.
## Acciones
### Scrapear Sitio Web
Esta acción raspa un sitio web o una página usando Apify.
#### Entrada
- `conversationId`: ID de la conversación: ``.
- `startUrls`: Array de URLs desde las que empezar a rastrear. Una o más URLs de páginas donde el rastreador comenzará. Por defecto, el Actor también rastreará las subpáginas de estas URLs. Por ejemplo, para la URL de inicio `https://example.com/blog`, también rastreará `https://example.com/blog/post` o `https://example.com/blog/article`. La opción Incluir URLs (globs) anula este comportamiento automático.
- UseSitemaps": (Opcional) Indica si se deben utilizar mapas de sitio para el rastreo. Por defecto es `false`.
- `crawlerType`: (Opcional) Tipo de rastreador a utilizar. Por defecto es `playwright:adaptive`.
#### Salida
- `runId`: ID de la ejecución de raspado.
### Scrape Instagram
Esta acción raspa un perfil o entradas de Instagram .
#### Entrada
- `conversationId`: ID de la conversación: ``.
- `instagramUrl`: Instagram URL a raspar.
- `scrapeType`: Escoge entre los detalles del perfil o las publicaciones. Por defecto es `posts`.
- `maxItems`: (Opcional) Número máximo de elementos a raspar. Por defecto es `1`.
#### Salida
- `runId`: ID de la ejecución de raspado.
### Scrape YouTube
Esta acción recupera vídeos y cortos de YouTube.
#### Entrada
- `conversationId`: ID de la conversación: ``.
- `searchTerm`: (Opcional) Introduce un término de búsqueda tal y como lo harías en la barra de búsqueda de YouTube.
- `youtubeUrl`: (Opcional) Introduce un enlace a un vídeo, canal, lista de reproducción o página de resultados de búsqueda de YouTube. Tenga en cuenta que la entrada del término de búsqueda se ignorará al utilizar esta opción.
- `maxSearchResult`: (Opcional) Limite el número de vídeos que desea rastrear. Si rastrea un canal, actúa como límite para los vídeos normales. El valor predeterminado es "5".
- (Opcional) Limita el número de vídeos cortos que desea rastrear. El valor predeterminado es "0".
#### Salida
- `runId`: ID de la ejecución de raspado.
## Eventos
### Apify Scraping Completed
Este evento se activa cuando se completa una tarea de scraping de Apify.
#### Esquema
- `conversationId`: ID de la conversación.
- `type`: Tipo de tarea de scraping. Puede ser útil para crear filtros sobre eventos
- `data`:
- `defaultDatasetId`: ID del conjunto de datos con los resultados del scraping.
- `results`: Resultados del scraping. La estructura depende del scraping elegido. Vea el vídeo de presentación para obtener más información
- Algunos ejemplos :
- Texto del sitio web : ``
- Instagram perfil : ``
- Youtube : ``