# Integrazione di Apify Web Scraping
Questa integrazione consente di eseguire operazioni di web scraping utilizzando Apify direttamente all'interno delle conversazioni del chatbot. È possibile scegliere di eseguire lo scraping di siti web, profili Instagram o video e cortometraggi di YouTube.
Video esplicativo:
Configurazione
apiKey
: La chiave API di Apify.
Azioni
Raschiamento del sito web
Questa azione esegue lo scrape di un sito web o di una pagina utilizzando Apify.
Ingresso
conversationId
: ID della conversazione: ``.
startUrls
: Array di URL da cui avviare il crawling. Uno o più URL di pagine da cui iniziare il crawling. Per impostazione predefinita, l'Attore effettuerà il crawling anche delle sottopagine di questi URL. Ad esempio, per l'URL di partenza https://example.com/blog
, verrà effettuato il crawling anche di https://example.com/blog/post
o https://example.com/blog/article
. L'opzione Includi URL (globi) annulla questo comportamento di automazione.
useSitemaps
: (Opzionale) Se utilizzare le sitemap per il crawling. L'impostazione predefinita è false
.
crawlerType
: (Opzionale) Tipo di crawler da usare. L'impostazione predefinita è playwright:adaptive
.
Uscita
runId
: ID dell'esecuzione di scraping.
Scrape Instagram
Questa azione esegue lo scraping di un profilo o di post di Instagram .
Ingresso
conversationId
: ID della conversazione: ``.
instagramUrl
: Instagram URL da raschiare.
scrapeType
: Scegliere se raschiare i dettagli del profilo o i post. L'impostazione predefinita è post
.
maxItems
: (opzionale) Numero massimo di elementi da analizzare. Per impostazione predefinita, 1
.
Output
runId
: ID della corsa di scraping.
Scrape YouTube
Questa azione esegue lo scraping di video e cortometraggi di YouTube.
Ingresso
conversationId
: ID della conversazione: ``.
searchTerm
: (Facoltativo) Inserire un termine di ricerca come se fosse inserito nella barra di ricerca di YouTube.
youtubeUrl
: (Facoltativo) Inserire un link a un video, un canale, una playlist o una pagina di risultati di ricerca di YouTube. Si noti che l'immissione del termine di ricerca viene ignorata quando si utilizza questa opzione.
maxSearchResult
: (Opzionale) Limita il numero di video da scansionare. Se si esegue lo scraping di un canale, agisce come limite per i video regolari. L'impostazione predefinita è 5
.
maxShorts
: (Facoltativo) Limita il numero di video brevi che si desidera scansionare. L'impostazione predefinita è 0
.
Uscita
runId
: ID della corsa di scraping.
Eventi
Scraping Apify completato
Questo evento viene attivato quando un'attività di scraping di Apify viene completata.
Schema
conversationId
: ID della conversazione.
tipo
: Tipo di attività di scraping. Può essere utile per creare filtri sugli eventi
data
:
defaultDatasetId
: ID del dataset con i risultati dello scraping.
risultati
: Risultati dello scraping. La struttura dipende dallo scraping scelto. Vedere il video di presentazione per saperne di più
Alcuni esempi:
Testo del sito web : ``
Profilo di Instagram : ``
Youtube : ``
# Integrazione di Apify Web Scraping
Questa integrazione consente di eseguire operazioni di web scraping utilizzando Apify direttamente all'interno delle conversazioni del chatbot. È possibile scegliere di eseguire lo scraping di siti web, profili Instagram o video e cortometraggi di YouTube.
Video esplicativo:
## Configurazione
- `apiKey`: La chiave API di Apify.
## Azioni
### Raschiamento del sito web
Questa azione esegue lo scrape di un sito web o di una pagina utilizzando Apify.
#### Ingresso
- `conversationId`: ID della conversazione: ``.
- `startUrls`: Array di URL da cui avviare il crawling. Uno o più URL di pagine da cui iniziare il crawling. Per impostazione predefinita, l'Attore effettuerà il crawling anche delle sottopagine di questi URL. Ad esempio, per l'URL di partenza `https://example.com/blog`, verrà effettuato il crawling anche di `https://example.com/blog/post` o `https://example.com/blog/article`. L'opzione Includi URL (globi) annulla questo comportamento di automazione.
- `useSitemaps`: (Opzionale) Se utilizzare le sitemap per il crawling. L'impostazione predefinita è `false`.
- `crawlerType`: (Opzionale) Tipo di crawler da usare. L'impostazione predefinita è `playwright:adaptive`.
#### Uscita
- `runId`: ID dell'esecuzione di scraping.
### Scrape Instagram
Questa azione esegue lo scraping di un profilo o di post di Instagram .
#### Ingresso
- `conversationId`: ID della conversazione: ``.
- `instagramUrl`: Instagram URL da raschiare.
- `scrapeType`: Scegliere se raschiare i dettagli del profilo o i post. L'impostazione predefinita è `post`.
- `maxItems`: (opzionale) Numero massimo di elementi da analizzare. Per impostazione predefinita, `1`.
#### Output
- `runId`: ID della corsa di scraping.
### Scrape YouTube
Questa azione esegue lo scraping di video e cortometraggi di YouTube.
#### Ingresso
- `conversationId`: ID della conversazione: ``.
- `searchTerm`: (Facoltativo) Inserire un termine di ricerca come se fosse inserito nella barra di ricerca di YouTube.
- `youtubeUrl`: (Facoltativo) Inserire un link a un video, un canale, una playlist o una pagina di risultati di ricerca di YouTube. Si noti che l'immissione del termine di ricerca viene ignorata quando si utilizza questa opzione.
- `maxSearchResult`: (Opzionale) Limita il numero di video da scansionare. Se si esegue lo scraping di un canale, agisce come limite per i video regolari. L'impostazione predefinita è `5`.
- `maxShorts`: (Facoltativo) Limita il numero di video brevi che si desidera scansionare. L'impostazione predefinita è `0`.
#### Uscita
- `runId`: ID della corsa di scraping.
## Eventi
### Scraping Apify completato
Questo evento viene attivato quando un'attività di scraping di Apify viene completata.
#### Schema
- `conversationId`: ID della conversazione.
- `tipo`: Tipo di attività di scraping. Può essere utile per creare filtri sugli eventi
- `data`:
- `defaultDatasetId`: ID del dataset con i risultati dello scraping.
- `risultati`: Risultati dello scraping. La struttura dipende dallo scraping scelto. Vedere il video di presentazione per saperne di più
- Alcuni esempi:
- Testo del sito web : ``
- Profilo di Instagram : ``
- Youtube : ``