# Apify 網頁抓取整合 此整合可讓您直接在聊天機器人對話中使用 Apify 執行網頁抓取任務。您可以選擇抓取網站, Instagram 個人資料,或 YouTube 影片和短片。說明影片:## 設定 - `apiKey`:您的 Apify API 金鑰。 ## 動作 ### 抓取網站 此動作使用 Apify 抓取網站或頁面。 #### 輸入 - `conversationId`:對話 ID:``。 - `startUrls`:開始抓取的 URL 陣列。爬網程式將啟動的頁面的一個或多個 URL。預設情況下,Actor 也會抓取這些 URL 的子頁面。例如,對於起始URL `https://example.com/blog`,它也會抓取`https://example.com/blog/post` 或`https://example.com/blog/article` 。包含 URL(全域)選項會覆寫此自動化行為。 - `useSitemaps`:(可選)是否使用網站地圖進行爬行。預設為“假”。 - `crawlerType`:(可選)要使用的爬蟲類型。預設為「劇作家:自適應」。 #### 輸出 - `runId`:抓取執行的 ID。 ### 刮擦Instagram 這個動作刮掉了Instagram 個人資料或貼文。 #### 輸入 - `conversationId`:對話 ID:``。 - `instagramUrl`: Instagram 要抓取的 URL。 - `scrapeType`:選擇抓取個人資料詳細資料或貼文。預設為“帖子”。 - `maxItems`:(可選)要抓取的最大項目數。預設為“1”。 #### 輸出 - `runId`:抓取執行的 ID。 ### 抓取 YouTube 此動作會抓取 YouTube 影片和短片。 #### 輸入 - `conversationId`:對話 ID:``。 - `searchTerm`:(可選)輸入搜尋字詞,就像在 YouTube 搜尋欄中輸入一樣。 - `youtubeUrl`:(選購)輸入 YouTube 影片、頻道、播放清單或搜尋結果頁面的連結。請注意,使用此選項時,來自搜尋字詞的輸入將被忽略。 - `maxSearchResult`:(可選)限制您要抓取的影片數量。如果您抓取頻道,則會作為常規影片的限制。預設為“5”。 - `maxShorts`:(可選)限制您要抓取的 Shorts 影片數量。預設為“0”。 #### 輸出 - `runId`:抓取執行的 ID。 ## 事件 ### Apify 抓取完成 當 Apify 抓取任務完成時會觸發此事件。 #### 架構 - `conversationId`:對話的 ID。 - `type`:抓取任務的類型。對於建立事件過濾器非常有用 - `data`: - `defaultDatasetId`:包含抓取結果的資料集的 ID。 - `結果`:抓取結果。結構取決於所選的刮削。請觀看示範影片以了解更多資訊 - 一些範例: - 網站文字:`` - Instagram 個人資料:``-Youtube:``