Apify 網頁抓取整合

  # Apify 網頁抓取整合 此整合可讓您直接在聊天機器人對話中使用 Apify 執行網頁抓取任務。您可以選擇抓取網站， Instagram 個人資料，或 YouTube 影片和短片。說明影片：## 設定 - `apiKey`：您的 Apify API 金鑰。 ## 動作 ### 抓取網站 此動作使用 Apify 抓取網站或頁面。 #### 輸入 - `conversationId`：對話 ID：``。 - `startUrls`：開始抓取的 URL 陣列。爬網程式將啟動的頁面的一個或多個 URL。預設情況下，Actor 也會抓取這些 URL 的子頁面。例如，對於起始URL `https://example.com/blog`，它也會抓取`https://example.com/blog/post` 或`https://example.com/blog/article` 。包含 URL（全域）選項會覆寫此自動化行為。 - `useSitemaps`：（可選）是否使用網站地圖進行爬行。預設為“假”。 - `crawlerType`：（可選）要使用的爬蟲類型。預設為「劇作家：自適應」。 #### 輸出 - `runId`：抓取執行的 ID。 ### 刮擦Instagram
這個動作刮掉了Instagram 個人資料或貼文。 #### 輸入 - `conversationId`：對話 ID：``。 - `instagramUrl`： Instagram 要抓取的 URL。 - `scrapeType`：選擇抓取個人資料詳細資料或貼文。預設為“帖子”。 - `maxItems`：（可選）要抓取的最大項目數。預設為“1”。 #### 輸出 - `runId`：抓取執行的 ID。 ### 抓取 YouTube 此動作會抓取 YouTube 影片和短片。 #### 輸入 - `conversationId`：對話 ID：``。 - `searchTerm`：（可選）輸入搜尋字詞，就像在 YouTube 搜尋欄中輸入一樣。 - `youtubeUrl`：（選購）輸入 YouTube 影片、頻道、播放清單或搜尋結果頁面的連結。請注意，使用此選項時，來自搜尋字詞的輸入將被忽略。 - `maxSearchResult`：（可選）限制您要抓取的影片數量。如果您抓取頻道，則會作為常規影片的限制。預設為“5”。 - `maxShorts`：（可選）限制您要抓取的 Shorts 影片數量。預設為“0”。 #### 輸出 - `runId`：抓取執行的 ID。 ## 事件 ### Apify 抓取完成 當 Apify 抓取任務完成時會觸發此事件。 #### 架構 - `conversationId`：對話的 ID。 - `type`：抓取任務的類型。對於建立事件過濾器非常有用 - `data`: - `defaultDatasetId`：包含抓取結果的資料集的 ID。 - `結果`：抓取結果。結構取決於所選的刮削。請觀看示範影片以了解更多資訊 - 一些範例： - 網站文字：`` - Instagram 個人資料：``-Youtube：``
Apify 網頁抓取

構建得更好 Botpress