Apify Web Kazıma

v2.0.2
François tarafından korunuyor

# Apify Web Kazıma Entegrasyonu

Bu entegrasyon, Apify'ı kullanarak web kazıma görevlerini doğrudan sohbet robotu konuşmalarınızda gerçekleştirmenize olanak tanır. Web sitelerini, Instagram profillerini veya YouTube videolarını ve kısa filmleri kazımayı seçebilirsiniz. Açıklama Videosu :

Konfigürasyon

  • apiKey: Apify API anahtarınız.

Eylemler

Web Sitesini Kazıyın

Bu eylem, Apify kullanarak bir web sitesini veya sayfayı kazır.

Giriş
  • conversationId: Görüşmenin kimliği: ``.
  • startUrls: Taramaya başlamak için URL dizisi. Tarayıcının başlayacağı sayfaların bir veya daha fazla URL'si. Varsayılan olarak, Aktör bu URL'lerin alt sayfalarını da tarayacaktır. Örneğin, https://example.com/blog başlangıç URL'si için https://example.com/blog/post veya https://example.com/blog/article de taranacaktır. URL'leri Dahil Et (globlar) seçeneği bu otomasyon davranışını geçersiz kılar.
  • useSitemaps: (İsteğe bağlı) Tarama için site haritalarının kullanılıp kullanılmayacağı. Varsayılan değerfalse`.
  • crawlerType: (İsteğe bağlı) Kullanılacak tarayıcı türü. Varsayılan değer playwright:adaptive.
Çıkış
  • runId: Kazıma çalışmasının kimliği.

Kazıyın Instagram

Bu eylem bir Instagram profilini veya gönderilerini kazır.

Giriş
  • conversationId: Konuşmanın kimliği: ``.
  • instagramUrl: Instagram Kazınacak URL.
  • scrapeType: Profil ayrıntılarını veya gönderileri kazımayı seçin. Varsayılan değer posts.
  • maxItems: (İsteğe bağlı) Kazınacak maksimum öğe sayısı. Varsayılan değer1`dir.
Çıkış
  • runId: Kazıma çalışmasının kimliği.

YouTube'u kazıyın

Bu işlem YouTube videolarını ve kısa filmleri kazır.

Giriş
  • conversationId: Konuşmanın kimliği: ``.
  • searchTerm: (İsteğe bağlı) YouTube'un arama çubuğuna girdiğiniz gibi bir arama terimi girin.
  • youtubeUrl: (İsteğe bağlı) Bir YouTube videosuna, kanalına, oynatma listesine veya arama sonuçları sayfasına bir bağlantı girin. Bu seçenek kullanılırken Arama terimi girdisinin göz ardı edileceğini unutmayın.
  • maxSearchResult: (İsteğe bağlı) Taramak istediğiniz video sayısını sınırlayın. Bir kanalı kazırsanız, normal videolar için bir sınır görevi görür. Varsayılan değer 5tir.
  • maxShorts: (İsteğe bağlı) Taramak istediğiniz Shorts videolarının sayısını sınırlayın. Varsayılan değer 0dır.
Çıkış
  • runId: Kazıma çalışmasının kimliği.

Olaylar

Apify Kazıma Tamamlandı

Bu olay, bir Apify kazıma görevi tamamlandığında tetiklenir.

Şema
  • conversationId: Konuşmanın kimliği.

  • type: Kazıma görevinin türü. Olaylar üzerinde filtre oluşturmak için yararlı olabilir

  • data:

  • defaultDatasetId: Kazıma sonuçlarını içeren veri kümesinin kimliği.

  • results: Kazıma sonuçları. Yapı, seçilen kazıma işlemine bağlıdır. Daha fazla bilgi edinmek için sunum videosuna bakın

  • Bazı örnekler :

  • Web sitesi metni : ``

  • Instagram profil : ``

  • Youtube : ``