# การบูรณาการการขูดเว็บ Apify การบูรณาการนี้ช่วยให้คุณสามารถดำเนินการขูดเว็บโดยใช้ Apify โดยตรงภายในการสนทนาของแชทบอทของคุณ คุณสามารถเลือกที่จะขูดเว็บไซต์ Instagram โปรไฟล์ หรือวิดีโอและคลิปสั้นใน YouTube คำอธิบาย วิดีโอ: ## การกำหนดค่า - `apiKey`: คีย์ API ของ Apify ของคุณ ## การดำเนินการ ### ขูดเว็บไซต์ การดำเนินการนี้จะขูดเว็บไซต์หรือเพจโดยใช้ Apify #### อินพุต - `conversationId`: ID ของการสนทนา: `` - `startUrls`: อาร์เรย์ของ URL ที่จะเริ่มรวบรวมข้อมูลจาก URL หนึ่งรายการขึ้นไปของเพจที่โปรแกรมรวบรวมข้อมูลจะเริ่มต้น โดยค่าเริ่มต้น ตัวแสดงจะรวบรวมข้อมูลเพจย่อยของ URL เหล่านี้ด้วย ตัวอย่างเช่น สำหรับ URL เริ่มต้น `https://example.com/blog` โปรแกรมจะรวบรวมข้อมูล `https://example.com/blog/post` หรือ `https://example.com/blog/article` ด้วยเช่นกัน ตัวเลือก รวม URL (globs) จะแทนที่พฤติกรรมการทำงานอัตโนมัตินี้ - `useSitemaps`: (ทางเลือก) ว่าจะใช้แผนผังเว็บไซต์ในการรวบรวมข้อมูลหรือไม่ ค่าเริ่มต้นคือ `false` - `crawlerType`: (ตัวเลือก) ประเภทของโปรแกรมรวบรวมข้อมูลที่จะใช้ ค่าเริ่มต้นคือ `playwright:adaptive` #### ผลลัพธ์ - `runId`: ID ของการสแกน ### การสแกน Instagram การกระทำนี้ขูด Instagram โปรไฟล์หรือโพสต์ #### อินพุต - `conversationId`: ID ของการสนทนา: ``. - `instagramUrl`: Instagram URL ที่จะขูด - `scrapeType`: เลือกระหว่างการขูดรายละเอียดโปรไฟล์หรือโพสต์ ค่าเริ่มต้นคือ `posts` - `maxItems`: (ไม่บังคับ) จำนวนสูงสุดของรายการที่จะขูด ค่าเริ่มต้นคือ `1` #### ผลลัพธ์ - `runId`: ID ของการขูด ### ขูด YouTube การดำเนินการนี้จะขูดวิดีโอและภาพยนตร์สั้นของ YouTube #### อินพุต - `conversationId`: ID ของการสนทนา: `` - `searchTerm`: (ไม่บังคับ) ป้อนคำค้นหาเช่นเดียวกับที่คุณป้อนในแถบค้นหาของ YouTube - `youtubeUrl`: (ไม่บังคับ) ป้อนลิงก์ไปยังวิดีโอ YouTube ช่อง เพลย์ลิสต์ หรือหน้าผลการค้นหา โปรดทราบว่าคำที่ป้อนจากคำค้นหาจะถูกละเว้นเมื่อใช้ตัวเลือกนี้ - `maxSearchResult`: (ไม่บังคับ) จำกัดจำนวนวิดีโอที่คุณต้องการรวบรวม หากคุณขูดช่อง จะทำหน้าที่เป็นขีดจำกัดสำหรับวิดีโอทั่วไป ค่าเริ่มต้นคือ `5` - `maxShorts`: (ทางเลือก) จำกัดจำนวนวิดีโอสั้นที่คุณต้องการรวบรวม ค่าเริ่มต้นคือ `0` #### ผลลัพธ์ - `runId`: ID ของการเรียกใช้การขูดข้อมูล ## เหตุการณ์ ### การขูดข้อมูล Apify เสร็จสมบูรณ์ เหตุการณ์นี้จะถูกเรียกใช้เมื่องานการขูดข้อมูล Apify เสร็จสมบูรณ์ #### สคีมา - `conversationId`: ID ของการสนทนา - `type`: ประเภทของงานการขูดข้อมูล อาจมีประโยชน์ในการสร้างตัวกรองสำหรับเหตุการณ์ - `data`: - `defaultDatasetId`: ID ของชุดข้อมูลพร้อมผลลัพธ์การขูดข้อมูล - `results`: ผลลัพธ์การขูดข้อมูล โครงสร้างขึ้นอยู่กับการขูดข้อมูลที่เลือก ดูวิดีโอการนำเสนอเพื่อดูข้อมูลเพิ่มเติม - ตัวอย่างบางส่วน: - ข้อความเว็บไซต์: `` - Instagram โปรไฟล์ : `` - Youtube : ``