- เครือข่ายประสาทลึก (DNN) เป็นระบบการเรียนรู้ของเครื่องจักรที่ประกอบด้วยชั้นของโหนดที่เชื่อมต่อกันซึ่งเรียนรู้รูปแบบในข้อมูลเพื่อทำการคาดการณ์
- DNN สามารถปรับการเชื่อมต่อภายในโดยอิงจากข้อผิดพลาดในอดีต และปรับปรุงความแม่นยำในระยะยาวผ่านการแพร่กระจายย้อนกลับ
- ความก้าวหน้าในการประมวลผลและการเข้าถึงชุดข้อมูลขนาดใหญ่ทำให้ DNN ใช้งานได้จริงสำหรับงานที่เกี่ยวข้องกับข้อมูลที่ไม่มีโครงสร้าง เช่น ข้อความ รูปภาพ และเสียง
- DNN ทำหน้าที่เป็น "กล่องดำ" ซึ่งมักไม่ชัดเจนว่าได้มาถึงการตัดสินใจได้อย่างไร
โครงข่ายประสาทเทียมลึกคืออะไร?
เครือข่ายประสาทลึก (DNN) คือรูปแบบการเรียนรู้ของเครื่องจักรชนิดหนึ่งที่เลียนแบบวิธีการประมวลผลข้อมูลของสมองมนุษย์ ซึ่งแตกต่างจากอัลกอริทึมดั้งเดิมที่ปฏิบัติตามกฎที่กำหนดไว้ล่วงหน้า DNN สามารถเรียนรู้รูปแบบจากข้อมูลและทำนายจากประสบการณ์ก่อนหน้าได้ เช่นเดียวกับเรา
DNN เป็นรากฐานของการเรียนรู้เชิงลึกที่ขับเคลื่อนแอปพลิเคชันต่างๆ เช่น ตัวแทน AI การจดจำภาพ ผู้ช่วยเสียง และ แชทบอท AI
ตลาด AI ทั่วโลก ซึ่งรวมถึงแอปพลิเคชันที่ขับเคลื่อนโดยเครือข่ายประสาทลึก จะ มีมูลค่าเกิน 500,000 ล้านดอลลาร์ภายในปี 2027
สถาปัตยกรรมโครงข่ายประสาทเทียมคืออะไร?
“ความลึก” ใน DNN หมายถึงการที่มีเลเยอร์ที่ซ่อนอยู่หลายเลเยอร์ ซึ่งช่วยให้เครือข่ายสามารถจดจำรูปแบบที่ซับซ้อนได้
เครือข่ายประสาทประกอบด้วยโหนดหลายชั้นที่รับอินพุตจากชั้นอื่นและสร้างเอาต์พุตจนกว่าจะถึงผลลัพธ์สุดท้าย
เครือข่ายประสาทประกอบด้วยชั้นของโหนด (นิวรอน) แต่ละโหนดจะรับอินพุต ประมวลผล และส่งต่อไปยังชั้นถัดไป
- ชั้นอินพุต : ชั้นแรกที่รับข้อมูลดิบ (เช่น รูปภาพ ข้อความ)
- เลเยอร์ที่ซ่อนอยู่ : เลเยอร์ระหว่างอินพุตและเอาต์พุตที่แปลงข้อมูลและตรวจจับรูปแบบ
- ชั้นเอาท์พุต : ผลิตคำทำนายขั้นสุดท้าย
เครือข่ายประสาทเทียมสามารถมีเลเยอร์ที่ซ่อนอยู่ได้หลายเลเยอร์ ยิ่งมีเลเยอร์ของโหนดในเครือข่ายมากเท่าไร ความซับซ้อนก็จะยิ่งมากขึ้นเท่านั้น เครือข่ายประสาทเทียมแบบดั้งเดิม มักประกอบด้วยเลเยอร์ที่ซ่อนอยู่ 2 หรือ 3 เลเยอร์ ในขณะที่ เครือข่ายการเรียนรู้เชิงลึก สามารถมีเลเยอร์ที่ซ่อนอยู่ได้มากถึง 150 เลเยอร์
เครือข่ายประสาทแตกต่างจากเครือข่ายประสาทลึกอย่างไร?

โดยย่อ: เครือข่ายประสาทที่ไปไกลกว่าข้อมูลอินพุตและสามารถเรียนรู้จากประสบการณ์ก่อนหน้าจะกลายเป็นเครือข่ายประสาทที่ลึก
เครือข่ายประสาทเทียมจะปฏิบัติตามกฎที่ตั้งโปรแกรมไว้เพื่อตัดสินใจโดยอิงจากข้อมูลอินพุต ตัวอย่างเช่น ในเกมหมากรุก เครือข่ายประสาทเทียมสามารถแนะนำการเคลื่อนไหวโดยอิงจากกลวิธีและกลยุทธ์ที่ตั้งไว้ล่วงหน้า แต่จำกัดเฉพาะสิ่งที่โปรแกรมเมอร์จัดเตรียมไว้เท่านั้น
แต่เครือข่ายประสาทเทียมเชิงลึกจะก้าวไปไกลกว่านั้นด้วยการเรียนรู้จากประสบการณ์ แทนที่จะพึ่งพาเฉพาะกฎที่ตั้งไว้ล่วงหน้า DNN สามารถปรับการตัดสินใจตามรูปแบบที่จดจำในชุดข้อมูลขนาดใหญ่ได้
ตัวอย่าง
ลองนึกภาพการเขียนโปรแกรมเพื่อจดจำสุนัขในภาพถ่าย เครือข่ายประสาทเทียมแบบดั้งเดิมจะต้องมีกฎเกณฑ์ที่ชัดเจนในการระบุคุณลักษณะต่างๆ เช่น ขนหรือหาง ในทางกลับกัน DNN จะเรียนรู้จากรูปภาพที่มีป้ายกำกับหลายพันภาพและปรับปรุงความแม่นยำเมื่อเวลาผ่านไป โดยสามารถจัดการแม้แต่กรณีที่ยากได้โดยไม่ต้องใช้การเขียนโปรแกรมเพิ่มเติม
เครือข่ายประสาทเทียมแบบลึกทำงานอย่างไร?
ประการแรก นิวรอนแต่ละนิวรอนในเลเยอร์อินพุตจะรับข้อมูลดิบ เช่น พิกเซลจากรูปภาพหรือคำจากประโยค และกำหนดน้ำหนักให้กับอินพุตนี้ โดยระบุว่าข้อมูลนั้นเกี่ยวข้องกับงานมากเพียงใด
น้ำหนักที่ต่ำ (น้อยกว่า 0.5) หมายความว่าข้อมูลดังกล่าวมีความเกี่ยวข้องน้อยลง อินพุตที่มีน้ำหนักเหล่านี้จะถูกส่งผ่านเลเยอร์ที่ซ่อนอยู่ ซึ่งนิวรอนจะปรับข้อมูลต่อไป การดำเนินการนี้จะดำเนินต่อไปในหลายเลเยอร์จนกระทั่งเลเยอร์เอาต์พุตส่งการคาดการณ์ขั้นสุดท้าย
เครือข่ายประสาทลึกรู้ได้อย่างไรว่ามันถูกต้องหรือไม่?
เครือข่ายประสาทเทียมเชิงลึกจะทราบว่าข้อมูลนั้นถูกต้องหรือไม่โดยการเปรียบเทียบข้อมูลทำนายกับข้อมูลที่มีป้ายกำกับระหว่างการฝึก สำหรับแต่ละอินพุต เครือข่ายจะตรวจสอบว่าข้อมูลทำนายตรงกับผลลัพธ์จริงหรือไม่ หากข้อมูลทำนายผิด เครือข่ายจะคำนวณข้อผิดพลาดโดยใช้ฟังก์ชันการสูญเสีย ซึ่งวัดว่าข้อมูลทำนายนั้นคลาดเคลื่อนจากข้อมูลทำนายมากเพียงใด
จากนั้นเครือข่ายจะใช้ การแบ็กโพรพาเกชั่น เพื่อปรับน้ำหนักของนิวรอนที่ส่งผลต่อข้อผิดพลาด กระบวนการนี้จะทำซ้ำในแต่ละรอบ
โครงข่ายประสาทเทียมประเภทต่าง ๆ มีอะไรบ้าง?
โครงข่ายประสาทเทียมส่วนลึกจะดีขึ้นอย่างไรเมื่อเวลาผ่านไป?
เครือข่ายประสาทเทียมเชิงลึกจะปรับปรุงตัวเองเมื่อเวลาผ่านไปโดยเรียนรู้จากข้อผิดพลาด เมื่อทำการคาดการณ์ เช่น ระบุปัญหาของลูกค้าหรือแนะนำผลิตภัณฑ์ ระบบจะตรวจสอบว่าการคาดการณ์นั้นถูกต้องหรือไม่ หากไม่ถูกต้อง ระบบจะปรับตัวเองเพื่อปรับปรุงในครั้งต่อไป
ตัวอย่างเช่น ในด้านการสนับสนุนลูกค้า DNN อาจทำนายวิธีแก้ไขปัญหา หากการทำนายผิดพลาด DNN จะเรียนรู้จากข้อผิดพลาดนั้นและจะเก่งขึ้นในการแก้ไขปัญหาที่คล้ายกันในอนาคต ในด้านการขาย DNN สามารถเรียนรู้ว่าลูกค้าเป้าหมายรายใดจะแปลงเป็นลูกค้าได้ดีที่สุดโดยวิเคราะห์ข้อตกลงที่ผ่านมา และปรับปรุงคำแนะนำในช่วงเวลาหนึ่ง
ดังนั้นการโต้ตอบแต่ละครั้งจะทำให้ DNN แม่นยำและเชื่อถือได้มากขึ้น
เครือข่ายประสาทลึกคิดต่างจากมนุษย์หรือไม่?
อย่างไรก็ตาม โมเดลการเรียนรู้เชิงลึกมักทำหน้าที่เป็น "กล่องดำ" ซึ่งหมายความว่ามนุษย์ไม่สามารถตีความได้อย่างง่ายดายว่าตนเองตัดสินใจอย่างไร Cynthia Rudin นักวิจัยด้าน AI จาก Duke University อธิบายว่า ความสามารถในการตีความเป็นสิ่งสำคัญสำหรับการใช้งานระบบ AI อย่างมีจริยธรรม โดยเฉพาะอย่างยิ่งในสภาพแวดล้อมที่มีความเสี่ยงสูง
นักวิจัยพยายามสร้างภาพให้เห็นถึงวิธีที่เครือข่ายประมวลผลภาพ แต่สำหรับงานที่ซับซ้อนกว่า เช่น ภาษาหรือการทำนายทางการเงิน ตรรกะยังคงซ่อนอยู่ แม้ว่าอัลกอริทึมเหล่านี้จะดูเหมือนใหม่ แต่หลายอัลกอริทึมได้รับการพัฒนามานานหลายสิบปีแล้ว ความก้าวหน้าด้านข้อมูลและพลังการประมวลผลเป็นสิ่งที่ทำให้อัลกอริทึมเหล่านี้ใช้งานได้จริงในปัจจุบัน
เหตุใดเครือข่ายประสาทลึกจึงได้รับความนิยมเพิ่มมากขึ้น?
1. การปรับปรุงพลังการประมวลผล
สาเหตุหลักประการหนึ่งที่ทำให้ DNN มีจำนวนเพิ่มขึ้นก็คือพลังการประมวลผลที่เร็วขึ้นและถูกกว่า พลังการประมวลผลทำให้การบรรจบกันรวดเร็วขึ้น “การเพิ่มขึ้นของฮาร์ดแวร์เฉพาะทาง เช่น หน่วยประมวลผลกราฟิก (GPU) และหน่วยประมวลผลเทนเซอร์ (TPU) ทำให้การฝึกเครือข่ายที่มีพารามิเตอร์นับพันล้านเป็นไปได้”
2. เพิ่มความพร้อมใช้งานของชุดข้อมูล
ปัจจัยสำคัญอีกประการหนึ่งคือความพร้อมใช้งานของชุดข้อมูลขนาดใหญ่ ซึ่งเครือข่ายประสาทเทียมเชิงลึกจำเป็นต้องมีเพื่อเรียนรู้ได้อย่างมีประสิทธิภาพ เมื่อธุรกิจสร้างข้อมูลมากขึ้น DNN จะสามารถเปิดเผยรูปแบบที่ซับซ้อนซึ่งโมเดลดั้งเดิมไม่สามารถจัดการได้
3. การปรับปรุงการประมวลผลข้อมูลที่ไม่มีโครงสร้าง
ความสามารถในการประมวลผลข้อมูลที่ไม่มีโครงสร้าง เช่น ข้อความ รูปภาพ และเสียง ยังได้เปิดการใช้งานใหม่ๆ ในด้านต่างๆ เช่น แชทบอท ระบบคำแนะนำ และการวิเคราะห์เชิงคาดการณ์
โครงข่ายประสาทเทียมสามารถทํางานกับข้อมูลที่ไม่มีโครงสร้างได้หรือไม่?
ใช่ เครือข่ายประสาทสามารถทำงานกับข้อมูลที่ไม่มีโครงสร้างได้ และนี่คือจุดแข็งที่ใหญ่ที่สุดประการหนึ่งของมัน
เครือข่ายประสาทเทียมที่ทำงานกับข้อมูลที่ไม่มีโครงสร้างเรียกว่า การเรียนรู้แบบไม่มีผู้ดูแล นี่คือเป้าหมายสูงสุดของการเรียนรู้ของเครื่องจักรและคล้ายคลึงกับวิธีการเรียนรู้ของมนุษย์
อัลกอริธึมการเรียนรู้ของเครื่องแบบดั้งเดิมนั้นประสบปัญหาในการประมวลผลข้อมูลที่ไม่มีโครงสร้าง เนื่องจากต้องใช้การออกแบบคุณลักษณะ ซึ่งก็คือการเลือกและแยกคุณลักษณะที่เกี่ยวข้องด้วยตนเอง ในทางกลับกัน เครือข่ายประสาทเทียมสามารถเรียนรู้รูปแบบในข้อมูลดิบได้โดยอัตโนมัติโดยไม่ต้องมีการแทรกแซงด้วยมือมากนัก
โครงข่ายประสาทเทียมเชิงลึกใช้การฝึกอบรมเพื่อเรียนรู้อย่างไร
เครือข่ายประสาทเทียมเชิงลึกเรียนรู้โดยการทำนายและเปรียบเทียบกับผลลัพธ์ที่ถูกต้อง ตัวอย่างเช่น เมื่อประมวลผลภาพถ่าย เครือข่ายประสาทเทียมจะทำนายว่าภาพมีสุนัขหรือไม่ และติดตามว่าภาพนั้นตอบคำถามได้ถูกต้องบ่อยเพียงใด
เครือข่ายจะคำนวณความแม่นยำโดยตรวจสอบเปอร์เซ็นต์ของการคาดการณ์ที่ถูกต้อง และใช้ข้อเสนอแนะนี้เพื่อปรับปรุง โดยจะปรับน้ำหนักของนิวรอนและดำเนินการซ้ำอีกครั้ง หากความแม่นยำดีขึ้น ก็จะคงน้ำหนักใหม่ไว้ หากไม่ดีขึ้น ก็จะลองปรับค่าอื่นๆ
วงจรนี้จะทำซ้ำหลายครั้งจนกระทั่งเครือข่ายสามารถจดจำรูปแบบและทำนายได้อย่างแม่นยำ เมื่อถึงจุดนี้ เครือข่ายจะบรรจบกันและผ่านการฝึกสำเร็จ
ประหยัดเวลาการเขียนโค้ดด้วยผลลัพธ์ที่ดีกว่า
โครงข่ายประสาทเทียมได้รับการตั้งชื่อเช่นนี้เนื่องจากมีความคล้ายคลึงกันระหว่างวิธีการเขียนโปรแกรมนี้กับวิธีการทํางานของสมอง
เช่นเดียวกับสมองอัลกอริทึมโครงข่ายประสาทใช้เครือข่ายของเซลล์ประสาทหรือโหนด เซลล์ประสาทเหล่านี้เป็นหน้าที่ที่ไม่ต่อเนื่อง (หรือเครื่องจักรเล็ก ๆ ถ้าคุณต้องการ) ที่รับอินพุตและสร้างเอาต์พุต โหนดเหล่านี้ถูกจัดเรียงเป็นชั้นโดยเอาต์พุตของเซลล์ประสาทในชั้นหนึ่งจะกลายเป็นอินพุตไปยังเซลล์ประสาทในชั้นถัดไปจนกว่าเซลล์ประสาทในชั้นนอกของเครือข่ายจะสร้างผลลัพธ์สุดท้าย
ดังนั้นจึงมีชั้นของเซลล์ประสาทโดยเซลล์ประสาทแต่ละเซลล์ได้รับอินพุตที่ จํากัด มากและสร้างเอาต์พุตที่ จํากัด มากเช่นเดียวกับในสมอง ชั้นแรก (หรือชั้นอินพุต) ของเซลล์ประสาทรับอินพุตและชั้นสุดท้ายของเซลล์ประสาท (หรือชั้นเอาต์พุต) ในเครือข่ายจะส่งออกผลลัพธ์
ถูกต้องหรือไม่ที่จะเรียกอัลกอริทึมประเภทนี้ว่า "โครงข่ายประสาทเทียม"?
การเรียกอัลกอริทึมนี้ว่า "เครือข่ายประสาทลึก" ได้รับการพิสูจน์แล้วว่าเป็นการสร้างแบรนด์ที่มีประสิทธิภาพ แม้ว่าอาจตั้งความคาดหวังที่สูงเกินไปก็ตาม แม้ว่าจะทรงพลัง แต่โมเดลเหล่านี้ก็ยังเรียบง่ายกว่าความซับซ้อนของสมองมนุษย์มาก อย่างไรก็ตาม นักวิจัยยังคงสำรวจสถาปัตยกรรมประสาทที่มุ่งเป้าไปที่สติปัญญาแบบทั่วไปที่คล้ายกับมนุษย์ต่อไป
กล่าวได้ว่ามีผู้คนจำนวนมากที่พยายามออกแบบสมองใหม่โดยใช้เครือข่ายประสาทที่ซับซ้อนมาก โดยหวังว่าการทำเช่นนี้จะช่วยให้พวกเขาสามารถจำลองความฉลาดแบบมนุษย์ทั่วไปในการพัฒนาหุ่นยนต์ได้ แล้วเครือข่ายประสาทและเทคนิคการเรียนรู้ของเครื่องจักรจะช่วยเราแก้ปัญหาการจดจำสุนัขได้อย่างไร
แทนที่จะกําหนดคุณลักษณะที่เหมือนสุนัขด้วยตนเองอัลกอริทึมโครงข่ายประสาทเทียมเชิงลึกสามารถระบุคุณลักษณะที่สําคัญและจัดการกับกรณีพิเศษทั้งหมดโดยไม่ต้องเขียนโปรแกรม
คำถามที่พบบ่อย
1. การฝึกเครือข่ายประสาทเทียมเชิงลึกต้องใช้เวลานานเท่าใด
ขึ้นอยู่กับขนาดของข้อมูลและความซับซ้อนของโมเดลของคุณ ซึ่งอาจใช้เวลาตั้งแต่ไม่กี่นาทีไปจนถึงหลายวัน โมเดลขนาดใหญ่ที่มีเลเยอร์จำนวนมาก (และมีข้อมูลมากกว่า) มักจะต้องใช้เวลาและพลังการประมวลผลที่มากขึ้น
2. ฉันสามารถฝึก DNN บนคอมพิวเตอร์ส่วนตัวของฉันได้หรือไม่
แน่นอน ตราบใดที่โมเดลไม่ใหญ่เกินไป สำหรับชุดข้อมูลขนาดเล็กและเครือข่ายที่เรียบง่ายกว่า แล็ปท็อปของคุณสามารถรองรับได้ แต่สำหรับงานหนัก GPU หรือโซลูชันบนคลาวด์จะสร้างความแตกต่างอย่างมาก
3. ความแตกต่างระหว่าง DNN ที่ใช้ในวิสัยทัศน์คอมพิวเตอร์และที่ใช้ในการประมวลผลภาษาธรรมชาติคืออะไร
DNN สำหรับคอมพิวเตอร์วิชันมักใช้เลเยอร์คอนโวลูชันเพื่อวิเคราะห์ภาพ ในขณะที่โมเดล NLP อาศัยสถาปัตยกรรมอย่างทรานส์ฟอร์เมอร์หรือ RNN เพื่อจัดการโครงสร้างและความหมายของข้อความ แนวคิดการเรียนรู้เชิงลึกเหมือนกัน เพียงแต่เครื่องมือที่แตกต่างกันสำหรับข้อมูลประเภทต่างๆ
4. คุณจะเลือกจำนวนเลเยอร์ที่ซ่อนอยู่ใน DNN ได้อย่างไร
ต้องลองผิดลองถูกสักหน่อย เลเยอร์ที่มากขึ้นอาจบันทึกรูปแบบที่ซับซ้อนได้มากขึ้น แต่หากเลเยอร์มากเกินไปอาจทำให้เกิดการโอเวอร์ฟิตติ้งหรือใช้เวลานานขึ้น เริ่มจากน้อยๆ ทดสอบบ่อยๆ แล้วค่อยๆ ปรับไปทีละขั้น
5. คาดว่าการวิจัยเครือข่ายประสาทลึกจะมีความก้าวหน้าครั้งใหญ่ครั้งต่อไปอะไรบ้าง?
ผู้คนต่างให้ความสนใจเกี่ยวกับโมเดลที่มีประสิทธิภาพมากขึ้น (เช่น เครือข่ายแบบเบาบาง) ความสามารถในการตีความที่ดีขึ้น (เพื่อให้เราทราบ ว่าเหตุใด โมเดลจึงตัดสินใจ) และระบบที่ได้รับแรงบันดาลใจจากสมองซึ่งอาจทำให้เราเข้าใกล้ AI ที่เหมือนมนุษย์มากขึ้น