Rangkaian Saraf Dalam (DNN) adalah teknik pembelajaran mesin yang membolehkan komputer, dengan melatihnya, melakukan tugas yang sangat sukar dilakukan menggunakan teknik pengaturcaraan konvensional. Algoritma rangkaian saraf diilhamkan oleh otak manusia dan fungsinya: seperti minda manusia kita, ia direka untuk berfungsi bukan sahaja dengan mengikuti senarai peraturan yang telah ditetapkan, tetapi dengan meramalkan penyelesaian dan membuat kesimpulan berdasarkan lelaran dan pengalaman sebelumnya.
Apakah seni bina rangkaian saraf?
Rangkaian saraf terdiri daripada pelbagai lapisan nod yang menerima input daripada lapisan lain dan menghasilkan output sehingga hasil akhir dicapai. Rangkaian saraf boleh mempunyai beberapa lapisan tersembunyi: lebih banyak lapisan nod berada dalam rangkaian, semakin tinggi kerumitan. Berikut adalah seni bina rangkaian saraf yang berbeza:
- Rangkaian saraf tradisional, biasanya terdiri daripada 2 atau 3 lapisan tersembunyi;
- Rangkaian pembelajaran mendalam, yang boleh mempunyai sehingga 150 lapisan tersembunyi;
Apakah perbezaan antara rangkaian saraf dan rangkaian saraf dalam?
Rangkaian saraf yang mendalam adalah sistem yang lebih rumit daripada sistem saraf "mudah". Rangkaian saraf adalah setanding dengan permainan catur, dan berkelakuan mengikut algoritma: taktik yang berbeza akan dicadangkan mengikut pergerakan dan tindakan lawan. Rangkaian saraf ini akan terhad kepada input pengaturcara:
- Bagaimana kepingan catur bergerak;
- Saiz papan catur;
- Strategi yang berbeza untuk situasi yang berbeza;
Rangkaian saraf yang melampaui data input dan boleh belajar daripada pengalaman sebelumnya menjadi rangkaian saraf yang mendalam
Pada komputer yang sama, anda boleh, sebagai contoh, melatih rangkaian saraf, kemudian bermain dengannya terhadap orang lain dan biarkan ia belajar semasa ia dimainkan. Dari sana, jika rangkaian saraf boleh belajar dari pemain yang berbeza, ia mungkin menjadi sukar, atau benar-benar mustahil, untuk mengalahkan rangkaian saraf yang mendalam, walaupun untuk tuan catur.
Rangkaian saraf dalam boleh mengenali arahan suara, mengenal pasti suara, mengenali bunyi dan grafik dan melakukan lebih daripada rangkaian saraf. Rangkaian pembelajaran mendalam menggunakan "Big Data'' bersama-sama dengan algoritma untuk menyelesaikan masalah, dan rangkaian saraf yang mendalam ini dapat menyelesaikan masalah dengan input manusia yang terhad atau tidak.
Bagaimana untuk menggambarkan kerja rangkaian saraf yang mendalam?
Proses rangkaian saraf yang mendalam difahami dengan melihat contoh. Bayangkan anda mempunyai beratus-ratus ribu imej, beberapa daripadanya mempunyai anjing di dalamnya, dan anda memutuskan anda mahu menulis program komputer untuk mengenali anjing dalam gambar.
Anda mempunyai dua pilihan. Anda boleh menulis program untuk mengenal pasti anjing secara eksplisit, atau anda boleh menulis program yang "belajar" cara mengenal pasti anjing.
Anda tidak bijak memutuskan untuk cuba melakukan yang pertama.
Menggunakan teknik pengaturcaraan konvensional adalah panjang dan sukar, dan hasilnya tidak selalu tepat
Untuk mengenal pasti gambar anjing, anda mencipta program perisian menggunakan pernyataan "jika" dan "kemudian" di mana kemungkinan anda melihat anjing diprogramkan untuk meningkatkan setiap kali anda mengenal pasti atribut seperti anjing seperti bulu, telinga liut dan ekor. Walau bagaimanapun, sistem saraf jenis ini sukar di banyak peringkat:
Contohnya jika rumpun piksel menyerupai ekor meningkatkan kemungkinan anda melihat anjing. Rangkaian saraf dalam anda perlu mengenal pasti kumpulan piksel yang sesuai dengan atribut seperti anjing. Walaupun anda berjaya melakukannya, terdapat masalah untuk algoritma anda:
- Banyak objek yang difoto berkongsi beberapa sifat seperti anjing, terutamanya gambar haiwan yang serupa. Anda perlu menambah peraturan;
- Kadang-kadang sifat-sifat ada tetapi kabur. Algoritma anda tidak akan mengambilnya;
- Kadang-kadang atribut hanya penting apabila atribut lain hadir. Lebih banyak peraturan keputusan diperlukan;
Klasifikasi anda gagal. Anda menyedari bahawa anda tidak dapat mengenal pasti set atribut lengkap secara manual apatah lagi merangka semua peraturan yang diperlukan untuk menangani semua kes khas ini.
Anda dengan bijak berputus asa dan memutuskan untuk mencuba pendekatan yang terakhir. Untuk menggunakan rangkaian saraf atau, lebih baik lagi, rangkaian saraf yang mendalam.
Model pembelajaran yang mendalam dapat menjimatkan masa pengekodan dan menawarkan hasil yang lebih baik
Rangkaian saraf dinamakan begitu kerana terdapat persamaan antara pendekatan pengaturcaraan ini dan cara otak berfungsi.
Sama seperti otak, algoritma jaring saraf menggunakan rangkaian neuron atau nod. Dan seperti otak, neuron ini adalah fungsi diskret (atau mesin kecil jika anda suka) yang mengambil input dan menghasilkan output. Nod ini disusun dalam lapisan di mana output neuron dalam satu lapisan menjadi input kepada neuron dalam lapisan seterusnya sehingga neuron pada lapisan luar rangkaian menghasilkan hasil akhir.
Oleh itu, terdapat lapisan neuron dengan setiap neuron individu yang menerima input yang sangat terhad dan menghasilkan output yang sangat terhad seperti di dalam otak. Lapisan pertama (atau lapisan input) neuron mengambil input dan lapisan terakhir neuron (atau lapisan output) dalam rangkaian mengeluarkan hasilnya.
Adakah tepat untuk memanggil algoritma jenis ini sebagai "rangkaian saraf"?
Otak manusia jauh lebih kompleks dan berkuasa daripada rangkaian saraf tentu saja. Menamakan algoritma "rangkaian saraf mendalam" adalah rampasan kuasa penjenamaan tetapi ia mungkin mewujudkan jangkaan yang tidak realistik tentang apa yang boleh dicapai dengan teknik ini. Yang mengatakan ada orang yang cuba membuat semula otak, menggunakan rangkaian saraf yang sangat kompleks, dengan harapan bahawa dengan melakukan ini, mereka akan dapat meniru kecerdasan umum seperti manusia dalam pembangunan bot. Jadi bagaimanakah teknik pembelajaran neural dan mesin membantu kami dengan masalah pengecaman anjing kami?
Nah, bukannya menentukan atribut seperti anjing secara manual, algoritma rangkaian saraf yang mendalam dapat mengenal pasti atribut penting dan menangani semua kes khas tanpa pengaturcaraan.
Bagaimanakah fungsi rangkaian saraf yang mendalam?
Ia melakukan ini seperti berikut:
Setiap neuron pada lapisan input menerima sedikit maklumat daripada imej sebagai input dan kemudian berat secara rawak (antara sifar dan satu) sama ada maklumat itu mencadangkan anjing atau tidak. Berat badan yang rendah (kurang daripada 0.5) bermakna kemungkinan besar maklumat itu dikaitkan dengan anjing dan berat badan yang tinggi bermakna kemungkinan besar maklumat itu dikaitkan dengan anjing. Pendekatan rangkaian saraf multilayer ini dipanggil pembelajaran mendalam. Rangkaian saraf dan pembelajaran mendalam adalah teknik yang sangat kuat untuk mencapai pemahaman komputer.
Rangkaian saraf dalam terdiri daripada pelbagai lapisan nod berkelakuan seperti neuron di dalam otak kita
Oleh itu, untuk meneruskan rangkaian saraf yang mendalam, berat neuron ini kemudiannya diberi makan sebagai input ke dalam lapisan neuron lain yang juga secara rawak menetapkan berat dan menyampaikannya sebagai input kepada lebih banyak neuron dalam rangkaian. Ini berterusan sehingga lapisan output neuron memberikan keputusan binari. Jika purata berat yang diserahkan kepada mereka adalah lebih besar daripada 0.5, ia adalah anjing jika tidak. Hubungan antara dan pengaktifan neuron merentasi pelbagai lapisan nod adalah apa yang memberikan aplikasi rangkaian saraf dalam kuasa mereka.
Bagaimanakah rangkaian saraf dalam tahu jika ia menghasilkan jawapan yang betul?
Soalan-soalan yang relevan pada ketika ini adalah: adakah rangkaian saraf dalam meneka dengan betul atau tidak dan apa yang berlaku jika ia mempunyai atau tidak meneka dengan betul? Dan bagaimana rangkaian saraf tahu jika ia diteka dengan betul atau tidak?
Salah satu cara yang akan diketahui ialah jika anda menjalankan tugas klasifikasi yang sangat memakan masa untuk melabelkan semua gambar "anjing" atau "bukan anjing" bergantung kepada sama ada terdapat anjing dalam foto atau tidak. Jaring saraf hanya akan melihat label untuk melihat sama ada ia mengenal pasti anjing itu dengan betul atau tidak.
Dan sudah tentu kami tidak berminat sama ada ia mendapat soalan "Anjing atau tidak" tepat pada gambar anjing tunggal. Kami berminat sama ada ia mendapat soalan yang tepat untuk setiap foto, atau sekurang-kurangnya untuk mengetahui berapa peratus masa yang tepat dalam menilai sama ada terdapat anjing atau tidak dalam gambar.
Bagaimanakah rangkaian saraf dalam menggunakan latihan untuk belajar?
Rangkaian saraf belajar dari setiap lelaran melalui data untuk meningkatkan ketepatannya
Untuk satu set berat yang diberikan di semua neuron dalam rangkaian, jaring saraf akan membuat tekaan untuk semua foto dan kemudian menentukan seberapa tepatnya. Berapa peratus masa yang diperoleh ia mendapat hasil yang betul iaitu mengatakan anjing itu berada dalam foto ketika berada dalam foto, dan berapa kali ia mendapat hasil yang salah, katakan anjing itu berada dalam foto apabila ia tidak atau mengatakan anjing itu tidak berada dalam foto ketika itu. Petunjuk ini tentang seberapa tepat algoritma AI adalah maklum balas penting untuk model rangkaian saraf.
Sebaik sahaja ia telah berjalan melalui semua foto sekali, ia boleh secara rawak (atau sebaliknya) menyesuaikan beberapa berat dan kemudian melakukan keseluruhan latihan meneka apa yang ada dalam foto sekali lagi. Sekiranya hasil dari larian kedua lebih baik, ia akan terus daripada kembali ke set berat sebelumnya. Sekiranya hasil dari larian kedua lebih buruk, ia mungkin kembali ke set berat sebelumnya dan kemudian cuba pengubahsuaian yang berbeza pada berat tersebut.
Proses ini akan berterusan dengan cara ini sehingga jaring saraf menjadi baik untuk mengenal pasti anjing dalam foto (mudah-mudahan).
Apabila algoritma dapat mengenal pasti anjing dengan tepat, ia dikatakan telah berkumpul. Ia telah berjaya "dilatih" untuk mengenal pasti anjing.
Apakah jenis rangkaian saraf yang berbeza?
Rangkaian saraf convolutional
Rangkaian saraf convolutional (CNN) adalah sejenis kecerdasan buatan yang direka untuk memproses, atau belajar daripada, set data yang besar. Rangkaian saraf convolutional adalah istilah yang baru dicipta khusus menggambarkan jenis rangkaian ini, atau teknologi AI secara umum.
CNN adalah alat AI pengecaman imej yang kuat yang menggunakan pembelajaran mendalam untuk melaksanakan bukan sahaja tugas generatif, tetapi juga tugas deskriptif. Contoh tugas generatif termasuk pemangkasan automatik, penulisan kapsyen, videografi, mimeograf dan tindanan imej. Rangkaian saraf convolutional mengandungi apa yang dipanggil lapisan convolutional. Setiap neuron dalam lapisan ini hanya memproses maklumat dari sebahagian kecil medan visual. Setiap input neuron dibarisi dalam fesyen seperti cek untuk menghasilkan peta ciri.
Rangkaian saraf buatan
Rangkaian saraf buatan (ANN) adalah rangkaian banyak persepsi pada kedalaman atau lapisan yang berbeza yang dapat difahami sebagai Regresi Logistik. ANN sering dipanggil Feed Forward Neural Network kerana input diproses hanya dalam arah hadapan: lapisan menerima input dan menghantar output dalam cara linear.
Rangkaian saraf buatan juga dikenali sebagai approximators fungsi sejagat. Algoritma rangkaian saraf tulen seperti ANN dan fungsi pemetaan yang boleh dilaksanakan sebagai pembelajaran mendalam membolehkan komputer mempelajari sebarang fungsi. Salah satu sebab mengapa penghampiran sejagat penting ialah fungsi pengaktifan. Fungsi pengaktifan memperkenalkan sifat tidak linear ke dalam rangkaian sambil mempelajari sebarang hubungan kompleks antara input dan output. Ia membantu pelbagai jenis rangkaian belajar antara satu sama lain.
Bagaimanakah rangkaian saraf dalam bertambah baik dari semasa ke semasa?
Salah satu cara untuk membayangkan apa algoritma yang dilakukan adalah membayangkan setiap neuron sebagai sejenis ujian kepastian. Daripada pengekodan semua kenyataan jika kemudian untuk mengenal pasti anjing, setiap neuron ditentukur untuk menambah atau mengambil dari penghakiman akhir bahawa objek dalam foto itu adalah anjing. Ia seolah-olah penghakiman (seperti anjing atau tidak) dibahagikan kepada sebilangan besar penghakiman yang berkaitan yang menyumbang secara agregat kepada penghakiman akhir.
Sudah tentu objektif utama adalah untuk mencapai penumpuan jika itu mungkin. Ia juga merupakan objektif penting untuk melakukan ini dalam masa yang munasabah, sebaik-baiknya dalam masa yang singkat.
Algoritma pembelajaran mendalam mempunyai proses pembelajaran yang menjadikan mereka sukar difahami untuk manusia
Apa yang menarik ialah logik yang membolehkan rangkaian saraf mengenal pasti anjing dalam gambar tidak dapat difahami manusia. Model pembelajaran mendalam mempunyai logik tersembunyi, pada dasarnya kotak hitam lapisan nod tersembunyi mencipta rangkaian dalam sendiri. Walau bagaimanapun, terdapat beberapa percubaan untuk cuba mewakili visual logik di sebalik rangkaian saraf untuk tugas pengecaman imej. Untuk kes lain, tidak mungkin untuk melihat apa algoritma yang dilakukan di belakang tabir dan kaedah pembelajaran mendalam tetap tersembunyi.
Rangkaian saraf dan pembelajaran mesin popular sekarang tetapi banyak algoritma ini diketahui sekitar 50 tahun yang lalu.
Mengapa rangkaian saraf dalam semakin popular di pelbagai industri?
Salah satu sebab utama jaring saraf jauh lebih popular sekarang daripada ketika pertama kali dicipta, adalah bahawa kuasa pemprosesan lebih cepat dan lebih murah daripada itu. Kuasa pengkomputeran telah membuat semua perbezaan dalam mencapai penumpuan cepat. Sebab lain ialah data kini ada di mana-mana yang meningkatkan nilai algoritma yang boleh menggunakan data seperti chatbots untuk perniagaan
Rangkaian saraf lanjutan memerlukan kuasa pemprosesan yang tinggi dan banyak data
Pembelajaran mendalam adalah teknik data dan pemproses yang lapar yang boleh mencapai hasil yang mustahil bagi pengaturcara menggunakan teknik pengaturcaraan untuk dicapai. Mereka sangat sesuai untuk masalah tertentu di mana data di mana-mana tersedia dan mudah untuk mengkategorikan atau menilai hasil yang lebih baik.
Tanpa beratus-ratus ribu atau sebaik-baiknya berjuta-juta gambar anjing, mustahil untuk melatih algoritma. Teknik ini hanya berfungsi apabila banyak data tersedia. Ini agak jelas kerana semua kes khas tidak mungkin diwakili dalam satu set hanya 1000 gambar.
Rangkaian saraf boleh berhadapan dengan data berstruktur atau data tidak berstruktur
Satu masalah dalam contoh di atas ialah banyak kerja manual terlibat dalam melabelkan semua foto. Lebih mudah bagi algoritma untuk menggunakan data yang dilabelkan dengan cara berstruktur. Pembelajaran mesin rangkaian saraf yang menggunakan data berstruktur dipanggil pembelajaran yang diselia.
Ini membawa kita kepada soalan utama: adakah mungkin untuk mengelakkan semua kerja penandaan itu? Itu bagus kerana bukan sahaja anda dapat mengelakkan banyak kerja manual tetapi juga kebanyakan data yang terdapat di internet tidak berstruktur iaitu tidak dilabelkan dengan teliti atau berstruktur.
Bolehkah rangkaian saraf berfungsi dengan data yang tidak berstruktur?
Rangkaian saraf buatan dan pembelajaran mesin yang berfungsi dengan data yang tidak berstruktur dipanggil pembelajaran tanpa pengawasan. Sudah tentu, ini adalah grail suci pembelajaran mesin dan lebih serupa dengan bagaimana manusia belajar. Walau bagaimanapun, walaupun pembelajaran tanpa pengawasan oleh mesin memerlukan lebih banyak data untuk "belajar" daripada manusia dan mesin tidak boleh dengan mudah mengekstrapolasi kepada contoh-contoh yang berada di luar apa yang telah mereka latih.
Banyak model pembelajaran mendalam cuba menghasilkan semula proses otak manusia
Sesetengah orang percaya bahawa jenis algoritma ini boleh dibangunkan, mungkin dengan kejuruteraan semula otak, sehingga algoritma mula mendekati "pemahaman" peringkat manusia. Mereka percaya bahawa ia akan mungkin menggunakan teknologi pengimbasan canggih otak untuk memberi kita gambaran tentang bagaimana rangkaian saraf otak benar-benar berfungsi. Dengan menyalin reka bentuk dan corak ini, kita boleh meniru kecerdasan peringkat manusia.
Walaupun teknik-teknik itu tidak diragui dan sangat berguna, terutamanya di mana set data yang besar tersedia, sukar untuk membayangkan bahawa algoritma mudah sedemikian boleh menjadi asas kecerdasan seperti manusia yang sangat kreatif.
Senarai Kandungan
Ikuti perkembangan terkini tentang ejen AI
Kongsi ini pada: