- 深度神經網路 (DNN) 是一種機器學習系統,由多層連接節點組成,可學習資料中的模式以進行預測。
- DNN 可以根據過往的錯誤調整其內部連接,透過反向傳播隨時間改善其準確性。
- 運算能力的進步以及對大量資料集的存取,讓 DNN 適用於涉及文字、影像和音訊等非結構化資料的任務。
- DNN 以「黑盒」的方式運作,通常不清楚 DNN 如何做出決策。
什麼是深度神經網路?
深度神經網路 (DNN) 是一種模仿人腦處理資訊的機器學習模型。與遵循預先定義規則的傳統演算法不同,DNN 可以從資料中學習模式,並根據先前的經驗進行預測 - 就像我們一樣。
DNN 是深度學習的基礎,為AI 代理、影像識別、語音助理、AI 聊天機器人等應用提供動力。
到 2027 年,全球人工智能市場(包括由深度神經網路驅動的應用程式)將超過5,000 億美元。
什麼是神經網路架構?
DNN 中的「深層」指的是擁有多個隱藏層,可讓網路識別複雜的模式。
神經網路由多層節點組成,這些節點從其他層接收輸入並產生輸出,直到達到最終結果。
神經網路由多層節點(神經元)組成。每個節點接受輸入、處理輸入並將輸入傳送到下一層。
- 輸入層:第一層擷取原始資料 (例如:影像、文字)。
- 隱藏層:輸入與輸出之間的層,用來轉換資料和偵測模式。
- 輸出層:產生最終預測。
神經網路可以有任意數量的隱藏層:網路中的節點層數越多,複雜度就越高。傳統的神經網路通常由 2 或 3 個隱藏層組成,而深度學習網路最多可以有 150 個隱藏層。
神經網路與深度神經網路有何不同?

簡而言之:超越輸入資料並能從先前經驗中學習的神經網路就成為深度神經網路。
神經網路會依據輸入的資料,遵循編程的規則來做決定。舉例來說,在國際象棋遊戲中,神經網路可以根據預設的戰術和策略建議步驟,但它只限於程式設計師所提供的內容。
但是深度神經網路會從經驗中學習,從而更進一步。DNN 並非完全依賴預設的規則,而是可以根據它在大型資料集中所辨識到的模式來調整其決定。
範例
想像一下編寫一個程式來識別照片中的狗。傳統的神經網路需要明確的規則來辨識毛髮或尾巴等特徵。另一方面,DNN 會從成千上萬的標示影像中學習,並隨時間改善其準確度 - 甚至不需要額外的程式就能處理困難的情況。
深度神經網路如何運作?
首先,輸入層中的每個神經元都會接收一筆原始資料,例如圖像中的像素或句子中的單字,並為此輸入分配一個權重,表示此輸入與任務的相關程度。
低權重(小於 0.5)表示資訊相關的可能性較低。這些加權輸入會通過隱藏層,由神經元進一步調整資訊。這個過程會持續多層,直到輸出層提供最終預測。
深度神經網路如何知道自己是否正確?
深度神經網路在訓練過程中,會將其預測與標記資料進行比較,以瞭解自己的預測是否正確。對於每個輸入,網路會檢查其預測是否與實際結果相符。如果預測錯誤,網路會使用損失函數計算誤差,以衡量預測的偏差程度。
然後,網路會使用反向傳播來調整造成誤差的神經元的權重。此過程會在每次迭代時重複進行。
神經網路有哪些不同類型?
深度神經網路如何隨著時間的推移而改進?
深度神經網路會從錯誤中學習,從而不斷改進。當它做出預測(例如找出客戶問題或推薦產品)時,它會檢查自己的預測是否正確。如果不對,系統就會自我調整,以便下次改進。
例如,在客戶支援方面,DNN 可能會預測如何解決票單。如果預測錯誤,它會從錯誤中學習,並在未來更好地解決類似的票單。在銷售方面,DNN 可透過分析過去的交易,了解哪些潛在客戶的轉換率最高,並隨著時間的推移改善其建議。
因此,每一次互動,DNN 都會變得更準確、更可靠。
深度神經網路的思考方式與人類不同嗎?
但深度學習模型通常會以「黑箱」的方式運作,也就是說人類無法輕易解讀這些模型如何做出決定。正如來自杜克大學的人工智能研究員 Cynthia Rudin所說,可解讀性對於人工智能系統的道德部署至關重要,尤其是在高風險的環境中。
研究人員試圖將網路處理影像的方式視覺化,但對於更複雜的任務,例如語言或財務預測,其邏輯仍然是隱藏的。雖然這些演算法看起來很新,但許多都是數十年前開發的。資料和運算能力的進步讓這些演算法在今日變得實用。
為什麼深度神經網路越來越受歡迎?
1.處理能力的提升
DNN 激增的主要原因之一是處理能力更快、更便宜。在實現快速收斂的過程中,運算能力起到了舉足輕重的作用。「圖形處理單元 (GPU) 和張量處理單元 (TPU) 等專用硬體的興起,使得以數十億個參數訓練網路變得可行」。
2.增加資料集的可用性
另一個關鍵因素是大型資料集的可用性,深度神經網路需要大型資料集才能有效學習。隨著企業產生更多資料,DNN 可以發現傳統模型無法處理的複雜模式。
3.改善非結構化資料的處理
它們處理文字、影像和音訊等非結構化資料的能力,也開啟了聊天機器人、推薦系統和預測分析等領域的新應用。
神經網路可以使用非結構化數據嗎?
是的,神經網路可以處理非結構化資料,這是其最大的優勢之一。
使用非結構化資料的人工神經網路稱為無監督學習。這是機器學習的聖杯,更類似於人類的學習方式。
傳統的機器學習演算法難以處理非結構化資料,因為它們需要特徵工程 - 手動選擇和擷取相關特徵。相比之下,神經網路可以自動學習原始資料中的模式,而無需大量的手動介入。
深度神經網路如何使用訓練來學習?
深度神經網路的學習方式是進行預測,並將預測結果與正確結果進行比較。例如,在處理照片時,它會預測圖片中是否有狗,並追蹤它答對的頻率。
網路會透過檢查正確預測的百分比來計算其準確度,並利用此反饋來改善。它會調整神經元的權重,然後再執行一次。如果準確度有所改善,它會保留新的權重;如果沒有,它會嘗試不同的調整。
這個循環會反覆多次,直到網路能夠持續辨識模式並作出準確的預測。一旦達到這一點,就表示網路已經收斂,並且訓練成功。
以更好的結果節省編碼時間
神經網路之所以如此命名,是因為這種程式設計方法與大腦的工作方式之間存在相似性。
就像大腦一樣,神經網路演算法使用神經元或節點網路。像大腦一樣,這些神經元是離散的功能(如果你喜歡的話,也可以是小機器),它們接受輸入並產生輸出。這些節點按層排列,其中一層中神經元的輸出成為下一層神經元的輸入,直到網路外層的神經元產生最終結果。
因此,存在神經元層,每個單獨的神經元接收非常有限的輸入,併產生非常有限的輸出,就像在大腦中一樣。神經元的第一層(或輸入層)接收輸入,網路的最後一層神經元(或輸出層)輸出結果。
將這種類型的演算法稱為「神經網路」準確嗎?
將這種演算法稱為「深度神經網路」已證明是有效的品牌宣傳,儘管它可能會設定過高的期望。這些模型雖然功能強大,但仍遠比人類大腦的複雜性來得簡單。儘管如此,研究人員仍持續探索神經架構,目標是達到一般人類的智慧。
儘管如此,仍有人試圖使用非常複雜的神經網路來重新設計大腦,希望藉由這樣的方式,能夠在機器人開發中複製出類似人類的一般智慧。那麼神經網路和機器學習技術如何幫助我們解決識別狗狗的問題呢?
好吧,深度神經網路演算法無需手動定義類似狗的屬性,而是可以識別重要屬性並處理所有特殊情況而無需程式設計。
常見問題
1.訓練一個深度神經網路需要花多少時間?
訓練深度神經網路所需的時間取決於資料集大小和模型複雜度。一個簡單的模型可能在筆記型電腦上花幾分鐘就能完成訓練,而像GPT 或 ResNet 這樣的大型模型可能需要使用高效能 GPU 或 TPU 花上幾天甚至幾週的時間。
2.我可以在個人電腦上訓練 DNN 嗎?
是的,如果資料集小且模型相對簡單,您可以在個人電腦上訓練深度神經網路。但是,若要訓練大型模型或使用大型資料集,您需要支援 GPU 的裝置或存取 AWS 或 Azure 等雲端平台。
3.用於電腦視覺的 DNN 和用於自然語言處理的 DNN 有什麼不同?
用於電腦視覺的深度神經網路使用卷積層 (CNN) 來處理像素資料,而 NLP 模型則使用轉換器、LSTM 或 RNN 等架構來處理語言中的順序與語意結構。兩者都使用深度學習,但針對不同的資料類型進行最佳化。
4.如何選擇 DNN 的隱藏層數?
在 DNN 中選擇隱藏層的數量涉及到實驗 - 太少可能會對資料擬合不足,而太多則可能會過度擬合並減慢訓練速度。對於簡單的任務,可以從 1-3 層開始,然後逐步增加,並以交叉驗證或測試集來驗證效能。
5.深度神經網路研究的下一個重大突破預期是什麼?
深度神經網路研究的未來突破包括稀疏神經網路 (可降低計算成本)、神經符號推理 (結合邏輯與深度學習)、改良的可解釋性技術,以及模仿人腦效率的更節能架構 (例如尖峰神經網路)。