什么是深度神经网络？

撰写人

马克-梅西埃

摘要

深度神经网络（DNN）是一种机器学习系统，由层层相连的节点组成，通过学习数据中的模式来进行预测。
DNN 可以根据过去的错误调整内部连接，通过反向传播逐步提高准确性。
计算能力的提高和海量数据集的获取使 DNN 适用于涉及文本、图像和音频等非结构化数据的任务。
DNN 作为 "黑盒子 "工作，通常不清楚它们是如何做出决定的。

什么是深度神经网络？

深度神经网络（DNN）是一种模仿人脑处理信息的机器学习模型。与遵循预定义规则的传统算法不同，DNN 可以从数据中学习模式，并根据以往的经验做出预测--就像我们一样。

DNN 是深度学习的基础，为人工智能代理、图像识别、语音助手和人工智能聊天机器人等应用提供动力。

到 2027 年，全球人工智能市场（包括由深度神经网络驱动的应用）将超过5000 亿美元。

构建人工智能Chatbots

构建定制的人工智能代理

现在开始

什么是神经网络架构？

DNN 中的 "深 "指的是有多个隐藏层，使网络能够识别复杂的模式。

神经网络由多层节点组成，这些节点接收来自其他层的输入并产生输出，直至得出最终结果。

神经网络由多层节点（神经元）组成。每个节点接收输入，对其进行处理，然后将其传递给下一层。

输入层：获取原始数据（如图像、文本）的第一层。
隐藏层：输入和输出之间的层，用于转换数据和检测模式。
输出层：产生最终预测结果。

神经网络可以有任意数量的隐藏层：网络中的节点层数越多，复杂度就越高。传统的神经网络通常由 2 或 3 个隐藏层组成，而深度学习网络可以有多达 150 个隐藏层。

神经网络与深度神经网络有何不同？

神经网络与深度神经网络的对比图，突出显示了神经网络遵循编程规则，根据输入数据做出决策，而深度神经网络则从经验中学习，根据数据模式调整决策。

简而言之：超越输入数据并能从以往经验中学习的神经网络就是深度神经网络。

神经网络遵循编程规则，根据输入数据做出决策。例如，在国际象棋游戏中，神经网络可以根据预设的战术和策略提出走棋建议，但仅限于程序员提供的内容。

但深度神经网络通过从经验中学习更进一步。深度神经网络并不完全依赖预设规则，而是可以根据它在大型数据集中识别出的模式来调整自己的决策。

示例

想象一下，编写一个程序来识别照片中的狗。传统的神经网络需要明确的规则来识别毛发或尾巴等特征。而 DNN 则可以从成千上万张标注过的图像中学习，并随着时间的推移不断提高准确性，甚至无需额外编程即可处理困难的情况。

深度神经网络如何工作？

首先，输入层中的每个神经元都会接收一段原始数据，如图像中的像素或句子中的单词，然后为这段输入分配一个权重，表示它与任务的相关程度。

低权重（小于 0.5）意味着信息相关性较低。这些加权输入通过隐藏层，由神经元进一步调整信息。这一过程会持续多层，直到输出层做出最终预测。

深度神经网络如何判断自己是否正确？

深度神经网络通过在训练过程中将预测结果与标注数据进行比较，来判断自己的预测是否正确。对于每个输入，网络都会检查其预测是否与实际结果相符。如果预测错误，网络会使用损失函数计算误差，以衡量预测的偏差程度。

然后，网络使用反向传播来调整造成误差的神经元的权重。每次迭代都会重复这一过程。

神经网络有哪些不同类型？

神经网络类型	主要特点	常见用例
前馈网络	单向数据流	简单预测，基本任务
卷积网络（CNN）	检测视觉模式	图像识别、医学成像
递归网络（RNN）	处理顺序数据	时间序列、语音识别
长短期记忆（LSTM）	记住长期依赖关系	文本生成、聊天机器人
有门禁的经常性单元（GRU）	简化 LSTM	NLP、时间序列预测
径向基函数 (RBF)	使用径向基函数	分类、模式识别
生成对抗网络（GAN）	生成新数据	图像生成、深度伪造
变压器	自我关注机制	语言模型、翻译
模块化网络	多个独立子网络	复杂的多任务流程
尖峰神经网络（SNN）	基于时间的处理	机器人、神经形态计算

深度神经网络如何随着时间的推移不断改进？

深度神经网络从错误中学习，从而不断改进。当它做出预测时--比如识别客户问题或推荐产品--它会检查自己的预测是否正确。如果不对，系统就会调整自己，以便下次改进。

例如，在客户支持中，DNN 可能会预测如何解决票据问题。如果预测错误，它就会从错误中吸取教训，并在今后更好地解决类似问题。在销售领域，DNN 可以通过分析过去的交易来了解哪些销售线索的转化率最高，并随着时间的推移改进其建议。

因此，每一次交互，DNN 都会变得更加准确和可靠。

深度神经网络的思维方式与人类不同吗？

但深度学习模型通常是一个 "黑盒子"，这意味着人类无法轻易解读它们是如何做出决定的。正如杜克大学的人工智能研究员辛西娅-鲁丁（Cynthia Rudin）所解释的，可解释性对于人工智能系统的道德部署至关重要，尤其是在高风险环境中。

研究人员已经尝试将网络如何处理图像可视化，但对于更复杂的任务，如语言或金融预测，其逻辑仍然是隐藏的。虽然这些算法给人的感觉很新颖，但其中很多都是几十年前开发的。数据和计算能力的进步使它们在今天变得实用。

为什么深度神经网络越来越受欢迎？

1.处理能力的提高

DNN 激增的主要原因之一是处理能力更快、更便宜。计算能力是实现快速收敛的关键。"图形处理单元（GPU）和张量处理单元（TPU）等专用硬件的兴起，使得训练具有数十亿个参数的网络变得可行"。

2.数据集的可用性不断提高

另一个关键因素是大型数据集的可用性，深度神经网络需要大型数据集才能有效学习。随着企业生成更多数据，深度神经网络可以发现传统模型无法处理的复杂模式。

3.改进非结构化数据的处理

它们处理文本、图像和音频等非结构化数据的能力也为聊天机器人、推荐系统和预测分析等领域带来了新的应用。

神经网络能否处理非结构化数据？

没错，神经网络可以处理非结构化数据，这也是其最大的优势之一。

处理非结构化数据的人工神经网络被称为无监督学习。这是机器学习的圣杯，更类似于人类的学习方式。

传统的机器学习算法很难处理非结构化数据，因为它们需要特征工程--人工选择和提取相关特征。相比之下，神经网络可以自动学习原始数据中的模式，而无需大量的人工干预。

部署人工智能代理？

阅读我们的人工智能代理实施蓝图

立即阅读

深度神经网络如何利用训练来学习？

深度神经网络通过预测并将预测结果与正确结果进行比较来进行学习。例如，在处理照片时，它可以预测图像中是否有一只狗，并跟踪正确答案的出现频率。

网络通过检查预测的正确率来计算其准确率，并利用这些反馈来改进。它调整神经元的权重，并再次运行该过程。如果准确率提高了，它就保留新的权重；如果没有，它就尝试不同的调整。

如此反复多次，直到网络能够持续识别模式并做出准确预测。一旦达到这一点，就可以说网络已经收敛，训练成功。

节省编码时间，获得更佳效果

神经网络之所以如此命名，是因为这种编程方法与大脑的工作方式有相似之处。

就像大脑一样，神经网络算法使用的是由神经元或节点组成的网络。和大脑一样，这些神经元也是离散的功能（或者说是小机器），它们接受输入并产生输出。这些节点分层排列，一层神经元的输出成为下一层神经元的输入，直到网络外层的神经元产生最终结果。

因此，就像大脑一样，每一层神经元都接受非常有限的输入，并产生非常有限的输出。第一层神经元（或输入层）接收输入，最后一层神经元（或输出层）输出结果。

称这种算法为 "神经网络 "是否准确？

事实证明，将这种算法称为 "深度神经网络 "是一种有效的品牌宣传，尽管这种说法可能会让人产生过高的期望。虽然这些模型功能强大，但与人类大脑的复杂性相比，它们仍然简单得多。尽管如此，研究人员仍在继续探索神经架构，旨在实现类似人类的通用智能。

也就是说，有人试图利用非常复杂的神经网络来重新设计大脑，希望通过这样做，能够在机器人开发中复制出类似人类的一般智能。那么，神经网络和机器学习技术如何帮助我们解决狗的识别问题呢？

深度神经网络算法无需编程，就能识别重要属性并处理所有特殊情况，而不是手动定义类狗属性。

构建人工智能Chatbots

构建定制的人工智能代理

现在开始

常见问题

1.训练一个深度神经网络需要多长时间？

The time it takes to train a deep neural network depends on the dataset size and model complexity. A simple model might train in minutes on a laptop, while a large-scale model like GPT or ResNet could take days or even weeks using high-performance GPUs or TPUs.

2.我可以在个人电脑上训练 DNN 吗？

Yes, you can train a deep neural network on a personal computer if the dataset is small and the model is relatively simple. However, for training large models or using big datasets, you'll need a GPU-enabled setup or access to cloud platforms like AWS or Azure.

3.用于计算机视觉的 DNN 与用于自然语言处理的 DNN 有什么区别？

A deep neural network used in computer vision uses convolutional layers (CNNs) to process pixel data, while NLP models use architectures like transformers, LSTMs, or RNNs to handle sequential and semantic structure in language. Both use deep learning but are optimized for different data types.

4.如何选择 DNN 的隐藏层数？

Choosing the number of hidden layers in a DNN involves experimentation – too few may underfit the data, while too many can overfit and slow down training. Start with 1–3 layers for simple tasks and incrementally increase, validating performance with cross-validation or a test set.

5.深度神经网络研究的下一个重大突破是什么？

Future breakthroughs in deep neural network research include sparse neural networks (which reduce compute cost), neurosymbolic reasoning (which combines logic with deep learning), improved interpretability techniques, and more energy-efficient architectures that mimic human brain efficiency (e.g., spiking neural networks).