跳转到内容

深度学习与神经网络

发布时间:2025年3月12日

深度学习是机器学习的一个子集,它使用多层神经网络从数据中学习层次化的特征表示。

人工神经元模拟生物神经元的行为:

  • 接收多个输入信号
  • 加权求和
  • 通过激活函数产生输出
函数公式特点
ReLUf(x)=max(0,x)计算高效,缓解梯度消失
Sigmoidf(x)=1/(1+e⁻ˣ)输出映射到 (0,1)
Tanhf(x)=tanh(x)输出映射到 (-1,1)
Softmax多分类输出概率分布

专门处理网格状数据(如图像),通过卷积核提取局部特征。

适合处理序列数据(如文本、时间序列),具有记忆能力。

基于自注意力机制的架构,是 GPT、BERT 等大模型的基础。

  • PyTorch:动态计算图,研究界广泛使用
  • TensorFlow:工业级部署方案
  • JAX:Google 推出的高性能框架