进阶篇—现代网络
全连接网络虽然通用,但在处理图像、文本等高维且具有结构特征的数据时显得力不从心。现代深度学习的爆发,源于我们学会了将数据的“归纳偏置”(Inductive Bias)注入到网络结构设计之中。
本部分将带领读者进入现代架构的殿堂。我们将看到卷积(Convolution)如何利用空间的局部性与平移不变性来理解图像,循环(Recurrent)如何利用时间的序列性来理解语言,以及注意力机制(Attention)如何打破时空限制,利用全局关联重构了我们对序列建模的认知。
学习路径:
- 通过 CNN 架构(从 LeNet 到 ResNet),掌握计算机视觉中特征提取与层级抽象的范式。
- 通过 RNN 与 LSTM,学习如何捕捉序列数据的短期与长期依赖。
- 剖析 Transformer 与注意力机制,理解这一开启大模型时代的核心技术如何运作。