一个面向工程师的机器学习入门教材“There Is No Spoon”github.com/dreddnafious/thereisnospoon
这是一个从第一性原理出发的机器学习入门教程。为希望像分析软件系统一样分析机器学习系统的工程师而写。
🎯 适合人群你是一名出色的工程师。你可以凭借自己的深厚经验在白板上画出软件系统。你理解权衡——维护与优雅、性能与复杂性。你对软件设计有直觉。但你对机器学习还没有这种直觉。你知道各种工具存在,但无法判断什么时候该用哪种工具。本入门指南旨在建立这种直觉。
💡 与众不同之处这不是教科书,也不是教程。它是一个思维模型——让你能够像分析软件系统一样分析机器学习系统所需的抽象概念。
每个概念都与物理和工程类比相连: 神经元如同偏振滤光片 深度如同折纸 梯度流如同管道阀门 链式法则如同齿轮传动 投影如同影子
这些类比不是装饰,而是主要解释,数学只是辅助细节。
重点在于什么时候使用哪种工具及原因——不仅是每个工具的功能,更是它所代表的设计决策及潜在权衡。
📐 涵盖内容本入门指南分为三部分:🧱 第一部分 — 基础神经元、组合(深度与宽度如折纸)、学习作为优化(导数、链式法则、反向传播)、泛化,以及表示(特征作为方向、叠加)。
🏗️ 第二部分 — 架构组合规则家族(全连接、卷积、循环、注意力、图操作、状态空间模型)、深入理解 Transformer(自注意力、前馈网络如体积查找、残差连接)、编码、超越反向传播的学习规则、训练框架(监督学习、自监督学习、强化学习、生成对抗网络、扩散模型)、以及如何将拓扑匹配到问题。
🚦 第三部分 — 门控作为控制系统门控原语(标量、向量、矩阵)、软逻辑组合、分支与路由、前向传递中的递归,以及几何数学工具箱(投影、掩码、旋转、插值)。How I AI
