别再乱选AI课程了——这些书才是你的正解

四年AI实战者揭穿AI课程泡沫:Python核心+PyTorch手撸GPT+MLOps部署——这三本书构建的能力护城河,胜过87%速成课。

在人工智能与机器学习领域深耕四年后,我想分享所有助我成长的资源。

由于内容较多,我将它们分为以下几类:

  • 编程与软件工程

  • 数学与统计学

  • 机器学习

  • 深度学习与大语言模型

  • 人工智能工程

编程与软件工程

想进入AI领域,编程能力与软件工程技能是必备基础。

OpenAI首席技术官Greg Brockman也支持我的观点!

除少数特例外,AI领域最具影响力的人往往是软件与机器学习都精通的专家。

跟大众的认知相反,掌握机器学习其实比精通软件工程快得多。

因此优秀软件工程师在AI领域往往潜力非凡

由于AI领域较新,其主流语言尚未定型,但Python凭借易用性和完善生态仍是首选。

当前AI岗位多由机器学习领域衍生,而Python是该领域通用语言,短期不会改变。

但最热门的AI工程师岗位更接近软件工程而非机器学习工程,因此可能需要掌握Java/GO/Rust等后端语言。

建议从Python入门(更易掌握核心工程原理),但未来可能需要转向其他语言。

尽管课程书籍众多,持续实践才是最佳导师。资源仅能带你入门,真正掌握Python(或任何语言)必须通过创造与实践。

我的Python与软件工程基础推荐:

数学与统计学

虽然多数AI工作只需部署基础模型,但想成为顶尖从业者,至少要懂模型底层原理。

以下资源足以满足数学需求,无需另寻他处:

  • 《数据科学实用统计学》(Practical Statistics for Data Science)——若只能选一本统计书,非它莫属。专为AI/ML从业者编写,含Python实战案例

  • 《机器学习数学基础》(Mathematics for Machine Learning)——详解机器学习与AI背后的数学原理,涵盖微积分、线性代数等。内容较深,建议重点选读,可作工具书使用

  • 《机器学习与数据科学数学基础》专项课(Mathematics for Machine Learning and Data Science Specialization)——DeepLearning.AI新出品(著名机器学习/深度学习专项课制作方),专为AI/ML设计的数学入门课,包含微积分、线性代数、统计概率等核心内容

机器学习

当前主流AI其实指的是生成式AI(GenAI),属于机器学习分支。顾名思义,GenAI指生成文本/图像/音频/代码的算法。

v2_deb1da06431f4d77b8b7743f37c18aa0@1694_oswg194202oswg765oswg521_img_png.jpg

但AI概念早在上世纪50年代神经网络诞生时就已存在。

甚至可追溯至二战时期——艾伦·图灵在计算机与思维机器研究中提出了"图灵测试"。

总之我想强调:AI远比当今大众的认知更加广阔,要想成为优秀的AI从业者,机器学习与传统AI的扎实基础不可或缺。

下列资源覆盖了机器学习的核心知识(若需时间序列预测/强化学习/优化算法/计算机视觉等进阶内容,可另行推荐):

  • 《Scikit-Learn、Keras与TensorFlow机器学习实战》(Hands-On ML with Scikit-Learn, Keras, and TensorFlow)——如果只能推荐一本书,必选此本。内容惊艳,覆盖全面,末尾还谈到了大语言模型、强化学习与计算机视觉

  • 机器学习专项课(Machine Learning Specialization)——2020年我的机器学习启蒙课,堪称史上最佳的机器学习课程。当初我是用Octave学习的,现已升级为Python教学并新增推荐系统/强化学习等前沿内容

  • 《百页机器学习宝典》(The Hundred-Page ML Book)——百页浓缩的机器学习精华!轻量级工具书,助你快速查阅核心概念,基础讲解尤为出色

  • 《统计学习导论》(The Elements of Statistical Learning)——掌握机器学习(本质即统计学习)根基的绝佳教材,真正传授学科精髓

深度学习与大语言模型

如上图所示,深度学习是AI大类中的子集,属于机器学习分支。

当前所有生成式AI算法皆源于此,你会在这个领域深入理解大语言模型、扩散模型、Transformer等基础架构的运作原理。

  • PyTorch官方教程(PyTorch Tutorials)——深度学习框架必选其一,目前的行业双雄为PyTorch与TensorFlow。建议主攻PyTorch(近年势头更劲):2021年约77%研究论文采用这一框架,HuggingFace平台92%模型为其专属

  • 深度学习专项课(Deep Learning Specialization)——机器学习专项课的进阶篇。学习卷积神经网络/循环神经网络的优质课程,含大语言模型导论,可谓深度学习最佳入门

  • Andrej Karpathy的(特斯拉前AI总监)《大语言模型入门》——1小时科普视频讲解LLM原理与应用。强烈推荐给所有人(包括非技术背景者),内容宏观易懂

  • 《神经网络:从零进阶》(Neural Networks: Zero to Hero,作者也是Andrej Karpathy)——从零搭建神经网络,起步节奏平缓,但最终视频将带你亲手构建GPT模型!AI从业者必修课

  • 《动手学大语言模型:语言理解与生成》(Hands-On Large Language Models: Language Understanding and Generation)——LLM教材稀缺(近年才成主流),但此书广受好评。合著者Jay Alammar曾撰Transformer最佳科普博文,获吴恩达背书

人工智能工程

至此你已全面掌握了AI(特别是LLM与GenAI)的理论与实践版图。

真正的价值在于将AI模型转化为产品,因此需学习算法产品化部署技能,让技术为企业与客户创造价值。

多数AI岗位其实是"AI工程师",其工作性质更接近传统软件工程而非机器学习工程。

核心工作是运用Llama/GPT-4/Claude等基础GenAI模型开发产品,极少涉及模型开发——主要是因为训练成本过高,且现有的基础模型已足够强大!

  • 《实用MLOps指南》(Practical MLOps)——模型部署领域唯一的必备书。我主要用作工具书,内容覆盖容器化/脚本编写/云系统/模型监控等全流程

  • 《人工智能工程实践》(AI Engineering)——当红教材。作者Chip Huyen是生产环境ML/AI系统权威专家,斯坦福课程主讲人,品质保证

学习资源浩如烟海,关键要化繁为简,即刻行动。核心知识体系大同小异,选任何资源都不会错。

谨以AI领域顶尖研究者Andrej Karpathy的推文祝你征程顺利:

成为领域专家的秘诀:

  1. 纵向深挖:通过具体项目实践"按需学习"(拒绝填鸭式横向学习)

  2. 知识反刍:用自己的语言总结/传授所学

  3. 自我超越:只与昨天的自己比较,永远不跟他人攀比



标签: AI学习

添加新评论 »