闲下来的 Andrej Karpathy 录了个课程:保证学会,你听不懂我吃鞋

机器之心

机器之心报道

机器之心编辑部

为了重拾自己对 AI 开源和教育的热情,Andrej Karpathy 在家录了一个详解反向传播的课程。

前段时间,特斯拉 AI 高级总监、自动驾驶 Autopilot 负责人 Andrej Karpathy 在推特上宣布自己即将离职,并表示从今年三月份开始,自己已休假四个月。

在休假的这段时间,Karpathy 也没有闲着,自己在家录了个课程。视频内容长达 2 小时 25 分钟,基于 micrograd 详细介绍了神经网络和反向传播。

对于这门课程,Karpathy 自信地表示:「这是 8 年来领域内对神经网络和反向传播的最佳讲解。」

视频地址:https://twitter.com/karpathy/status/1559672719414681601

Karpathy 还在个人推特上打起了赌:只要你懂 Python,并能模糊记起高中学过的求导知识,看了这个视频你还不理解反向传播和神经网络核心要点的话,那我就吃一只鞋。

言外之意这门课程只需观看者掌握基本的 Python 编程技能和高中微积分的简单知识,非常适合零基础的同学在线学习。

有网友调侃到虽然自己很想看 Karpathy 直播吃鞋,但他相信 Karpathy 的视频课程不会让人失望的。

课程内容

接近 2 个半小时的视频按照时间段划分了近 20 个小部分,主要包括以下内容。

micrograd 项目概述。2020 年 4 月,Karpathy 开源了其编写的微型 autograd 引擎 micrograd,其中用 100 行代码实现了针对动态构建的 DAG 的反向传播算法,并用 50 行代码实现了类 PyTorch API 的库。目前,micrograd 项目的 GitHub Star 量已达 2.2k。

项目地址:https://github.com/karpathy/micrograd/

然后 Karpathy 介绍了只有一个输入的简单函数的导数和具有多个输入的简单函数的导数、启动 micrograd 的核心 Value 对象及其可视化的方法,并举了两个手动反向传播的例子。

接下来 Karpathy 系统地介绍了:

为单个操作实现反向传播;

为整个表达式图实现反向函数;

修复一个节点多次出现的反向传播 bug;

使用更多操作替换 tanh 激活函数;

用 PyTorch 实现上述操作,并与 micrograd 进行比较;

用 micrograd 构建一个神经网络库 ( MLP ) ;

创建一个微型数据集,编写损失函数;

收集神经网络的所有参数;

手动做梯度下降优化,训练网络。

最后 Karpathy 总结了反向传播与现代神经网络的关系。此外,Karpathy 还在视频中探究了 PyTorch 中 tanh 激活函数的反向传播机制。

Andrej Karpathy

个人主页:https://karpathy.ai/

2005-2009 年,Andrej Karpathy 本科就读于加拿大多伦多大学,主修计算机科学与物理,辅修数学。在这里,他第一次接触到深度学习,聆听 Hinton 的课程。

2009 -2011 年,Karpathy 硕士就读于加拿大不列颠哥伦比亚大学,其导师为计算机科学系教授 Michiel van de Panne,主要研究物理模拟中用于敏捷机器人的机器学习。

2011-2016 年,Karpathy 博士就读于斯坦福大学,师从著名 AI 学者李飞飞,专注于研究卷积 / 循环神经网络以及它们在计算机视觉、自然语言处理和交叉领域的应用。期间,他设计并担任斯坦福首个深度学习课程《CS231n:卷积神经网络与视觉识别》的主要讲师。

与此同时,Karpathy 还有三段实习经历。2011 年,他进入发展初期的谷歌大脑实习,致力于视频领域的大规模无监督学习。之后的 2013 年,他再次在谷歌研究院实习,从事 YouTube 视频的大规模监督学习。2015 年,他在 DeepMind 实习,参与深度强化学习团队的工作。

Karpathy 是 OpenAI 的创始成员和研究科学家。仅一年多后,2017 年,Karpathy 接受马斯克的邀请加入特斯拉,接替了当时的特斯拉 Autopilot 负责人、苹果 Swift 语言、LLVM 编译器之父 Chris Lattner。

五年里,Karpathy 一手促成了 Autopilot 的开发。随着特斯拉从最开始的自动驾驶慢慢扩展到更广泛的人工智能领域,Karpathy 也被提为特斯拉的 AI 高级总监,直接向马斯克汇报工作。

现在根据领英上的资料显示,Karpathy 已于 7 月离开特斯拉。

至于离开特斯拉,接下来要做什么,此前 Karpathy 透漏还没有具体的安排,但希望重拾自己长久以来对 AI 技术工作、开源和教育等方面的热情。

掌握「声纹识别技术」:前 20 小时交给我,后 9980 小时……

《声纹识别:从理论到编程实战》中文课上线,由谷歌声纹团队负责人王泉博士主讲。

课程视频内容共12 小时,着重介绍基于深度学习的声纹识别系统,包括大量学术界与产业界的最新研究成果。

同时课程配有32 次课后测验、10 次编程练习、10 次大作业,确保课程结束时可以亲自上手从零搭建一个完整的声纹识别系统。

课程目前还在首周优惠中,欢迎对声纹领域感兴趣的同学一起学习。

点击阅读原文,了解更多课程内容。

THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

免责声明:本文来自胡石英,不代表浮光掠影知识网 - 专注有价值知识的生活内容平台的观点和立场,如有侵权请联系本平台处理。

相关阅读

    发表评论

    表情:
    评论列表(暂无评论,1157人围观)

    还没有评论,来说两句吧...

    取消
    微信二维码
    微信二维码
    支付宝二维码