

福利|全球征集! All in AI+Quant! LLMQuant助力案例探索与项目落地!
在现代科技领域,机器学习已成为推动创新的重要力量。今天,和大家分享 Sylvain Gugger 的故事,一个从数学教师转型为Jane Street机器学习工程师的传奇人物。

Sylvain 最初是一名法国的数学教师,在大学教授一年级的数学课程。2015 年,他搬到了美国,开始了新的生活。那时,他主要在家照顾孩子,偶尔接一些小项目。然而,2017 年的一篇《纽约时报》文章改变了他的职业轨迹。文章讨论了人工智能的发展,以及它可能在未来几年内取代许多工作。这引起了 Sylvain 的极大兴趣。
初识机器学习
文章末尾提到了几个在线课程,供对人工智能感兴趣的人进一步学习。其中一个是由 Jeremy Howard 开设的 fast.ai 课程。Sylvain 报名参加了这个课程,开始深入了解机器学习的世界。他积极参与课程论坛的讨论,为 fast.ai 库做出贡献,使模型训练更加快捷和简便。
在课程接近尾声时,Jeremy 组织了一支 fast.ai 团队,参加了斯坦福大学的 DAWNBench 竞赛。这项竞赛的目标是在给定的准确度下,以最快的速度训练一个计算机视觉模型。Sylvain 作为团队的一员,投入了大量精力。
竞赛中的创新
为了在竞赛中取得优势,Sylvain 和团队尝试了多种创新策略。其中之一是优化学习率调度。在传统方法中,模型通常以较低的学习率训练很长时间,然后将学习率降低,继续训练更长时间。这种方法虽然最终能达到较好的准确度,但效率低下。
Sylvain 的团队采用了不同的策略。他们从较低的学习率开始,逐渐增加到较高的学习率,使模型在初期能够稳定学习,然后在训练后期再逐渐降低学习率。这种方法使模型能够更快地探索损失函数的空间,避免陷入局部最小值,大大加速了训练过程。
此外,他们还调整了图像的尺寸。最初,他们使用较小的图像,使模型能够更快地学习基本特征。随着训练的进行,他们逐渐增加图像的尺寸和分辨率,使模型能够捕捉到更多的细节信息。
这些创新策略使他们的团队在竞赛中一度领先。然而,在最后阶段,谷歌公开发布了他们的 TPU(张量处理单元),并使用这种强大的硬件在极短的时间内完成了模型训练,超越了 Sylvain 的团队。
加入 fast.ai 和 Hugging Face
尽管未能在竞赛中夺冠,这次经历使 Sylvain 深刻理解了模型训练和优化的关键技巧。Jeremy Howard 认可了他的才能,邀请他加入 fast.ai。Sylvain 在 fast.ai 工作了两年,参与了多个版本的库开发,并与 Jeremy 合著了《使用 fastai 和 PyTorch 的深度学习》一书,为全球的学习者提供了宝贵的资源。
2020 年,全球疫情的爆发对许多行业产生了影响。Sylvain 加入了 Hugging Face,这是一家专注于开源机器学习的公司。他在这里维护开源库,开发教程和示例,帮助开发者更好地使用 Transformers 库。他还创建了 Accelerate 库,简化了在不同硬件上运行模型的过程,使研究人员能够专注于模型本身。
深入探索高性能计算
在 Hugging Face,Sylvain 深入研究了 PyTorch 的性能优化。他发现,虽然 PyTorch 易于使用,但如果不谨慎,代码可能存在性能问题。例如,某些操作可能导致数据在 CPU 和 GPU 之间频繁传输,极大地降低了训练速度。他致力于优化代码,避免不必要的同步,提高模型的训练效率。
他还探索了 CUDA 编程和 GPU 的底层架构,掌握了如何编写高效的 CUDA 核函数。他使用 Triton 等工具,允许开发者以类似 Python 的语法编写高性能的 CUDA 代码,简化了 GPU 编程的复杂性。
加入 Jane Street,面对新的挑战
最近,Sylvain 加入了 Jane Street 的机器学习基础设施团队,帮助交易员加速他们的模型。在金融领域,机器学习面临独特的挑战。市场数据具有非同寻常的规模和复杂性,数据的形状和大小与传统的机器学习数据集截然不同。此外,交易决策需要在极低的延迟下完成,对模型的推理速度提出了极高的要求。
Sylvain 与 Ron Minsky 进行了深入的讨论,探讨了如何优化学习率调度、避免 PyTorch 中的性能陷阱、如何保持 GPU 的高效运行,以及训练过程中再现性的重要性。他们还讨论了在金融领域应用机器学习所面临的特殊挑战,如市场数据的规模和形状,以及在极低延迟下进行推理的需求。
教育与分享
除了技术工作,Sylvain 还热衷于教育和知识分享。他曾是一名教师,深知教育的重要性。他参与了多个在线课程的制作,帮助更多的人了解机器学习。他还在内部培训中,帮助同事们更好地理解机器学习的原理和实践。
展望未来
Sylvain 的故事是一段充满激情和创新的旅程。从一名数学教师,到机器学习领域的专家,他的经历告诉我们,只要保持对学习的热情,不断探索,就能在自己热爱的领域取得卓越的成就。
注:本文基于 Sylvain Gugger 与 Ron Minsky 的对话整理而成,旨在分享 Sylvain 的职业旅程和他在机器学习领域的经历。
关于LLMQuant
LLMQuant是由一群来自世界顶尖高校和量化金融从业人员组成的前沿社区,致力于探索人工智能(AI)与量化(Quant)领域的无限可能。我们的团队成员来自剑桥大学、牛津大学、哈佛大学、苏黎世联邦理工学院、北京大学、中科大等世界知名高校,外部顾问来自Microsoft、HSBC、Citadel、Man Group、Citi、Jump Trading、国内顶尖私募等一流企业。欢迎加入知识星球获取内部资料。
