当前位置: 代码网 > it编程>前端脚本>Python > 2024年从零学习AI和深度学习Transformer的路线图(非常详细)零基础入门到精通,收藏这一篇就够了

2024年从零学习AI和深度学习Transformer的路线图(非常详细)零基础入门到精通,收藏这一篇就够了

2024年07月28日 Python 我要评论
首先是代码,然后是理论。建议读者先看代码,后学理论~我出于需要还是喜欢学习?如果我要解决某件问题,我会广泛获取所需的信息、研究、理解它,然后采取行动。例如,我的目标是复现最新的模型(如盘古模型),这涉及到从头开始编写 Transformer 代码以及在 GPU 上微调的技能。我现在做不到这一点,因为在我的知识,我的目标是填补这些空白。或者你以 NLP 为重点;如果您正在寻找其他人工智能应用,例如计算机视觉或强化学习,可以在公众号下面发表评论或私信我,我会给你一些建议。

2024 年学习 ai 路线图

最近ai大热,相关的研究层出不穷。

你想学习ai吗?但您不知道如何或从哪里开始?

人工智能和深度学习是发展的趋势:

  • science 2023封面论文:chatgpt缩小了人们在写作能力上的差距

  • nature子刊nature machine intelligence也已经上线近三年了,每年接收文章不到100篇,影响因子达到16.65,表示着nature对人工智能方法的认可。

  • 2023年下半年,华为、英伟达、谷歌的天气系统预报大模型展现了强大的实力和统治力…

然而对于普遍的非计算机专业的朋友来说,这些技术变得越来越难,越来越不好掌握了!以前我们还能说“站在巨人的肩膀上”,现在回过头来看,人工智能发展得太快,巨人的肩膀也站不住了!

为了逃离铺天盖地的代码copy,你必须亲自动手,从头开始编写算法,实现论文,并使用人工智能解决问题来完成有趣的项目。

写在前面

首先是代码,然后是理论。建议读者先看代码,后学理论~

我出于需要还是喜欢学习?

如果我要解决某件问题,我会广泛获取所需的信息、研究、理解它,然后采取行动。

例如,我的目标是复现最新的模型(如盘古模型),这涉及到从头开始编写 transformer 代码以及在 gpu 上微调的技能。我现在做不到这一点,因为在我的知识,我的目标是填补这些空白。

或者你以 nlp 为重点;如果您正在寻找其他人工智能应用,例如计算机视觉或强化学习,可以在公众号下面发表评论或私信我,我会给你一些建议。

另外建议读者定期查看一些相关kaggle竞赛,这里有下游任务的最新模型与得分;也建议读者注册x账号(twitter),上面一些深度学习大牛会发布最新资讯;或者关注一些优质公众号。

目录

  • 数学基础

  • 工具

  • python

  • pytorch

  • 机器学习

  • 模型评估、算法学习

  • 从头开始编写第一个程序

  • 使用pytorch和scikit-learn

  • 深度学习

  • 一本"鱼书"入门深度学习

  • 计算机视觉

  • nlp

  • transformer

  • 多做竞赛

  • 大模型

  • 从零开始写transformer

  • 从零实施bert和transformer

  • 深度了解transformer相关模型

  • 模型微调

数学基础

机器学习在很大程度上依赖于数学的三大支柱:线性代数、微积分、概率和统计学。每个都在使算法有效运行方面发挥着独特的作用。

  • **线性代数:**用于数据表示和操作的数学工具包,其中矩阵和向量构成算法解释和处理信息的语言

  • **微积分:**机器学习优化的引擎,使算法能够通过理解梯度和变化率来学习和改进。

  • **概率与统计:**不确定性下决策的基础,允许算法预测结果并通过随机性和可变性模型从数据中学习。

一般而言,大学学到的高数足够应对了,尤其是考研生。

额外推荐一本线性代数书:introduction to linear algebra [introduction to linear algebra by gilbert strang.pdf](books/introduction to linear algebra by gilbert strang.pdf)

麻省理工学院英文原版教材《线性代数导论》

工具

主要是python和pytorch

python

初学者从这里开始:实用 python 编程。(https://dabeaz-course.github.io/practical-python/notes/contents.html)

书籍的话看这两本:

igurenameweb/bookdescription
蟒蛇书python编程:从入门到实践.pdfpython编程入门必备
python data science handbookpython数据科学手册.pdfpython数据科学手册(从numpy到sklearn)

如果您已经熟悉 python,可以学习python高级编程https://github.com/dabeaz-course/python-mastery?tab=readme-ov-file

pytorch

建议学习youtube的aladdin persson教程,非常系统,适合初学者,打开字幕几乎无门槛:

https://www.youtube.com/playlist?list=plhhyolh6ijfxeoooqp9rhu3hjiavaj3vz

也可以学习官方的pytorch示例:https://pytorch.org/examples/

书籍学习这一本:

image-20240427222333736

https://www.oreilly.com/library/view/programming-pytorch-for/9781492045342/

机器学习

一个100 页的机器学习书籍,入门读着玩,顺便学英语。https://themlbook.com/

再学习这个存储库,图文并茂,代码丰富,初学者友好~https://github.com/eriklindernoren/ml-from-scratch

从零开始机器学习

这个存储库也很棒!https://github.com/trekhleb/homemade-machine-learning

亲身体验数据和模型,这里有一些优秀的资源:

  • 使用 pytorch 和 scikit-learn 进行机器学习(代码)https://github.com/rasbt/machine-learning-book

  • [1811.12808]机器学习中的模型评估、模型选择和算法选择 https://arxiv.org/abs/1811.12808

  • 机器学习入门面试书·mlib https://huyenchip.com/ml-interviews-book/

使用pytorch机器学习书籍

深度学习

  • 用一本“鱼书”快速入门,可以看着玩~
figurenameweb/bookdescription
deep learning from scratch《深度学习入门:基于python的理论与实现》高清中文版.pdf鱼书,深度学习入门必备
  • 全面的课程:

françois fleuret的unige 14x050 — 深度学习。(每一章都有ppt和免费视频)https://fleuret.org/dlc/

深度学习课程

  • 深入研究深度学习(包含 pytorch、numpy/mxnet、jax 和 tensorflow 中的代码示例)https://d2l.ai/index.html

dive into deep learning

  • 在手机上阅读**《深度学习小册子》**https://fleuret.org/francois/lbdl.html

可以打印出来随身看

深度学习小册子

  • 自然语言处理

斯坦福大学的另一门精彩课程,cs 224n |深度学习自然语言处理 https://web.stanford.edu/class/archive/cs/cs224n/cs224n.1234/

youtube的优质免费nlp教程:nlp课程 https://huggingface.co/learn/nlp-course/chapter1/1

使用 transformers 进行自然语言处理图书:使用 transformers 进行自然语言处理图书 https://transformersbook.com/

大模型

  • 大语言模型

首先,观看 andrej 的 [ 1 小时演讲] 大型语言模型简介。https://www.youtube.com/watch?v=zjkbmfhnj_g

然后观看“神经网络:从入门到精通它从从头开始解释和编码反向传播开始,到从头开始编写 gpt 结束。

神经网络:从零到精通作者:andrej karpathy https://karpathy.ai/zero-to-hero.html

从头开始编写transformer。

阅读transformer 系列 2.0 版 | lil’log 的概述。https://lilianweng.github.io/posts/2023-01-27-the-transformer-family-v2/

从头开始学习。

论文

  • attention is all you need https://arxiv.org/abs/1706.03762

  • 图解transformer http://jalammar.github.io/illustrated-transformer/

  • 哈佛大学的带注释的transformer http://nlp.seas.harvard.edu/annotated-transformer/

  • 像transformer一样思考 https://srush.github.io/raspy/

博客

  • 从头开始创建 transformer — 第一部分:注意力机制(第 2 部分)(代码)https://benjaminwarner.dev/2023/07/01/attention-mechanism

  • 从头开始理解和编码大型语言模型的自注意力机制作者:sebastian raschka 博士 https://sebastianraschka.com/blog/2023/self-attention-from-scratch.html

  • 从零开始的transformer https://peterbloem.nl/blog/transformers

视频

  • 在 pytorch 上从头开始编写 transformer 代码,并提供完整的解释、训练和推理 https://www.youtube.com/watch?v=isndqcphsts&t=7449s

  • nlp:从头开始实施 bert 和 transformers https://www.youtube.com/watch?v=epa98fyxz-s&list=pldm8d_mwypjv2vkl7y2jniibru522tizc&index=9

您现在可以从头开始编写transformer代码。但还有更多。

一些不错的博客

  • 梯度下降到疯狂——从头开始建立神经网络 https://bclarkson-code.github.io/posts/llm-from-scratch-scalar-autograd/post.html

  • transformer插图 — jay alammar https://jalammar.github.io/illustrated-transformer/

  • 关于注意力和transformer的一些直觉作者:eugene yan https://eugeneyan.com/writing/attention/?curius=1935

  • llama 从头开始(或者如何不哭地实现一篇论文)|布莱恩·北野 https://blog.briankitano.com/llama-from-scratch/

  • 改进 lora:从头开始实现权重分解低秩适应 (dora) https://magazine.sebastianraschka.com/p/lora-and-dora-from-scratch

观看精彩视频

深入视频解释论文,展示了代码。

  • lora:大型语言模型的低阶适应 - 直观解释 + 从头开始的 pytorch 代码 https://www.youtube.com/watch?v=pxwyutmt-au

  • mistral / mixtral 解释:滑动窗口注意力、专家稀疏混合、滚动缓冲区 https://www.youtube.com/watch?v=uix8k-xbupe

  • attention is all you need (transformer) — 模型解释(包括数学)、推理和训练 https://www.youtube.com/watch?v=bcz4omemcca

  • llama 解释:kv-cache、旋转位置嵌入、rms norm、分组查询注意力、swiglu https://www.youtube.com/watch?v=mn_9w1ncflo

  • 检索增强生成 (rag) 解释:嵌入、句子 bert、向量数据库 (hnsw) https://www.youtube.com/watch?v=rhzgxndhwdy

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版csdn大礼包:《agi大模型学习资源包》免费分享

一、全套agi大模型学习路线

ai大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版csdn大礼包:《agi大模型学习资源包》免费分享

二、640套ai大模型报告合集

这套包含640份报告的合集,涵盖了ai大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对ai大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版csdn大礼包:《agi大模型学习资源包》免费分享

三、ai大模型经典pdf籍

随着人工智能技术的飞速发展,ai大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如gpt-3、bert、xlnet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些pdf籍就是非常不错的学习资源。

img
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版csdn大礼包:《agi大模型学习资源包》免费分享

四、ai大模型商业化落地方案

img

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版csdn大礼包:《agi大模型学习资源包》免费分享

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com