当前位置: 代码网 > 科技>人工智能>动态 > 模型训练成本“平民化”,前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

模型训练成本“平民化”,前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

2024年07月14日 动态 我要评论
前特斯拉AI总监、OpenAI联合创始人、项目开发者Andrej Karpathy使用llm.c“重现”了GPT-2,其成本降到了每小时仅28美元(IT之家备注:当前约 204 元人民币),在短短5年内降低了近90%。

7 月 13 日消息,gpt-2 是 openai 于 2019 年推出的模型,其训练费用一度为每小时 256 美元,那么 5 年过后的 gpt-4 时代,软硬件和数据的进步,是否意味着训练同一模型所需的时间和成本会随之减少呢?答案是肯定的。

据 tom's hardware 今日报道,前特斯拉 ai 总监、openai 联合创始人、项目开发者 andrej karpathy 使用 llm.c“重现”了 gpt-2,其成本降到了每小时仅 28 美元(代码网备注:当前约 204 元人民币),在短短 5 年内降低了近 90%

图源 pixabay

成本降低的主要因素,则是其使用了单个 8xh100 节点进行训练。此外,andrej karpathy 表示,llm.c 直接实现了 gpt 训练。“由于 llm.c 是用 c / cuda 直接实现的 gpt 训练,因此其要求非常之低 —— 不需要 conda 环境、python 解释器、pip 安装等。你只需启动一个云 gpu 节点,选择性地安装 nvidia cudnn、nccl / mpi,下载.bin 数据分片,编译并运行,几分钟内就能开始。”

他补充说:“然后等待 24 小时(28*24=672),就能生成关于‘安第斯山脉中会说英语的独角兽’的样本。”

据悉,llm.c 项目最初是作为一个教育视频的一部分,但很快变成了 karpathy 在遇到一些 pytorch 问题后从头开始构建的项目。

然而报道认为,硬件、软件和训练数据的进步并不意味着尖端 ai 训练的成本在下降。例如,anthropic ceo dario amodei 近期就表示,当前正在开发的 ai 模型可能需要 10 亿美元的训练成本,。

硬件性能的提高也伴随着成本的上涨。例如,英伟达 h100 芯片的单价为 4 万美元,下一代 blackwell ai 芯片的预计售价则可能达到 7 万美元。但即便如此,谷歌 deepmind ceo 曾表示,当前模型的智商水平仍然仅仅相当于一只猫

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com