模型训练成本“平民化”，前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2_动态

7 月 13 日消息，gpt-2 是 openai 于 2019 年推出的模型，其训练费用一度为每小时 256 美元，那么 5 年过后的 gpt-4 时代，软硬件和数据的进步，是否意味着训练同一模型所需的时间和成本会随之减少呢？答案是肯定的。

据 tom's hardware 今日报道，前特斯拉 ai 总监、openai 联合创始人、项目开发者 andrej karpathy 使用 llm.c“重现”了 gpt-2，其成本降到了每小时仅 28 美元（代码网备注：当前约 204 元人民币），在短短 5 年内降低了近 90%。

模型训练成本“平民化”，前特斯拉 ai 总监 24 小时仅用 672 美元“重现”gpt-2

图源 pixabay

成本降低的主要因素，则是其使用了单个 8xh100 节点进行训练。此外，andrej karpathy 表示，llm.c 直接实现了 gpt 训练。“由于 llm.c 是用 c / cuda 直接实现的 gpt 训练，因此其要求非常之低 —— 不需要 conda 环境、python 解释器、pip 安装等。你只需启动一个云 gpu 节点，选择性地安装 nvidia cudnn、nccl / mpi，下载.bin 数据分片，编译并运行，几分钟内就能开始。”

他补充说：“然后等待 24 小时（28*24=672），就能生成关于‘安第斯山脉中会说英语的独角兽’的样本。”

据悉，llm.c 项目最初是作为一个教育视频的一部分，但很快变成了 karpathy 在遇到一些 pytorch 问题后从头开始构建的项目。

然而报道认为，硬件、软件和训练数据的进步并不意味着尖端 ai 训练的成本在下降。例如，anthropic ceo dario amodei 近期就表示，当前正在开发的 ai 模型可能需要 10 亿美元的训练成本，。

硬件性能的提高也伴随着成本的上涨。例如，英伟达 h100 芯片的单价为 4 万美元，下一代 blackwell ai 芯片的预计售价则可能达到 7 万美元。但即便如此，谷歌 deepmind ceo 曾表示，当前模型的智商水平仍然仅仅相当于一只猫。

商汤大语言模型应用 SenseChat 向香港用户免费开放，支持广东话聊天

Sensechat 基于商汤今年 5 月推出的“商量多模态大模型粤语版”，依托商汤“日日新”语言和多模态能力，以及对粤语及本地文化、热点的理解，用户可以直接用最熟悉的广东话跟它聊天…

2024年07月10日 • 人工智能

暴涨 8050%，富国银行预估 2030 年 AI 产业用电激增至 652 TWh

富国银行（Wells Fargo）预测今年 AI 用电需求为 8 TWh，而到 2030 年将激增到 652 TWh，将增长 8050%。 [阅读全文]

亚马逊 Echo Spot 智能音箱更新 2024 款：2.83 英寸屏幕，限时优惠价 44.99 美元

亚马逊凌晨推出了 2024 款 Echo Spot 智能音箱，该款音箱内置 2.83 英寸触摸屏、改善音质，同时去除了 2017 年前代产品的摄像头配置。…

2024年07月10日 • 人工智能

用户报告飞利浦 Hue 智能灯泡随机调至 100% 亮度：Matter 协议问题、下周内修复

据外媒 The Verge 报道，Signify 昕诺飞发现了 Matter 智能家居标准重随机的临时无线电通信中断会被错误地识别为传统开关的电源切换，将于下周... [阅读全文]

OpenAI CEO 阿尔特曼成立 AI 健康公司，要做私人个性化 AI 健康教练

赫芬顿邮报创始人阿里安娜・赫芬顿（Arianna Huffington）和 OpenAI CEO 萨姆・阿尔特曼（Sam Altman）宣布联合创办一家名为 T... [阅读全文]

调查显示，中国生成式人工智能普及率领跑全球

一项最新调查显示，中国在生成式人工智能的普及率方面处于世界领先地位，这表明中国在这项技术领域取得了长足进步。生成式人工智能因美国 OpenAI 公司于 2022... [阅读全文]


验证码：

验证码：

模型训练成本“平民化”，前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

2024年07月14日 • 动态 •我要评论

相关文章:

商汤大语言模型应用 SenseChat 向香港用户免费开放，支持广东话聊天

亚马逊 Echo Spot 智能音箱更新 2024 款：2.83 英寸屏幕，限时优惠价 44.99 美元

发表评论