当前位置: 代码网 > 科技>人工智能>智能机器人 > 微调 LLaMA 2 模型:通过 QLoRA 充分利用单 GPU 效率 Meta LLaMA 2 微调过程综合指南

微调 LLaMA 2 模型:通过 QLoRA 充分利用单 GPU 效率 Meta LLaMA 2 微调过程综合指南

2024年07月31日 智能机器人 我要评论
科技巨头 Meta 于 2023 年 7 月 18 日发布了 LLaMA 2,这是他们最新版本的大型语言模型 (LLM),成为头条新闻。我相信 Llama2 在进一步推动人工智能技术方面取得了巨大飞跃,人们将关注私人领域未来对聊天机器人的微调将超过一般聊天机器人。1这些尖端模型从 2023 年 1 月到 2023 年 7 月在大量 2 万亿代币上进行了训练,在推理、编码、熟练程度和知识测试等各种基准测试中表现出了卓越的性能。

介绍

科技巨头 meta 于 2023 年 7 月 18 日发布了 llama 2,这是他们最新版本的大型语言模型 (llm),成为头条新闻。我相信 llama2 在进一步推动人工智能技术方面取得了巨大飞跃,人们将关注私人领域未来对聊天机器人的微调将超过一般聊天机器人。1

这些尖端模型从 2023 年 1 月到 2023 年 7 月在大量 2 万亿代币上进行了训练,在推理、编码、熟练程度和知识测试等各种基准测试中表现出了卓越的性能。这些模型提供三种不同的选项,参数大小为 7b、13b 和惊人的 70b,可免费用于商业和研究用途(英语)。

为了满足不同的文本生成需求并促进对这些模型的有效微调,meta 采用了 qlora(量化 llm 的高效微调),这是一种创新且高效的技术。qlora 涉及将预训练的 llm 量化为仅 4 位并合并小型“低阶适配器”。这种突破性的方法允许使用单个 gpu 来微调 llm,并得到 peft 库的支持。

对于我们的模型微调过程,我们将使用配备单个 gpu 的基于云的笔记本,确保平稳高效的操作。
强制性要求 为了有效地对 llama 2 模型进行微调过程,需要满足以下先决条件:

  • 请求访问 llama 2:在下载模型权重和分词器之前,请填写 meta 的表格以请求访问下一版本的 llama。请记住,使用 llama 2 须遵守 meta 许可协议,您必须接受该协议。
  • hugging face 帐户:您需要拥有一个 hugging face 帐户,该帐户的电子邮件地址与您在 meta 表单中提供的电子邮件地址相同。
  • hugging face token:获取 hugging face 令牌,这是身份验证所需的。
(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com