微调 LLaMA 2 模型：通过 QLoRA 充分利用单 GPU 效率 Meta LLaMA 2 微调过程综合指南_智能机器人

介绍

科技巨头 meta 于 2023 年 7 月 18 日发布了 llama 2，这是他们最新版本的大型语言模型 (llm)，成为头条新闻。我相信 llama2 在进一步推动人工智能技术方面取得了巨大飞跃，人们将关注私人领域未来对聊天机器人的微调将超过一般聊天机器人。1

这些尖端模型从 2023 年 1 月到 2023 年 7 月在大量 2 万亿代币上进行了训练，在推理、编码、熟练程度和知识测试等各种基准测试中表现出了卓越的性能。这些模型提供三种不同的选项，参数大小为 7b、13b 和惊人的 70b，可免费用于商业和研究用途（英语）。

为了满足不同的文本生成需求并促进对这些模型的有效微调，meta 采用了 qlora（量化 llm 的高效微调），这是一种创新且高效的技术。qlora 涉及将预训练的 llm 量化为仅 4 位并合并小型“低阶适配器”。这种突破性的方法允许使用单个 gpu 来微调 llm，并得到 peft 库的支持。

对于我们的模型微调过程，我们将使用配备单个 gpu 的基于云的笔记本，确保平稳高效的操作。
强制性要求为了有效地对 llama 2 模型进行微调过程，需要满足以下先决条件：

请求访问 llama 2：在下载模型权重和分词器之前，请填写 meta 的表格以请求访问下一版本的 llama。请记住，使用 llama 2 须遵守 meta 许可协议，您必须接受该协议。
hugging face 帐户：您需要拥有一个 hugging face 帐户，该帐户的电子邮件地址与您在 meta 表单中提供的电子邮件地址相同。
hugging face token：获取 hugging face 令牌，这是身份验证所需的。
接

2022年7月，李飞飞、PercyLiang等[1]提出“基础模型”(FoundationModels)的概念：基于自监督学习的模型在学习过程中会体现出来各个不同方面的能力，这些能…

2024年07月31日 • 人工智能

论文地址：https://arxiv.org/pdf/2405.04434传统Transformer采用MHA(Multi-Head Attention)，但是kv cache会…

2024年07月31日 • 人工智能

大厂面试中的算法题大部分情况是力扣原题，并且难度可控，对于经常在力扣刷题的同学一般问题不大。而大厂笔试的算法题则往往是原创题，前几道难度稍微简单，后几道通常得刷... [阅读全文]

详解STM32+MPU6050姿态解算—附3个算法源码—卡尔曼滤波+四元数法+互补滤波——可应用在无人机/平衡车/机器人等方面 [阅读全文]

当时鉴智机器人是最早面试的几个公司之一，所以体验并非很好，不出意外在二面阶段就挂了。暴露出的问题：对基础掌握不扎实，底层不够了解，优缺点也不够了解。亿嘉和的面试... [阅读全文]

当今社会，随着信息技术的迅猛发展，大学生们在学习过程中面临着各种各样的困难和挑战。而在这些挑战中，面对繁重的作业和复杂的题目，大学生搜题软件应运而生。 [阅读全文]


验证码：

验证码：