当前位置：代码网 > 科技>人工智能>aigc > LLama学习记录

LLama学习记录

2024年07月28日 • aigc •我要评论

学习前：五大问题：GQAKV-Cache。

学习前：

五大问题：

为什么swiglu激活函数能够提升模型性能？
rope位置编码是什么？怎么用的？还有哪些位置编码方式？
gqa（grouped-query attention, gqa）分组查询注意力机制是什么？
pre-normalization前置了层归一化，使用rmsnorm 作为层归一化方法，这是什么意思？还有哪些归一化方法？layernorm？
将self-attention改进为使用kv-cache的grouped query，怎么实现的？原理是什么？

embedding

embedding的过程：word -> token_id -> embedding_vector，其中第一步转化使用tokenizer的词表进行，第二步转化使用 learnable 的 embedding layer。

这里的第二步，不是很明白怎么实现的，需要再细化验证

rms norm

对比batch norm 和 layer norm：都是减去均值mean，除以方差var（还加有一个极小值），最终将归一化为正态分布n(0,1)。只不过两者是在不同的维度(batch还是feature)求均值和方差，（其中，减均值：re-centering 将均值mean变换为0，除方差：re-scaling将方差varance变换为1）。

参考知乎的norm几则

rope(rotary positional encodding)

绝对positional encodding的使用过程：word -> token_id -> embedding_vector + position_encodding -> encoder_input，其中第一步转化使用tokenizer的词表进行，第二步转化使用 learnable 的 embedding layer。将得到的embedding_vector 和 position_encodding 进行element-wise的相加，然后才做为input送入llm的encoder。

理解llm位置编码:rope

赞 (0)

相关文章:

一文搞懂Midjourney的全部指令

大家好，今天分享midjourney有哪些指令，都是怎么用的呢？跟着我的脚步走起~…

2024年07月28日 • 人工智能
Midjourney中文版到底是官方还是李鬼？

的官方公众号和社区，了解其最新的消息和活动，也可以参考其他平台和媒体的报道和评论，保持自己的独立判断和批判思维。的会员服务，享受更多的功能和优惠，但要注意保护自... [阅读全文]
Midjourney中文版测评，上手简单+免费

近期国内外不断有AI绘画模型推出，但依然无法撼动Midjourney的地位，不管在绘画准确度、多样性还是体验感方面，Midjourney无疑都是最好的，但Midjourney原始版…

2024年07月28日 • 人工智能
AI艺术创作：掌握Midjourney和DALL-E的技巧与策略

通过掌握Midjourney和DALL-E的使用技巧，您可以创造出独具个性的AI艺术作品。从基础操作到高级技巧，每一步都至关重要。希望这份详细指南能为您的创作之... [阅读全文]
【Midjourney】Midjourney 注册与使用 ( 下载并注册 Discord | 加入 Midjourney 服务器 | 创建 Discord 个人服务器 )

一、下载并注册 Discord二、加入 Midjourney 服务器三、创建 Discord 个人服务器…

2024年07月28日 • 人工智能
好用的 AIGC工具（ 6个）

现在智能化的AI工具，可以实现智能聊天、文本生成、语言翻译等多种功能。博主归纳总结了6个好用免费的AI工具网站，供大家参考。 …

2024年07月28日 • 人工智能

版权声明：本文内容由互联网用户贡献，该文观点仅代表作者本人。本站仅提供信息存储服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 2386932994@qq.com 举报，一经查实将立刻删除。

发表评论


验证码：

Copyright © 2017-2025 代码网保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱：2386932994@qq.com