当前位置: 代码网 > 科技>操作系统>苹果Mac > 苹果牌“AI”官方详解:Apple Intelligence 本地 30 亿参数模型,云端基于苹果芯片服务器

苹果牌“AI”官方详解:Apple Intelligence 本地 30 亿参数模型,云端基于苹果芯片服务器

2024年06月12日 苹果Mac 我要评论
苹果承诺,在训练基础模型时,该公司从不使用用户的私人个人数据或用户交互,并且会使用过滤器来删除互联网上公开的个人身份信息,例如社会保障和信用卡号码。

6 月 12 日消息,苹果在昨日的 wwdc24 上重磅公布了 apple intelligence(苹果智能),将为 iphone、mac 等设备引入一系列 ai 功能。

随后,苹果机器学习官网公布了 apple intelligence 的详细信息。据苹果官方介绍,apple intelligence 拥有两个基础模型:

  • 本地模型:设备上约 30 亿参数的语言模型,测试得分高于诸多 70 亿参数的开源模型(mistral-7b 或 gemma-7b);

  • 云上模型:可通过私有云计算并在 apple 芯片服务器上运行的更大云端语言模型。

苹果表示,apple intelligence 由多个高性能生成模型组成,这些模型专门针对用户的日常任务,并且可以动态适应他们当前的活动。apple intelligence 中内置的基础模型针对用户体验进行了微调,例如编写和精炼文本、对通知进行优先级排序和总结、为用户与家人和朋友的对话创建有趣图像,以及采取应用内操作来简化应用之间的交互。

在预训练方面,苹果的基础模型在 axlearn 框架上进行训练,这是苹果于 2023 年发布的开源项目。它构建在 jax 和 xla 之上,使苹果能够在各种训练硬件和云平台上可扩展地训练模型,包括 tpu 以及云和本地 gpu。

代码网注意到,苹果承诺在训练基础模型时,该公司从不使用用户的私人个人数据或用户交互,并且会使用过滤器来删除互联网上公开的个人身份信息,例如社会保障和信用卡号码。苹果还过滤了脏话和其他低质量内容,以防止其包含在训练语料库中。除了过滤之外,苹果还执行数据提取、重复数据删除以及应用基于模型的分类器来识别高质量文档。

在优化方面,苹果在设备端模型和服务器端模型都使用了 grouped-query-attention,设备上模型使用 49k 的词汇大小,而服务器模型使用 100k 的词汇大小,其中包括额外的语言和技术标记。

通过优化,苹果号称在 iphone 15 pro 上,能够实现每个 prompt token 约 0.6 毫秒的首次 token 延迟,以及每秒 30 个 token 的生成速率

在指令跟踪评估(ifeval)测试中,苹果本地模型性能优于包括 phi-3-mini、mistral-7b 和 gemma-7b 等模型,且与 dbrx-instruct、mixtral-8x22b 和 gpt-3.5-turbo 相比毫不逊色;而云上模型水平基本与 gpt-4-turbo 持平。

苹果计划在今年夏天推出的 ios 18、ipados 18 和 macos sequoia 测试版中,开放 apple intelligence,然后会以测试版的形式,于今年秋季向公众开放,但部分功能、更多语言和平台支持需要等到明年。

apple intelligence 可以免费使用,但仅限于配备 a17 pro 芯片或任何 m 系列芯片的设备。这意味着要使用这些功能,你需要一部 iphone 15 pro 或 iphone 15 pro max,即将推出的 iphone 16 系列也将支持 apple intelligence。

在 mac 方面,你需要一台配备 m1 或更高版本的 mac,而对于 ipad,你需要一台配备 m1 芯片或更高版本的 ipad pro 或 ipad air

苹果 wwdc24 开发者大会主题演讲专题

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com