月之暗面 Kimi 开放平台“上下文缓存”开启公测：首 Token 延迟降低 83%、适用于文本重复引用场景_科技创新

7 月 1 日消息，月之暗面今日官宣 kimi 开放平台上下文缓存（context caching）功能开启公测。官方表示，该技术在 api 价格不变的前提下，可为开发者降低最高 90% 的长文本旗舰大模型使用成本，并提升模型响应速度。

代码网附 kimi 开放平台上下文缓存功能公测详情如下：

据介绍，上下文缓存是一种数据管理技术，允许系统预先存储会被频繁请求的大量数据或信息。当用户请求相同信息时，系统可以直接从缓存中提供，无需重新计算或从原始数据源中检索。

适用场景

上下文缓存适用于频繁请求，重复引用大量初始上下文场景，可降低长文本模型费用，提高效率。官方表示费用最高降低 90 %，首 token 延迟降低 83%。适用业务场景如下：

上下文缓存收费模式主要分为以下三个部分：

cache 调用增量 token 的收费：按模型原价收费
cache 调用次数收费：cache 存活时间内，用户通过 chat 接口请求已创建成功的 cache，若 chat message 内容与存活中的 cache 匹配成功，将按调用次数收取 cache 调用费用。0.02 元 / 次

新版阿里云盘整体设计风格相对于老版，更加精简，功能入口得到统一，之前采用的「备份盘」和「资源库」分开设计再次得到统一，三方应用权益包在该版本未上线。…

2024年06月28日 • 科技创新

此前华为手机用户在使用 HiCar 智行连接车机后，手机端将自动限制刷新率为 60Hz。此次更新刷新率限制开关后，用户可手动选择是否限制手机屏幕最高刷新率。 [阅读全文]

该应用的 alpha 版本可在 Windows 或 Linux（包括 Steam Deck）上使用，计划后续支持 macOS。 [阅读全文]

至像科技是国内第一个完成开发并上架公测的纯血鸿蒙打印机 App，获得“智慧办公最具发展合作伙伴”荣誉称号以及 HarmonyOS 创新赛二等奖。 [阅读全文]

智慧助手 App 是华为推出的手机系统级服务软件，支持服务卡片添加使用，以及话费充值、生活缴费等常用服务功能快捷入口。 [阅读全文]

消息源 @Leopeva64 昨日（7 月 3 日）发布推文，表示 Canary 频道的 Microsoft Edge 浏览器已经移除了“关注该创作者”（Fol... [阅读全文]


验证码：

验证码：