大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享
昨天早上看到了相关的报道,谷歌昨天发布了 "号称最强的大模型" gemini,还是熟悉的字眼、还是熟悉的配方。之前谷歌一直在 aigc 的竞争相对于微软的 openai 全方位处于下风,即使前段时间推出了对标 chatgpt 的 bard、对标 gpt-4 的 palm2,当然,实际情况是没有 "标过"。这次,外界期待已久的谷歌大语言模型 gemini 来袭,从定位来看应该是之前谷歌大模型 palm2 的替换者或者说升级版,目标就是打落长期 "霸占" 神坛的 gpt-4。
现在各大平台都在鼓吹 "性能最强大模型 gemini 来袭",这确实有些许 "鼓吹之意",可能用 "谷歌最强大模型" 会更加合适。虽然 gemini 的测试报告显得特别强,但是你真的是否足够强大,永远不是只停留在 benchmark 测试上就行,而是需要体现在用户的实际使用体验上,特别是对于现在的大模型,尤为如此。好用,你才强。
记得谷歌在今年的 google i/o 上发布 palm2 的时候,"社会舆论" 也是差不多现在这个基调,当时也是号称 "最强语言模型 palm2 来袭、bard 能力跃升" 之类的词眼。但是几个月过去了,gpt-4、chatgpt 依旧风光不减,而反观谷歌的 palm2、bard,真有点 "风声大雨点小" 的意思了。
而这次的 gemini 和 gpt-4 不太一样,gpt-4 总的来说是走的语言大模型 llm 路线,然后 "按需" 加入多模态,而谷歌的 gemini 是原生多模态打造。因为 "原生多模态",所以 gemini 多模态能力应为更强、融合度更高,而这也体现在了 gemini 的评测报告中,涉及自然图像、音频和视频理解、数学推理任务等,可以说是挑了些 gpt-4 "不太硬" 的地方猛攻,主打差异化。gemini 要是在这几个方面 "起不来",那就真完了,palm2 就是前车之鉴。
这次发布的 gemini 为 1.0 版本,分为 ultra、pro、nano 三个版本,基本可以对应到 云、边(云边)、端 三层算力结构,可谓全场景覆盖了。特别是 nano 版本,它侧重于端侧的处理能力,而这对于大模型的广泛落地至关重要。之于 gemini 的推出,全新的 bard 也会搭载 gemini 大模型,以再次对标 chatgpt。而又考虑到 gemini 的 ultra 和 pro,大概率以 ultra 版本驱动的 bard advanced (对标 chatgpt-4) 会是收费版本,而以 pro 版本驱动的 bard 会是免费版本 (对标 chatgpt-3.5),nano 估计会开放用于推广。但是这种模式,我觉得对于现在的谷歌处境来说不太靠谱,现在的谷歌处于弱势,"挤牙膏" 的方式并不适合,需要全面碾压才行,所以最好的做法就是对于全部免费使用,这样对于每月化 20 刀的尊贵的 chatgpt-4 用户估计会有大部分会倒戈 bard advanced。当然,"免费" 的意思是 bard-a 免费,但 api 可以收费,先保证 to-c 的普及。
目前的 bard 其实是搭载的 gemini pro,还没上 gemini ultra 版本,而据谷歌消息,将会在明年推出由 gemini ultra 驱动的 bard advanced 预览版,而这才会是搭载谷歌 llm 或者更应该说是 mllm 最强大、功能最全面的 bard 版本 (其实明年已经不远啦)。大家现在可以做的比如一些 bard 和 chatgpt-4 的对标测试,使用的还不是最完整形态的 bard,所以这种对比只能看出个一二,不能看出个所以然。来个 "阴谋论",从某种角度来说,我甚至觉得这可能是谷歌使用的 "一些小伎俩",就是不把最强的放出来,就是要让大家去猜去讨论,先攒几个月热度,提高对自身 bard、对自身 gemini 的关注度,待到明年热度减褪,再放出 gemini ultra,浇油点火。
以上还不是最关键的,最关键的在于即使你能跟 chatgpt-4 打个平手,甚至是超越 chatgpt-4,那又怎么样呢。openai 的最强大模型可不至 gpt-4,gpt-4 是于 2023 年 3 月 14 日发布的,到目前已经快过去九个月了,按照 openai 的迭代速度,手里肯定还握着下个更强版本的大模型已经在做各种安全测试,包括但不至于之前透露的 q* 模型。这个意思就很像在 ai 芯片领域,咱们的国产 ai 芯片努力地、拼命地造芯去追赶英伟达,好不容易赶上 t4 的性能了,但回过头来发现已经落后了好几代,而且差距是越来越大。而反观谷歌 gemini,如果 openai 在谷歌放出 gemini ultra 之前升级了 gpt-4,那谷歌就很尴尬了,只能说一切皆为商业。
所以,在大模型领域、在 aigc 领域,我还是会更看好 openai,更看好 chatgpt。
【极智视界】
《深度解读 | 搭载谷歌最强大模型gemini的bard能否赶上chatgpt》
发表评论