深度解读 | 搭载谷歌最强大模型Gemini的Bard能否赶上ChatGPT_Java

大家好，我是极智视界，欢迎关注我的公众号，获取我的更多前沿科技分享

昨天早上看到了相关的报道，谷歌昨天发布了 "号称最强的大模型" gemini，还是熟悉的字眼、还是熟悉的配方。之前谷歌一直在 aigc 的竞争相对于微软的 openai 全方位处于下风，即使前段时间推出了对标 chatgpt 的 bard、对标 gpt-4 的 palm2，当然，实际情况是没有 "标过"。这次，外界期待已久的谷歌大语言模型 gemini 来袭，从定位来看应该是之前谷歌大模型 palm2 的替换者或者说升级版，目标就是打落长期 "霸占" 神坛的 gpt-4。

现在各大平台都在鼓吹 "性能最强大模型 gemini 来袭"，这确实有些许 "鼓吹之意"，可能用 "谷歌最强大模型" 会更加合适。虽然 gemini 的测试报告显得特别强，但是你真的是否足够强大，永远不是只停留在 benchmark 测试上就行，而是需要体现在用户的实际使用体验上，特别是对于现在的大模型，尤为如此。好用，你才强。

记得谷歌在今年的 google i/o 上发布 palm2 的时候，"社会舆论" 也是差不多现在这个基调，当时也是号称 "最强语言模型 palm2 来袭、bard 能力跃升" 之类的词眼。但是几个月过去了，gpt-4、chatgpt 依旧风光不减，而反观谷歌的 palm2、bard，真有点 "风声大雨点小" 的意思了。

而这次的 gemini 和 gpt-4 不太一样，gpt-4 总的来说是走的语言大模型 llm 路线，然后 "按需" 加入多模态，而谷歌的 gemini 是原生多模态打造。因为 "原生多模态"，所以 gemini 多模态能力应为更强、融合度更高，而这也体现在了 gemini 的评测报告中，涉及自然图像、音频和视频理解、数学推理任务等，可以说是挑了些 gpt-4 "不太硬" 的地方猛攻，主打差异化。gemini 要是在这几个方面 "起不来"，那就真完了，palm2 就是前车之鉴。

这次发布的 gemini 为 1.0 版本，分为 ultra、pro、nano 三个版本，基本可以对应到云、边(云边)、端三层算力结构，可谓全场景覆盖了。特别是 nano 版本，它侧重于端侧的处理能力，而这对于大模型的广泛落地至关重要。之于 gemini 的推出，全新的 bard 也会搭载 gemini 大模型，以再次对标 chatgpt。而又考虑到 gemini 的 ultra 和 pro，大概率以 ultra 版本驱动的 bard advanced (对标 chatgpt-4) 会是收费版本，而以 pro 版本驱动的 bard 会是免费版本 (对标 chatgpt-3.5)，nano 估计会开放用于推广。但是这种模式，我觉得对于现在的谷歌处境来说不太靠谱，现在的谷歌处于弱势，"挤牙膏" 的方式并不适合，需要全面碾压才行，所以最好的做法就是对于全部免费使用，这样对于每月化 20 刀的尊贵的 chatgpt-4 用户估计会有大部分会倒戈 bard advanced。当然，"免费" 的意思是 bard-a 免费，但 api 可以收费，先保证 to-c 的普及。

目前的 bard 其实是搭载的 gemini pro，还没上 gemini ultra 版本，而据谷歌消息，将会在明年推出由 gemini ultra 驱动的 bard advanced 预览版，而这才会是搭载谷歌 llm 或者更应该说是 mllm 最强大、功能最全面的 bard 版本 (其实明年已经不远啦)。大家现在可以做的比如一些 bard 和 chatgpt-4 的对标测试，使用的还不是最完整形态的 bard，所以这种对比只能看出个一二，不能看出个所以然。来个 "阴谋论"，从某种角度来说，我甚至觉得这可能是谷歌使用的 "一些小伎俩"，就是不把最强的放出来，就是要让大家去猜去讨论，先攒几个月热度，提高对自身 bard、对自身 gemini 的关注度，待到明年热度减褪，再放出 gemini ultra，浇油点火。

以上还不是最关键的，最关键的在于即使你能跟 chatgpt-4 打个平手，甚至是超越 chatgpt-4，那又怎么样呢。openai 的最强大模型可不至 gpt-4，gpt-4 是于 2023 年 3 月 14 日发布的，到目前已经快过去九个月了，按照 openai 的迭代速度，手里肯定还握着下个更强版本的大模型已经在做各种安全测试，包括但不至于之前透露的 q* 模型。这个意思就很像在 ai 芯片领域，咱们的国产 ai 芯片努力地、拼命地造芯去追赶英伟达，好不容易赶上 t4 的性能了，但回过头来发现已经落后了好几代，而且差距是越来越大。而反观谷歌 gemini，如果 openai 在谷歌放出 gemini ultra 之前升级了 gpt-4，那谷歌就很尴尬了，只能说一切皆为商业。