ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！_ar

你好，我是郭震！

这篇文章测评三个ai大模型能力：

常见生成对话式大模型app，除最早openai发布的chatgpt外，还有百度文心一言、谷歌bard等。

今天从代码生成角度，测评三大模型的能力。

为什么选择这个角度？

而不是其他角度？如写周报，写诗等。

因为这些能力怎么判断对错呢？没有统一、明确的评判标准，测评就不会客观了。

相反，代码生成能力不一样，错一点都不行，并且判断标准统一、明确，主要两点：

第一：代码正确解决问题
第二，稳定运行，无bug

明确测评标准后，找一个稍微有些测评技术含量的问题：python编写一个贪吃蛇游戏。

此游戏的实现逻辑相对复杂，即便有经验的程序员要想满足上面两点，一次写完通过也是很有难度的。我们看看机器的表现如何。

三大ai模型，全部使用各家最好模型。

1 chatgpt

首先问问chatgpt，这是其中部分回答截图：

复制代码到pycharm (python最常用的集成开发环境)中，运行结果如下所示：

玩玩游戏，看看有无bug，测试3次，结果表明：

1) 一次回复完整代码
2) 一次运行通过，程序正确实现贪吃蛇游戏（按键盘上下左右箭头，黑色方块会移动，当与淡绿色方块接触时，方块消失（被吃））
3）程序测试三次，无bug

2 文心一言

文心一言是百度大模型。提问它编写贪吃蛇游戏，返回的代码部分截图，共58行（写过贪吃蛇游戏的应该也知道，这些代码肯定不完整）

复制到pycharm中，运行代码，结果显示这样，很明显有问题，且无交互能力：

再给文心一言一次机会，重新生成一遍答案，这次与上次一样代码未写完就终止，这次生成59行终止，继续追问它，它回复未回答完：

稍微有些出乎意料第二次还没回答完，第三次回答终于完成。复制所有代码到pycharm，运行结果是这样，之后程序异常退出：

3 bard生成代码

bard是谷歌研发的大模型，同样问题提问它：

bard没有效仿chatgpt打字机的回复形式，而是思考片刻后，一下全部发我代码（最后部分代码截图），速度很快：

同样复制代码到pycharm中，第一眼竟然出现没有导入random模块：

我手写导入random模块，然后运行程序，贪吃蛇的界面出现两个不同颜色的小方块，1秒钟后程序闪退：

通过录制运行视频，截取帧，找到那转瞬即逝的一帧：

测试总结

1 chatgpt，一次生成代码，代码正确无bug
2 文心一言，三次生成代码，代码不正确
3 bard，一次生成代码，代码不正确

初步结论：chatgpt目前生成能力是最好的

chatgpt 2个月用户就破亿，也印证了这点，如果国内再能直接使用上，估计还会更快。

大家知道零基础学习某个技术，刚开始，难以判断生成答案对错。如果答案再有错误，那无疑会增加学习的难度。这就是如今为什么资料那么多，但是却迟迟无法真正掌握一门技术的重要原因之一。

学技术，认准一个最好的，保证在竞争中不输在工具使用上，这是对于我们个体而言，比较重要的一点！

最后说下个人看法，当今ai技术强如google，大家看到，他们的bard依然无法生成像chatgpt那样准确无误的代码。chatgpt确实独树一帜，其他大模型想超越它，难度不小。

你们觉得呢？欢迎留言

访问网址：http://zglg.work

或点击下面，阅读更多，登录小蜜蜂ai使用chatgpt

opencv warpPerspective透视变换实现原理与过程

opencv warpPerspective透视变换实现原理与过程 [阅读全文]

DevOps概念及搭建全过程（Jenkins、Harbor、SonarQube、K8s）

DevOps概念及搭建全过程（Jenkins、Harbor、SonarQube、K8s）…

2024年07月31日 • 游戏开发

kubernetes(1.28)配置flannel：kubelet无法拉取镜像(NotReady ImagePullBackOff)同时解决k8s配置harbor私人镜像仓库问题

k8s(≥1.25)配置flannel：kubelet无法拉取镜像(NotReady ImagePullBackOff)。同时解决k8s(≥1.25)配置harbor私人镜像仓库问…

2024年07月28日 • 游戏开发

在k8s中部署Elasticsearch高可用集群详细教程

本文详细介绍了如何在Kubernetes（简称K8s）环境中部署一个高可用的Elasticsearch集群。随着数据量的不断增长，Elasticsearch因其强大的全文搜索和数据…

2024年07月28日 • 游戏开发

HCCDA – AI华为云人工智能开发者认证-60道单选题题库及答案

A.边缘设备普遍特点是用途专业化固定化，低时延B.边缘设备功能比较单一，虽然可以扩展功能，但不会像云一样普适各种场景用途C.目前可见的边缘场景包括：基站，路由器... [阅读全文]

HarmonyOS NEXT Beta 版开发者及先锋用户招募（第一期）报名答题题库（持续更新中，仅供学习分享使用）

关于容器组件Row和Column，下面说法错误的是：B. Row容器主轴为水平方向，Column容器主轴为垂直方向。C. justifyContent用于设置子... [阅读全文]


验证码：

验证码：

ChatGPT，文心一言，Bard 到底哪家强？最新测评来了！

2024年07月31日 • ar •我要评论

相关文章:

DevOps概念及搭建全过程（Jenkins、Harbor、SonarQube、K8s）

kubernetes(1.28)配置flannel：kubelet无法拉取镜像(NotReady ImagePullBackOff)同时解决k8s配置harbor私人镜像仓库问题

在k8s中部署Elasticsearch高可用集群详细教程

发表评论