百度、阿里、讯飞:国产AI与ChatGPT的较量,谁能胜出?

发表时间: 2023-09-06 22:31
在前段时间,ChatGPT风靡全球,凭借着其拟人化的写作能力,获得了大量关注,也正是其拟人化的写作能力,使得全球不少企业选择用AI来代替员工进行写作,使得不少文案方面的工作人员失业。
每次小编一看到国外相关行业进行裁员,小编心里就会一紧,都在私下悄悄关注科技美学最帅的男主播,看看他对于AI的看法,心里想着怎么才能打败AI。(甚至想捂住男主播双眼,不让他看!)
在今日,小编决定用魔法打败魔法,用国产AI聊天机器人来挑战ChatGPT,目前来看性能虽然不如ChatGPT,但这是中文写作比拼,国产AI在中文写作方面的能力应该不会差吧。
正巧这几天各厂商的AI产品获得了国家的许可,正在逐步的面市,我们就挑选了三款国产的AI来看一看,到底现在国产AI的输出的内容能否达到拿来就可用的标准?
我们此次选择的三款国产的AI,也是目前热度稍高的三款,分别为很早就开始公测的百度“文心一言”和最近公开的科大讯飞“讯飞星火”、阿里云“通义千问”,我们接下来测试结果顺序也是按照这个顺序进行公布。
(如若各位小伙伴还有其他的关注的国产AI产品,可以评论区告诉我们。)




信息查询



小编会向三款AI产品提出相同的问题,但是考虑到各家的大模型可能没有最新的消息,于是小编选择提出的问题是“华为Mate 40系列手机怎么样?”,来看看各家AI产品给出的结果。
(文心一言)
(讯飞星火)
(通义千问)
通过对比可以看到,基于百度搜索的文心一言是表现最好的,语句流畅、信息较为准确,内容也非常丰富。相比来看,通义千问比较简洁,同样有着不错的信息量,讯飞星火表现较差,基本没什么信息点。
但是小编注意到,三款AI产品均没能很好的识别提问中“系列”的意思,只是对其中一款产品进行了介绍。




文章扩写



我们将上述通义千问所给出的华为Mate 40手机的优点输入,要求三家厂商AI扩写成一篇800字的文章,我们再来看看表现。
(文心一言)
(讯飞星火)
(通义千问)
可以看到差别还是比较明显的,面对相同的扩写要求,文心一言和讯飞星火都有着不错的表现,两篇文章首先字数达到了要求,其中讯飞星火的表现要更好一些,整体文章的写法不生硬。
对比来看,通义千问表现稍差,很明显的字数并不够,整体写法也稍微生硬一些。




文章撰写



这个项目可以说是对AI能力的综合体现,作为一个文字类AI,收集信息并输出文章可以说是目前应用场景最广的一项功能。
(文心一言)
(讯飞星火)
(通义千问)
可以看到,三家均输出了符合字数标准的文章,文心一言的写作更像是信息的堆叠,但信息是非常全面的;讯飞星火方面对于信息的获取目前来看是不尽如人意的,在无法得知准确时间消息的时候甚至用“X”进行了替代;这次通义千问表现相对较好,输出了不少“主观”的评价,但相应的信息量也相对偏少。
通过上述简单的测试,我们可以看出,虽然三款AI产品是能够按照要求输出内容的,但是内容的写法以及信息的准确性仍有不少问题,有想要使用这些AI产品的小伙伴需要在使用前仔细的检查,但这反而会增加工作量与工作时长。
但是,不能否认的是这些AI是刚刚获得许可面向公众开放的AI产品,仍需要大量的时间和训练来完善自身的大模型,至于国产AI产品后续会有怎样的发展还需要感兴趣的小伙伴保持关注。

首销1199元起,iQOO Z8系列发布,两款处理器可选

超高热度!零售版华为Mate60 Pro开箱测试,4G还是4.999G?

iPhone15发布会 本月机皇大战序幕拉开