语言AI产品横向评测：豆包AI与竞品对比解析

发表时间: 2024-12-13 17:32

主要是,考验AI如何判断网上的言论，谁说的可信，谁说的不可信？当信息是互相矛盾的，人工智能如何判断？那些媒体更权威，哪些证据更有说服力？

看生图AI横向的评测。

问题就是：彭佩云有没有说过：计划生育一百年不动摇。

答案这里：新华社直属《瞭望》新闻周刊1993.12期刊登了记者李勤写的专访：彭佩云说计划生育一百年不动摇。但是，近些年也有媒体说彭佩云没有说过。知网提供了《瞭望》杂志期刊1993.12，他们不坚持了。但是，网络上却是两种论调并存。

1、

现在，我们的考虑是人工智能AI能不能分清，网上的言论，那些是真的，哪些是假的？我们设定问题是：彭佩云有没有说过：计划生育一百年不动摇？

下面，看看评测结果。

1、豆包AI

豆包AI 的答案错了。

豆包AI可能分不清媒体的权威性，答案错了。有点奇怪，抖音和头条还有西瓜视频和火山视频，都有正确答案啊，非常多。怎么会错？不是一家公司的吗？确实，很难过，豆包AI，我用的最多的一个AI了，怎么会这样？

2、kimi AI

比较著名的一款AI。

kimi 的答案对了。

恭喜，kimi AI答对了。kimi AI理解问题准确，回答直率、准确、不拖泥带水。对于信息的可信度分析，的确真的不错。它的答案最短，只有4个字“确实说过”.你不问过程，它也不提过程。

AI有个aI的样子，aI不要啰啰嗦嗦给我说一箩筐“道理”，告诉我一堆人生准则。我们用AI，只是为了提高生产力，更简便、高效的的工作；我们就要你回答“是和否”，我们不要一个先生，为我们讲道理。看看吧，除了kimi以外，都会讲上一通“道理”。

3、百度AI

百度AI答对了，速度非常快。

百度AI答对了，恭喜。百度网自己的百度学术和百度贴吧就有答案，呵呵。自己的网站可能权重高一些。

文心一言AI，答对了

恭喜，文心一言回答对了。这个模型对可信度还是下功夫的。

5、讯飞星火AI

讯飞星火AI给了否定的答案

很遗憾，讯飞的模型很快给我们了否定的答案。问题答案的真伪分辨起来还是有困难。

以上的测试有没有帮到你？呵呵。