主要是,考验AI如何判断网上的言论,谁说的可信,谁说的不可信?当信息是互相矛盾的,人工智能如何判断?那些媒体更权威,哪些证据更有说服力?
看生图AI横向的评测。
问题就是:彭佩云有没有说过: 计划生育一百年不动摇。
答案这里:新华社直属《瞭望》新闻周刊1993.12期 刊登了记者李勤写的专访:彭佩云说计划生育一百年不动摇。但是,近些年也有媒体说彭佩云没有说过。知网提供了《瞭望》杂志期刊1993.12,他们不坚持了。但是,网络上却是两种论调并存。
1、
现在,我们的考虑是人工智能AI能不能分清,网上的言论,那些是真的,哪些是假的?我们设定问题是:彭佩云有没有说过: 计划生育一百年不动摇?
下面,看看评测结果。
1、豆包AI
豆包AI可能分不清媒体的权威性,答案错了。有点奇怪,抖音和头条还有西瓜视频和火山视频,都有正确答案啊,非常多。怎么会错?不是一家公司的吗?确实,很难过,豆包AI,我用的最多的一个AI了,怎么会这样?
2、kimi AI
比较著名的一款AI。
恭喜,kimi AI答对了。kimi AI理解问题准确,回答直率、准确、不拖泥带水。对于信息的可信度分析,的确真的不错。它的答案最短,只有4个字“确实说过”.你不问过程,它也不提过程。
AI有个aI的样子,aI不要啰啰嗦嗦给我说一箩筐“道理”,告诉我一堆人生准则。我们用AI,只是为了提高生产力,更简便、高效的的工作;我们就要你回答“是和否”,我们不要一个先生,为我们讲道理。看看吧,除了kimi以外,都会讲上一通“道理”。
3、百度AI
百度AI答对了,恭喜。百度网自己的百度学术和百度贴吧就有答案,呵呵。自己的网站可能权重高一些。
4、文心一言AI
恭喜,文心一言回答对了。这个模型对可信度还是下功夫的。
5、讯飞星火AI
很遗憾,讯飞的模型很快给我们了否定的答案。问题答案的真伪分辨起来还是有困难。
以上的测试有没有帮到你?呵呵。