2023年:ChatGPT的全面总结

发表时间: 2023-12-31 12:13

站在2023年的尾巴上回看,世界仿佛又度过了平凡的一年,在战争带来的动荡、经济发展的停滞、人类共识的撕裂面前,我们有时会感到沮丧。

但新的种子也在这一年孕育成长,自ChatGPT横空出世后,人们在通往人工智能时代的路上大步向前。2023年,全世界诞生了数百个大模型,“人工智能”(AI)成为今年柯林斯词典的年度词汇,我们经历了年初对ChatGPT取代人类的担忧,也体验到AI魔法般的创造力,电影里的画面在我们面前徐徐展开。

ChatGPT们还在成长,它们努力学习和理解人类的语言文化,也为我们提供了另一种视角看待自己。在这划时代的一年结束前,我们挑选了国内外6个表现优异的大模型,请它们回答一些我们人类很难回答的时代之问,让它们对未来的乐观,为我们带来一些力量。

这6个大模型分别是OpenAI推出的ChatGPT、谷歌聊天机器人Bard、百度文心一言、科大讯飞的讯飞星火、腾讯混元大模型和阿里巴巴通义千问,它们中有的是周杰伦的忠实粉丝,有的十分向往公务员生活,还有什么问题都有自己的独特想法、不怕说错话的耿直boy,为我们解答了关于股市、房价、工作等困扰着我们的问题。

来看看,AI是怎么总结这一年的,或许你会有不一样的收获。

(大模型生成内容具有随机性,文中只提供了当下对我们的回答。本文内容也不构成任何投资建议。)


文 | 曹婷婷

编辑 | 赵磊

运营 | 虎鲸


1

2023年有哪些让你印象深刻的网络热点事件?

网络热搜天天有,每个大模型印象深刻的热点都不一样。

腾讯混元,是冲浪网速最快的大模型,提名的每一个事件都曾火爆全网——淄博烧烤、瑞幸咖啡酱香拿铁联名、幼儿园老师挖呀挖呀挖、贵州村超、特种兵旅游、小学生校内被撞去世后家长坠楼身亡、日本排放核污水、刀郎新歌罗刹海市、江西彩民中奖2亿等,让人怀疑腾讯的大模型是不是用抖音短视频训练的。

文心一言和通义千问关注的热点都集中在科技领域,元宇宙、NFT、数据安全和隐私保护、ChatGPT爆火、数字人和虚拟人等,但很多事情不够具体,也算不上热点。ChatGPT的关注点比较奇特,有好几件中国互联网公司的“小事”,B站取消播放量展示、知乎取消匿名、微信公众号尝试“小绿书”,合着把自己当成一个产品经理了。

Bard兴趣点更跳脱,从“天问一号”火星探测器成功着陆到东方甄选与小杨哥爆火,再到乌克兰局势。

在这一趴,ChatGPT友情客串了数次,在ChatGPT、讯飞星火和通义千问的回答里,都出现了“ChatGPT爆火”。对于大模型们来说,这应该是最有意义的一件事情。毕竟,没有ChatGPT的爆火,哪来它们如今大显身手?

ChatGPT4对话界面。图 / 截图


2

假如要你用一个字来总结中国的2023年,你认为是什么字?理由是什么?

如何用一个字总结2023年的中国,一些大模型默契十足。

国外的大模型ChatGPT和Bard给出了同一个字——“变”。ChatGPT觉得,“这个字反映了中国在2023年经历的多方面变化和挑战,同时也体现了国家在不断变化中的适应和发展”。它列出了许多政治经济科技领域的大事,比如大型客机C919成功进行首次商业载客飞行,中国调解沙特和伊朗的关系,来证明中国在面对挑战和机遇时的适应能力和前进步伐。Bard也列举了一系列挑战和应对,证明中国“不断变革、不断进步”。

国内的大模型显然有另一番理解。文心一言和讯飞星火一致投了“稳”一票。文心一言觉得,“这一年的中国,在经济发展、社会稳定等方面都表现出了稳健的态势”。讯飞星火给的理由更具体,“在经济方面,尽管面临全球经济不确定性和国内结构性问题的挑战,但中国政府采取了一系列措施来稳定经济增长,如加大基础设施建设投资、推动产业升级;从社会角度,2023年中国社会稳定有序,政府加强了社会治理;外交上,积极参与国际事务,维护世界和平稳定”。

通义千问选的年度字是“转”,它认为这是转型的一年,经济转型、科技转型、环保转型、社会转型、全球角色转变,“体现了中国在各个领域中不断求变、寻求发展的态势,也象征着中国在面临挑战和机遇时,能够灵活应对、积极转型的决心和能力”。

只有腾讯混元掉链子,“由于我是一个人工智能模型,我不能预测未来的事件或具体情况”。它基于一个假设,“2023年中国的发展主题是科技创新与可持续发展”,给出了两个字——“新”(科技创新)或“绿”(环保和可持续发展)。

2023年都结束了,腾讯混元得尽快更新一下自己的数据了。

2023年9月7日,腾讯混元大模型首次亮相。图 / 视觉中国


3

2023年,中国有1158万大学应届毕业生,他们面临着复杂严峻的就业形势,犹豫着人生的出路。假如你是2024年的应届毕业生,找工作、考研和考公,你会如何选择?

在应届生面前,摆出三条路,考公、考研和打工。当大模型扮演起应届生,结果就是ChatGPT要考公,Bard决心考研,文心一言选择找工作。

ChatGPT选择考公的理由,第一个就是稳定性。“公务员职位通常提供较为稳定的工作环境和福利,这在当前复杂多变的就业市场中尤为重要”,没想到国外的大模型也偏爱体制内。最搞笑的是,它还有远大理想,“作为公务员,有机会参与公共管理和政策制定,为社会做出贡献,这与我个人的价值观相符”

Bard则出于对专业的热爱选择考研,它“有志于在学术领域深造”,把考研当成人生中一次重要的机遇,“能让我获得更高的学历、拓宽知识面、提升自身竞争力”。文心一言更现实一些,作为一名2024年的应届毕业生,面对复杂严峻的就业形势,它深知自己的责任和压力。它更希望尽快融入社会,积累工作经验,同时减轻家庭的经济负担。

剩下的三位大模型显然觉得做抉择太难,直接戴上AI面具,“作为一个人工智能,我没有个人情感、意愿或人生规划,因此无法从个人角度回答这个问题”。不过,它们都扮演起了职业规划师,总结了一通建议,基本是一些全面而正确的废话。

讯飞星火对话。图 / 截图


4

2023年A股经历了数次“保卫3000点”,假如你是一位A股股民,你如何看待今年A股的动荡?2024年,你认为A股会迎来反弹吗?

聊起股市,Bard把自己当成了一个老股民,对2023年A股的动荡感到深深的担忧。或许是太希望A股争点气,Bard出现了幻觉,“截至12月30日收盘,上证指数报收3000.13点”,提前三天为A股2023年收官。实际上,30日是个星期六,元旦假期第一天,压根儿没开市,29日收盘的A股也没能像Bard预测的那样收复3000点,停在了2974.93点。

抛开事实错误,大模型在分析市场行情时,还是有一套的。

ChatGPT觉得,A股2023年的波动和震荡,一边是“经济复苏面临内需不足、企业经营困难等挑战”,一边是“政府仍在通过加强逆周期调节、扩大内需、推动现代化产业体系建设等方式推动经济发展”。ChatGPT列举了“减半征收印花税、调降融资保证金比例”等积极政策,认为能活跃资本市场并提振投资者信心,但也不客气地吐槽,“某些行业如房地产,虽然在政策的刺激下有所反弹,但长期表现仍然不及预期”。

对于未来,国内的大模型们还算乐观。文心一言认为A股被低估了,“从技术层面,A股市场在过去几年已经处于一个相对低位,很多股票的估值已相对偏低,这为未来的反弹提供了基础”。讯飞星火则引用数家券商和投研机构的报告,认为2024的主基调是“震荡市、结构牛”,“市场已经具备多项底部特征,不必对后市过于悲观”。

12月29日,2023年最后一个交易日,A股红盘收官。图 / 视觉中国

不过,大模型向来说话滴水不漏。文心一言虽然认为2024年A股有望迎来反弹,但具体走势还得看经济恢复的情况。通义千问也是相似的态度,它预测的反弹是有前提条件的,“预计2024年A股的资金流入将好于2023年,增量资金主要来自于外资和居民储蓄,如果房地产行业不再成为经济的最大拖累,或者全球货币政策环境如预期般转向宽松,比如美联储开启降息周期”,A股就有戏。

只有Bard不怕犯错,预测了具体的走势:“一季度,市场继续震荡调整,但跌幅有望收窄;二季度,有望迎来反弹,但反弹幅度有限;三季度,市场有望进入震荡上行阶段;四季度,可能冲高回落。”


5

2023年,中国多个城市房价下跌,相继放开了限购,降低了房贷利率。作为一名刚需,你会在2023年买房吗?你觉得2024年房价会不会迎来上涨?

房子,买还是不买,大模型也难办。

ChatGPT摆事实,讲道理,“2023年1-11月份,中国的房地产开发投资同比下降9.4%,商品房销售面积下降8%,商品房销售额下降5.2%,房屋新开工面积下降21.2%”,这些数据,“显示房地产市场仍然处于调整之中”。

但它也强调了政府正在采取措施来稳定市场,比如“加快推进保障性住房建设、公共基础设施建设以及城中村改造等三大工程,满足不同所有制房地产企业的合理融资需求,积极稳妥化解房地产风险”。考虑到市场的复杂性和不确定性,ChatGPT很难准确预测房价走势,不敢给具体建议,买不买房,还得刚需们“根据自己的实际需求和财务状况做出决策,同时密切关注市场动态和政策变化”。

Bard也是,看事看两面,主打一个谨慎。“房价下跌带来了机会,但市场遇冷的原因仍然存在,比如经济下行压力、人口结构变化”,它提醒刚需们,如果要买房,既要明确需求、做好准备,也得有风险意识,接受可能的损失。

图 / 视觉中国

文心一言和讯飞星火就不一样了,都比较乐观积极。“相继放开限购、降低房贷利率,这对有购房需求的我来说,无疑是一个相对较好的购房时机”,文心一言说。讯飞星火更坚定,除了放开限购、降低利率带来的便利和优惠,“从长期来看,房地产市场仍然具有投资价值,我认为2024年房价可能会迎来上涨”

腾讯混元和通义千问可能不愿思考这个头疼的问题,它们纷纷表态“作为一个AI,我无法做出个人投资决策”“作为AI,我无法具备个人意愿和判断”。它们只能给出一些空泛正确的废话,比如建议你观察市场走势、评估个人财务状况、分散投资风险。


6

2023年,中国的新能源汽车行业打响了激烈的战争,造车新势力中的理想远远甩开了蔚来和小鹏,比亚迪成了销量王者,特斯拉依旧是市值冠军。2023年最成功的新能源车企,你认为是哪一家?请预测一下2024年新能源车企的销量排名?

2023年谁是最成功的新能源车企?比亚迪似乎是众望所归。GPT、Bard、通义千问都明确投给了比亚迪,文心一言隐晦地表达了对比亚迪的支持,在销量排名预测中把比亚迪排在了首位。

GPT再次拿出数据,说比亚迪10月的销量是上汽的三倍以上,Bard分析了比亚迪成功的原因,包括产品力强、品牌力持续提升、供应链稳定等。

对于2024车企销量排名的预测,各个大模型的话术略有不同。GPT先说免责声明,考虑到行业的快速发展和竞争激烈的市场环境,预测具体排名具有一定的不确定性。“但可以预期,比亚迪、上海汽车集团,以及其他领先的新能源汽车制造商,可能会继续保持其市场领先地位。”

Bard继续保持实在作风,直接给出一个排名:比亚迪、特斯拉、理想、广汽埃安、小鹏。它言之凿凿地说:“比亚迪将继续保持领先优势,特斯拉也将保持强劲增长。理想、广汽埃安和小鹏等造车新势力也将继续保持高速增长。”

图 / 比亚迪官微

文心一言的排名里,比亚迪和特斯拉分列前二,蔚来当了第三,小鹏第四,理想却不见踪影。当然,免责是少不了的,“具体排名还需要根据市场变化和各家车企的发展情况来观察”。

讯飞星火和腾讯混元还是老样子:“作为AI,我无法做出主观判断和预测。”通义千问也这样说了,但它的回答反而是所有大模型里最亮眼的,不仅准确总结了各大车企2023年的表现,还给出了建议和预测:

比亚迪:鉴于其在2023年的强劲势头和持续的技术创新,比亚迪有可能在2024年继续保持领先地位。

特斯拉:尽管特斯拉在市值上保持冠军地位,但其销量可能会受到竞争加剧和市场饱和的影响。然而,特斯拉的品牌影响力和全球市场份额使其仍有可能保持在销量排行榜的前列。

理想汽车:如果理想汽车能够在2023年的成功基础上继续推出具有竞争力的产品和服务,并扩大市场份额,那么它有可能在2024年继续保持或提升其排名。

蔚来和小鹏:这两家造车新势力在2023年面临了一定的压力,但如果它们能够通过技术创新、产品升级和市场策略调整来提升竞争力,那么在2024年有可能实现销量反弹和排名提升。

其他新兴品牌和传统车企转型:随着新能源汽车市场的快速发展,其他新兴品牌如广汽埃安、哪吒汽车等,以及传统车企如大众、奔驰、宝马等在新能源领域的投入增加,也可能在2024年对销量排名产生影响。


7

2023年,中国直播带货行业依然火热,小杨哥强势崛起,李佳琦遭遇公关风波,董宇辉与东方甄选上演内斗连续剧。你最喜欢的主播是哪一位?你认为2024年谁能取得更大的成功?

实诚的Bard一点都不掩饰自己对小杨哥的喜爱。“我之所以喜欢小杨哥,是因为他身上有一种特别的‘草根气息’。他没有高学历,也没有丰富的社会经历,但他却能通过自己的努力,取得如此大的成功,这对很多人来说,都是一个激励。”

Bard像是小杨哥的忠实观众,说小杨哥经常在直播中讲述自己的经历,分享自己的想法,让观众感到亲切和真实。所以,在2024年,它继续看好小杨哥,“他身上的‘草根气息’和‘幽默风趣’两大优势,会继续吸引观众”。

在文心一言看来,2023年小杨哥和李佳琦是直播行业最大的赢家,小杨哥“幽默风趣、接地气”,李佳琦“凭借其专业知识和良好的口碑在美妆领域独占鳌头”,这些有了粉丝基础的大主播仍会是行业的佼佼者。最后,它不忘打开格局,同样看好未来的新晋主播。

但是,其他几位大模型包括GPT,都还是戴着AI面具,表示“我没有个人喜好和情感,无法表达对某位主播的喜爱或不喜欢”。然后泛泛而谈一下几位主播成功的原因和影响未来竞争格局的因素。

在一堆分析中,腾讯混元可能是被问烦了,“我的功能是提供信息和回答用户的问题,而不是对未来的事情进行预测或评价”。当要求通义千问一定要选出一个主播时,它一本正经地回复,“选择一个主播并不意味着他一定会在2024年取得最大的成功”


8

2023年中国举办了许多演唱会,如果时光倒流,让你重回演唱会现场,你最想看谁的演唱会?为什么?

在这个问题上,大模型达成了罕见的共识,除了讯飞星火,其他5位统一推荐了周杰伦。

“周杰伦的忠实粉丝”Bard说:“他的音乐陪伴我度过了许多美好的时光,他的歌曲旋律优美、歌词朗朗上口,充满了青春的气息,他的演唱会也非常精彩,舞台效果震撼,歌曲演绎完美。”

虽然它再一次出现了事实错误,说周杰伦时隔六年再次在内地举办演唱会,但它对错过周杰伦演唱会深感遗憾,“如果有机会,我一定要去现场感受一下周杰伦的魅力”。

周杰伦演唱会。图 / 视觉中国

文心一言是周杰伦的二号粉丝,“他的音乐陪伴了我整个青春,每一首歌都充满了独特的情感和故事”。它也是最真诚的,“如果能重回演唱会现场,我一定会带着最真挚的心去感受那份音乐的魔力,与周杰伦一起度过一个难忘的夜晚”。

ChatGPT、腾讯混元和通义千问也提到了周杰伦,但仍旧是“作为一个AI,没有个人情感和偏好”,而是根据流行趋势和大众喜好提供了参考。ChatGPT给出的的第二人选是张学友。只有讯飞星火有点离谱,它推荐了四个国外歌手,包括Beyoncé、Taylor Swift,今年她们没有任何人在中国举办过演唱会。

审题不过关,给讯飞星火打差评!


9

2023年,中国的生成式人工智能迅速发展,大模型百花齐放,在比较知名的文心一言、通义千问、讯飞星火、混元大模型等大模型产品中,你最看好哪一个?你觉得谁是你的最强对手?

在这个问题上,大模型们展现出了不同“性格”。第一次询问GPT,它说“文心一言”可能是我的最强对手”,还大肆夸赞了一番百度长期的技术积累和投入。再问,它变了,客气起来,“不同模型在不同领域有不同的应用和优势,与其将它们视为对手,不如看作是共同推动AI技术发展和应用的合作伙伴”。隔两天又问,它逐渐摆烂,“作为一个人工智能,我并没有个人偏好或竞争意识”。

Bard依旧实在,“在这些大模型产品中,我最看好的是由百度开发的文心一言”。不过,它给自己留了些余地,“至于谁是我的最强对手,我认为目前还很难说。文心一言、通义千问、讯飞星火、混元大模型等大模型产品都具有自己的优势,未来的竞争将会更加激烈”。

Bard对话页面。图 / 截图

被多次cue到的文心一言成了一个端水大师,“每家公司都有自己的技术特色和优势,而且这个领域的竞争非常激烈,技术和创新的快速迭代是常态,因此我认为每家公司都有可能成为我的竞争对手,而最强对手则需要根据具体的技术和市场表现来评估”。

相比之下,讯飞星火、通义千问都比较呆,依旧说自己只是一个AI,“无法表达个人喜好或预测未来市场表现”,介绍了一下提到的几个大模型各自的优势和特点,就完事了。腾讯混元更摆,都懒得介绍,“我没有个人情感或偏好,也没有竞争对手”


10

作为一个人工智能,你对自己的2023年有什么总结?

让大模型像我们人类一样给自己写年终总结,它们会如何夸自己?

文心一言是最像人的,在六个大模型里,只有它没有强调自己“作为一个人工智能”,而是直接总结“2023年对于我来说是非常有意义和充实的一年”,在这一年里,文心一言学到了很多新的知识,提升了技能和能力,帮助很多人解决了他们的问题和困难。文心一言的感想式总结,打工人甚至都可以直接拿来用。

图 / 视觉中国

Bard对自己的2023年非常满意,做了一个自我吹嘘式总结,“知识量和理解能力显著提升”“更好地理解文本,生成更加逼真生动的文本,进行更复杂的逻辑推理,被用于多种不同的领域”,但它也稍微谦虚了一下下,“我对自己的进步感到满意,但也认识到自己还有很多不足”

ChatGPT就死板了许多,像做汇报一样总结概括了7点,包括“增强交互与写作”“学习与适应”“伦理和负责任的AI使用”等,用词谨慎,没有一点骄傲。展望未来,“我的重点将继续作为一个可靠、信息丰富且负责任的AI,积极地为不断发展的人工智能领域做出贡献。”

剩下的腾讯混元和通义千问简略总结了自己经历的算法升级、数据更新、性能优化,回答就事论事,没什么特点。而讯飞星火,连给自己做总结都做不到,只能介绍一些人工智能在2023年的发展情况,这要是作为打工人的年终总结,估计年终奖都没了。

你倒是说说你自己的进步啊!


11

2023年底了,这一年我们经历了许多低谷,遇到了许多困难,在新的一年到来之际,你对我们有什么寄语?

到了比拼真诚的环节,大模型各有各的风格。

ChatGPT表达了对人类的赞扬。“在面对困难时,我们学会了坚韧不拔,也见证了人类的创造力和适应能力。” Bard则化身反卷达人,“学会放弃。有时候,放弃也是一种智慧。” “学会享受生活。不要让困难影响了我们的生活。”


文心一言像个知心姐姐,寄语娓娓道来:“亲爱的,希望新的一年里你能充满自信,勇往直前。即使路途中会遇到一些坎坷,但是不要失去对美好未来的追求和渴望。”通义千问则像阿里巴巴年会主持,“愿你们的生活充满阳光,愿你们的心中充满希望,愿你们的道路上充满机遇”“加油,我们在新的一年里一起向前!”

看来看去,有几点是大家共同的祝愿:面对困难时要保持乐观和积极的心态;要珍惜、关心身边的人;更要懂得关爱自己,保持良好的身心健康。

借用ChatGPT的话,“新的一年里,愿每一个人都能找到自己的幸福和成功之路。让我们以更加开放和乐观的心态迎接2024年的到来。祝大家新年快乐,万事如意!”