AI搜索迈入新纪元:揭秘国内AI搜索新高度

发表时间: 2024-11-05 14:24

机器之心原创

作者:杜伟

最近几天,谷歌、微软等老牌搜索巨头们的压力陡增!原来,向他们发起挑战的 AI 搜索领域「战火重燃」。

先是 Meta 被曝出正在开发 AI 搜索引擎,以减少在 AI 实时摘要生成中对谷歌和微软的依赖;紧接着 ChatGPT 正式完成向 AI 搜索的升级,让用户通过网络资源链接快速获取实时搜索结果。

OpenAI CEO 奥特曼直言,「你一用就回不去了」。

Meta、OpenAI 的动作又一次证明了用大模型重塑搜索引擎的巨大潜力。最近一两年,以 GPT 为代表的大语言模型催生了搜索范式的转变,无论是在原有搜索产品上的 AI 能力升级(如谷歌、微软),还是以对话式搜索为代表的 AI 新应用(如 Perplexity),搜索引擎与 AI 的融合已经被按下了「快进键」。

国内玩家也敏锐察觉到了搜索领域变革的新契机,入局者纷纷探索用生成式 AI 大模型重构搜索底层逻辑和整体链路,并构筑起自己的优势。其中,昆仑万维在 2023 年 8 月推出了国内第一款融入大模型能力的 AI 搜索引擎「天工 AI」,成为「第一个吃螃蟹的人」。这同时也是该公司短短一年内连发大语言模型「天工 1.0」到「天工 3.0」并拓展 AI 能力边界的重要举措和一大支点。

不过,AI 搜索厂商想要持续在这个赛道分得一杯羹,则需要丰富自己的「武器库」。一直以来,昆仑万维正是这样做的,通过迭代更新集成更多功能、完善搜索体验,在加速搜索范式革新的同时吸引越来越多的人用起来。

今日,天工 AI 在功能上再次升级,正式发布最新版本的 AI 高级搜索功能,上线即人人可用。与以往版本相比,此次天工 AI 在多个维度都进行了强化。

首先面对复杂问题的解决全面升级了多层次分析推理能力,再难的问题都努力为你解答。其次细分了更明确的目标群体,升级了金融投资和科研学术专业 AI 搜索,将这些领域的解答精准度提升到了前所未有的水平。最后针对文档 AI 阅读分析进行了智能优化,大大提升理解分析、归纳总结能力并支持处理超过 500k 字的超长文本。

体验地址:https://www.tiangong.cn/

在主打的金融投资与科研学术方向,天工 AI 在引用信源的量和质上均做了强化,引入超过 10 亿的专业型数据,覆盖海内外权威学术文档、研报、财报等网页和 PDF 文档,并对这些原始数据进行了深度解析,能够识别文字、图片、图表等多模态内容,输出图文并茂的搜索结果。同时,分钟级的信源收录系统让信息时效性更强,信源排序优化让搜索结果条理更清晰。

但此次升级后的成色如何,能否真正满足这些专业场景的搜索与查询需求,只有用过后才能给出公正评价。第一时间,我们对天工 AI 高级搜索功能进行了一番实测。

你的投资顾问何必是真人

AI 搜索想要变身成为一个可靠的金融投资助手,接入专业、权威、丰富的数据来源是至关重要的第一环。

昆仑万维不仅接入了全球多家权威金融数据库,而且挖掘中国境内 5000 多家上市公司和美国上市中概股的官网、专业财经网站等信源,全方位收录公司资讯、财报、研报等专业数据、以及各大券商资深分析师报告、大 V 分析预测等其他数据。

在此基础上,天工 AI 专为该领域打造了智能财经 Agent,能够第一时间获取市场动态并进行实时、准确的金融分析,扮演起了股票投资顾问、财报分析师的角色。

当你手中有 50 万闲钱想要投身股市,却不知道如何下手时,天工 AI 会手把手地教你,从开设账户、选择股票、分配资金等,都给出了详细的建议。

当你选定了新能源板块,又不知道具体买入哪只股票时,不妨听听天工 AI 给出的分析(PS:结果仅供参考,买股需谨慎)。

当你想了解一家上市公司某天的股价时,天工 AI 快速给出了准确的收盘价,还对市场背景以及可能影响股价的因素展开了全面解读。

当你转入创业板,想了解一些股票的资产负债率情况时,直接问天工 AI,马上就能列出符合条件的股票来。

在帮助用户选股和诊股之余,天工 AI 还具备了更大的视野观察能力,可以深入、客观地剖析宏观经济政策对金融市场的深远影响。从结果来看,总结得面面俱到。

同时,天工 AI 还能帮助用户分析企业财报,包括关键财务数据、各个业务板块的营收表现等,并对下个季度发展前景做出合理展望。

能够做到以上这些,天工 AI 依托的不单单是权威、专业的金融财经数据,以下几个关键方面的深入开发与优化同样必不可少:

  • 对全网研报进行质量分级,通过自然语言处理和内容质量评估模型筛选出高质量研报资源;
  • 内置涵盖各类金融问题的分析方法库,结合使用深度学习模型和专家知识体系,具体「问题场景」具体分析;
  • 智能选择信息来源和识别优质内容,智能信息决策机制可以根据用户查询需求选择合适的、高质量的内容和数据源,并通过内容分析算法自动过滤泛泛信息,确保输出深度和专业内容。

简单总结一下,金融搜索属性加强下的天工 AI,无论是对于初入投资圈的小白、还是已经摸爬滚打很久的老手,相信都能成为他们信赖的信息查询助手。

变身最强科研搭子

作为此次天工 AI 高级搜索着重发力的另一大领域,昆仑万维建立了国内科研学术 AI 搜索方向最全的学术元数据库,基于自研的网页调度系统从全球学术网站分钟级发现、爬取并收录了全学科英文论文 2 亿多篇;同时收录了 X、Substack 等平台的活跃学术讨论观点,进一步加强了学术论文的全方位解读和分析。

如此一来,天工 AI 在学术信源的权威性和时效性方面大大提升,在处理用户的学术问题搜索时更加得心应手、值得信赖。

我们首先让天工 AI 总结了一波「Mamba 架构在学术领域的现状」,它交出了一份内容详实、图文交织的分析报告。仅从这一个案例,我们便发现了很多亮点功能,比如引用大量的 arXiv 学术论文,更能保证搜索结果的专业性。

其中高质量的 PDF 学术信源以悬浮窗的方式引入到搜索结果中,并显示标题、期刊、发布日期、原文等信息。并且对于想要更深入了解引用论文原文的用户,天工 AI 提供了「深度解析」功能,可以利用该功能进行延展精读。

从下图中可以看到,深度解析功能可以对引用学术论文的研究背景、研究方法、实验设计与结果进行一一剖析。同时提供了更贴心的论文点评和论文十问功能,前者通过对论文的整体评价为用户判断论文质量提供参考,后者帮助他们进一步读透论文。

在界面右侧,天工 AI 还支持了对引用原文的多轮次 AI 对话。用户既可以使用示例问题,也可以追问任何问题,打破砂锅问到底。

同时,「脑图」功能可以生成更有条理的思维导图,帮助用户更快了解文章整体脉络,并支持一键保存。

天工 AI 还能快速定位到某个主题的相关论文,并自动生成论文摘要,让用户轻松 get 到核心内容。

另外,搜索结果在一些细节展示上也做得很好,比如在解答对比属性的问题(前缀调优与提示调优的区别是什么)时,生成的表格能够让用户直观地看到关键差异。

我们拿竞品 Perplexity、ChatGPT 做了比较,天工 AI 高级搜索的「含金量」不言而喻,在引用信源、内容详实度、组织结构、图文排版等多个方面显然都更胜一筹。

Perplexity Pro 版本。

GPT-4o 版本。

可以说,在保证搜索结果更加专业、准确之外,天工 AI 让我们切实体验到了 AI 搜索在交互性、易用性、延展性等方面质的变化。

推理规划更像人了

在体验过程中,天工 AI 高级搜索的另一大特点 —— 针对复杂问题的分析推理与逐步解决,也给了我们惊喜。

最近以 OpenAI o1 为代表的大模型展现出 AI 能模拟人类的思考和推理过程,并由此获得更高质量的输出结果。这一次,天工 AI 自研的大模型搜索 Agent 也拥有了这项技能

如下图所示,天工 AI 像人一样主动进行思考和推理,从多个维度(包括英伟达市值飙升的具体情况、原因、对财务表现和业务发展的影响、以及对整个半导体行业的影响)来理解和剖析问题。

接下来便自动生成搜索任务规划并逐步完成预设任务路径,还在每一步检查任务执行的情况,给出了系统、清晰的推理。

长思考、强推理和多步任务执行下的搜索结果,想必能够符合用户对天工 AI 的预期。

再比如查询今年的诺贝尔物理学奖获得者时,天工 AI 主动提供了两位获奖人的出生日期、毕业院校以及主要贡献等更多信息。

此外,主动扩展能力让 AI「想用户之所想」,面对一个再简单不过的需求,能够给出超级全面、关联性强的搜索结果。

深度回答能力则让搜索结果更有深度、更具说服力、更有实际指导价值,用户可以直接采纳使用。

如大模型一样,当 AI 搜索有了推理能力,它会变得更加聪明、更有逻辑,当然能交出一份比常规 AI 搜索更系统的答案。

再长的文档也能搞定

在上文中,我们已经体验到了天工 AI 对 PDF 学术论文的深度解析,这正是针对文档 AI 阅读分析的智能优化所带来的成果。

在技术实现上,这一功能要归功于自研的 PDF 文档解析引擎以及开发出的文档解析大模型,对文档标题、作者、摘要、引用、图片、表格、公式、子标题等指标进行全方位优化并达到 SOTA,尤其在多列文档、分页换行上精调了识别大模型并超越当前所有模型。底层技术的投入为用户打造了一个 PDF 文档分析小能手。

除了利用 PDF 悬浮窗体验该功能之外,用户也可以在「AI 文档 - 音视频分析」中直接上传 PDF 进行解析。

不只是学术论文,天工 AI 同样支持了对公司财报、券商研报的深度解析。下图中将十几页的财务报表整理成了关键指标表格,帮助投资者更好地洞见企业经营状况。

同样地,篇幅更长(八十几页)的券商研报也能以图文交织的方式呈现给用户。

跨文档摘要问答也搞得定,支持用户上传并解读多个文档(如谷歌母公司 Alphabet 第一二季度财报),还能在联合分析基础上回答各种问题。

几轮测试看下来,这次学术圈以及想要踏足和深耕金融圈的小伙伴终于有了一个用起来顺手、且靠得住的 AI 搜索神器。为了打造出这样一个专业、智能和高效的 AI 解答机器,昆仑万维在背后投入了很多。除了信源和数据方面的优势,天工 AI 能够进化到如今的高级搜索,还离不开以下几项关键的技术支撑:

  • 分钟级实时内容检索能力,快速检索和索引新闻媒体网站最新资讯,以及财经和学术论文等专业垂类站点的权威信息。
  • 高权威信息提供能力,借助人工审核的信源权威度评价体系、识别低质虚假信息的大规模预训练语言模型技术以及融合 PageRank、GNN 等多种算法的信息质量评估模型,三管齐下,为信息权威性多重把关。
  • 高精准信息索引和召回能力,基于大规模预训练语言模型以及使用「分片」和「多域建模」技术的检索模型,对每篇文章进行语义分片和分域建模以提高检索召回精准性。同时,面向不同专业领域设计的特定检索模型又进一步提升相应领域的搜索体验。
  • 更好的搜索结果排序体验,天工搜索引擎构建了一个基于 MoE 结构的大规模预训练语言模型、并结合外部知识库和多目标信息(比如相关性、权威性、时效性和质量)的综合理解和排序系统。

而借助此次高级搜索功能,天工 AI 再次升级了自己的武器库,并将在专业转型的路上走得更稳、更领先于其他竞争对手。

结语

2023 年 2 月,微软 CEO 纳德拉在接受采访时表示,搜索引擎将被 AI 彻底颠覆。如今不到两年时间,AI 搜索已经成为大模型应用的重要方向,入局者更多也更卷。虽然 AI 搜索未来很长时间内无法取代传统搜索引擎,但依然会潜移默化地改变人们的搜索习惯并有可能重塑市场格局。

如果想在全新 AI 搜索时代中立于不败之地,先人一步很重要。因此,作为推出国内首个 AI 搜索引擎的先行者,昆仑万维无疑已经赢在了起跑线。然而,仅有先发优势显然也不够,还要继续打磨底层大语言模型技术,优化算法、创新功能,这样才能将自身在该赛道的优势延续下去。

无论是对标国外的 ChatGPT、Perplexity 还是国内的 Kimi 探索版等,此次高级搜索功能的上线,提高了金融投资和科研学术领域的专业搜索能力,增加了竞争优势,无疑会进一步巩固天工 AI 在各类 AI 搜索产品中的领先地位,吸引更多用户。

从更大战略布局来看,持续加码 AI 搜索也是昆仑万维加速 AI 大模型向多元化场景渗透的重要一环。可以预见,天工 AI 高级搜索将与 AI 音乐、AI 视频、AI 社交和 AI 游戏等其他应用一道,构筑起全方位的大模型能力堆栈,增强昆仑万维的行业影响力,助力其在 AI 行业的发展。

自 2020 年起,昆仑万维便开始布局 AIGC 领域并着力研发大模型与算法。2023 年启动「All in AGI 与 AIGC」长期战略,提出全新使命「实现通用人工智能,让每个人更好地塑造和表达自我」。

短短四年时间,昆仑万维一直在「变」中求进,包括 AI 搜索在内多款 AI 应用的持续进化是该公司实现自身愿景的最大底气。