过去这一年,全球涌现出了众多生成式AI产品。在这篇文章中,我们将探讨这些工具的表现,通过实际体验和评估,为读者提供一个关于当前AI工具的全面视角。
2023年,AI技术迎来了其发展史上的一次重大飞跃。随着技术突破和令人瞩目的产品陆续亮相,AI不仅成为了技术界的焦点,也深深吸引了资本的目光。这一年,AI展现出了前所未有的发展势头,无论是在基础模型能力、实际应用场景,还是资本投入方面都取得了显著进展。
特别是在2022年11月30日,OpenAI发布了ChatGPT,标志着AI技术的一个新纪元。紧接着,在2023年1月,ChatGPT的月活跃用户数突破1亿大关,创下了历史新高,彰显了全球AI市场的爆发潜力。
伴随这股势头,全球范围内涌现出众多创新的生成式AI工具,它们按功能可以划分为:文本生成、图像创作、音视频处理等多个类别。在这篇文章中,我们将探讨这些工具的表现,通过实际体验和评估,为读者提供一个关于当前AI工具的全面视角。
2023年3月15日,OpenAI宣布推出GPT-4,这标志着大型语言模型进入了一个新阶段。相较于前代产品GPT-3.5,GPT-4不仅在处理自然语言方面取得了显著提升,而且在多语言处理能力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大拓宽了其应用范围。
ChatGPT-4的用户界面呈现了现代化和直观的设计风格,其简洁的设计语言和优化的用户操作流程极大地便利了用户与系统的交互。界面的清晰度和直观性使得用户即便是初次使用,也能轻松上手。
作为商业化应用的初代大型语言模型,ChatGPT-4在专业知识获取、文案生成、上下文理解等方面表现出色。答案的完整性和连贯性同样值得称赞。然而,最近的使用体验中发现模型在生成答案时偶有不稳定现象,可能与OpenAI目前的资源分配有关。
不过,总体来说,ChatGPT-4在提供高效、准确回答方面依然表现卓越。
阿里巴巴旗下的通义系列包含多款AI大模型,如通义千问(语言模型)、通义万相(艺术创作模型)、通义听悟(音视频模型)和通义智文(AI阅读助手),它们在多个领域如电商、设计、对话和法律分析中发挥着重要作用。
平时工作生活中使用的较多的是通义千问、通义万相、通义听悟、通义智文几种,帮助我获取整理专业知识,获取灵感以及快速阅读:
界面体验:
通义千问拥有简洁而一致的页面布局,提供沉浸式的问答体验。界面无过多修饰,专注于核心功能,使用户更易于集中注意力在问题与回答上。
使用感受:
在语义理解和答案准确度方面,通义千问表现优异,尤其在处理千字以内的查询时,回答流畅且无明显间断。
界面体验:
万相的界面以深色模式为主,突出了图片生成区域,同时提供了关键词选项,便于用户快速进行创作。
使用感受:
虽然在人物图像创作方面表现较好,但在抽象图标和文本引导的图片生成方面仍有提升空间。图片细节处理方面也存在一定的挑战。
一个非常好的在线会议、视频学习、播客学习等音视频转文字并且整理以及摘要的平台。
界面体验:
听悟的界面设计强调智能感,功能入口明确,降低了用户学习成本。其功能覆盖了视频转录、实时解析等多种场景。
使用感受:
界面体验:
智文的界面简约,主要聚焦于阅读体验。
使用感受:
阅读场景覆盖全面,对于电子书籍,智文能够提供准确的全文摘要和章节总结,极大地提高了阅读效率。(移动端推荐 “Cubox” 对于间断的公众号、网页文章体验不错,就是需要付费体验摘要、问答等 AI 能力)
所属公司:北京昆仑万维科技股份有限公司 发布时间:2023年7月5日 榜单:#15 数据来源:点点数据
天工AI是由奇点智源和昆仑万维联合开发的一款综合型大模型平台,它集成了搜索、对话和创作等多种功能。
Kimi Chat是Moonshot AI推出的一款功能丰富的工具,专注于整理资料、处理文件和提供快速网址访问。它在简化日常工作流程方面展现出了显著的优势。
文心一言,作为百度研发的全新一代知识增强大语言模型,不仅在对话互动上表现出色,还在问题解答和创作协助方面提供了高效的帮助。该模型特别擅长文案生成和润色,以及帮助用户制定计划和获取信息。
讯飞星火是科大讯飞推出的新一代认知智能大模型,它凭借其跨领域的知识库和语言理解能力,为用户提供自然对话方式的任务理解和执行。这一模型不断从海量数据中学习,致力于解决问题的全流程闭环,从提出问题到规划解决方案。
讯飞星火的界面设计遵循了AI大模型的常规布局,提供了沉浸式的问答体验。界面简洁,无过多修饰,便于用户专注于与模型的交互。
智普清言,由智谱AI公司在2023年训练的GLM-4语言模型,是一款基于深度学习技术的自然语言处理模型。通过学习大量文本数据,它能够理解和生成自然语言,针对用户问题和需求提供适当的答复和支持。
Gemini 是 Google 推出的原生多模态大模型,Google 称 Gemini 是其历史上最强大、最通用的模型,在许多基准测试中都具有最先进的性能。Google DeepMind 的 CEO Demis Hassabis 称 Gemini 可以像人类一样理解我们周围的世界,并吸收任何类型的输入和输出,包括文本、代码、视频、音频和图像。Gemini 模型从大到小分为 Ultra,Pro,Nano 三个版本。其中 Pro 版本已经整合到谷歌的 Bard 平台中,但目前仅支持英文地区的用户使用。
Claude是Anthropic开发的一款人工智能聊天机器人,Claude可以理解自然语言并生成相应的回复,和人类进行基本的对话与交流,相比其他大模型语言更加人性化,Claude具有一定的情感理解能力,可以从对话中解析出对方的情绪变化和态度,并在一定程度上调整自己的回应语气。Claude的知识和理解能力还比较有限,它更类似于一个知识图谱+搜索引擎,可以在已有知识上快速匹配和检索信息,但还无法进行复杂的推理或深入分析。
Perplexity AI是一个先进的AI工具,专注于提供深入的、以问题为中心的搜索和分析。它通过理解和分析用户的查询,提供相关和深度的答案,不仅仅是传统搜索引擎的结果列表。
Poe(Platform for Open Exploration)是由Quora开发的一个人工智能聊天机器人平台。这个平台汇集了多种AI聊天机器人,如ChatGPT、Sage、Dragonfly和Claude,使用户能够与它们进行互动并获取信息。
所属公司:春田智韵(抖音) 发布时间:2023年8月24日 榜单:#3 数据来源:点点数据
AI工具“豆包”是由抖音集团推出的一款免费的智能对话和创作助手。它基于云雀大模型,可以实现文本生成、图像生成、语音交互等多种功能。
PopAI 是一款由美国人工智能公司 PopAI Inc. 开发的 AI 工具,它基于 GPT-3 大模型,可以帮助用户进行内容创作,也可以帮助用户阅读和理解现有内容。用户可以上传各种格式的文档,包括 PDF 文件。
ChitChop是抖音集团发布的一款人工智能辅助工具海外产品,可为用户提供多达200+智能机器人服务,通过提供创意灵感、提高工作效率来服务用户的工作和生活。它是基于Skylark大语言模型创建的AI工具集合。
腾讯混元大模型是腾讯公司推出的一款基于Transformer架构的预训练语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens。具有强大的自然语言处理能力。它能够理解和生成人类语言文本,同时支持多语言,为开发者提供了丰富的API接口和工具,方便集成到各类应用中。
混元大模型的用户界面简洁直观,优化的用户操作流程极大地便利了用户与系统的交互。界面的清晰度和直观性使得用户即便是初次使用,也能轻松上手。
360智脑大模型是由360自行研发的AI大语言模型。它规模庞大,参数达到千亿级别,使其具备了跨模态生成的能力。它能够处理各种形式的数据,包括文字、图像、语音和视频等,因此在文本生成、图像生成以及文本到视频的转换等多个领域都能发挥重要作用。
除了上述详细评测的主要工具外,还有许多值得一提的AI工具在特定领域展现出了独特的价值。这里简要介绍一些我个人认为非常出色的平台:
2024年注定是AI产业快速发展的一年,也是AI工具逐渐普及的一年。这些工具不仅能提升我们的工作效率,处理复杂任务,也正在逐步改变我们的日常生活和创作方式。从大型互联网公司到智能手机制造商,都在积极布局AI市场,推出了众多具有创新性和实用性的AI功能和应用。我们有理由相信,未来AI将在更多领域展现其独特的价值和影响力。
回顾2024年AI领域的发展,我们见证了从大型语言模型到多模态工具的飞速进步。这些AI工具不仅为专业人士带来了前所未有的便利,也逐渐渗透到了我们日常生活的每个角落。
本篇文章中,我尝试评测了市面上的一些主流AI工具,从ChatGPT-4的深度交互到通义系列的广泛应用,再到Gemini等工具的创新能力。每一款工具都以其独特的方式对我们的工作方式和思维模式产生了影响。
值得一提的是:这些工具仍在不断进化。随着技术的发展和市场需求的变化,我们可以期待未来它们将带来更多惊喜和可能性。同时,我们也应警惕这些工具可能带来的挑战,如信息安全和隐私保护等问题。
总体而言,2024年标志着AI技术的一个新里程碑。除了各大互联网公司研发各类大模型平台,手机厂商也在投入大量的资源去布局 AI 市场。并且去年各大手机已经推出了一些 AI 智能功能:像我们 OPPO 推出了通话摘要、智能消除、合影优化等智能、实用且广受好评的功能。今年我们也将推出基于 OPPO 自研大模型有关于图像创作、通话以及办公等场景的一系列便捷、实用且智能的功能与能力来方便用户的生活、工作,大家可以期待一下。
作者:咚咚
本文由 @咚咚 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务