3月19日,阿里大模型产品“通义听悟”发布音视频问答助手“小悟”等多项功能,支持单次最长6小时、一次性上百条音视频的内容理解问答,使用者可以对超长音视频随意提问,让AI(人工智能)总结任意知识点,其支持内容问答的音视频时长和文件数突破了业界上限。通义听悟产品负责人杨帆现场还表示,“通义听悟”没有向消费者收费的计划。
音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。技术人员介绍,通义听悟接入了通义千问大模型,融合了包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等AI功能,并支持标重点、记笔记。
据了解,使用者可以就最高6小时、6G大小的音视频向小悟提问任何相关话题,或直接要求小悟整理金句、梳理结论、写会议纪要,也可以针对自己的所有记录提问,系统可以一次性扫描理解上百条音视频内容。
学生和科研群体对AI新工具有普遍需求,但目前音视频AI转写工具普遍收费,或仅提供如每月1小时的少量免费时长。19日,通义听悟推出“高校公益计划”,推动AI算力普惠。所有中国大陆高校师生通过后缀edu.cn的教育邮箱进行认证后,可以直接获赠500小时转写时长,存储空间从20G拓展至200G。按目前市面上语音厂商9.9元每小时的折扣价格,这一教育福利权益价值约数千元。
作为国内首个开放公测的大模型产品,去年6月发布以来,通义听悟累计已有500万用户,包括学生、老师、白领、记者、律师、金融分析师等群体,平台每天处理字符数约20亿字。在收费模式方面,产品负责人杨帆表示,目前通义听悟没有任何对C(消费者)端收费的计划,“C端的应用承载的使命更多是向所有用户展现阿里技术的研究方向,通过API(应用程序编程接口)的方式在B(企业)端实现商业化,是我们的产品策略”,杨帆说。