腾讯创新专利:音视频标题智能生成,提升效率与质量

发表时间: 2024-03-12 09:50

金融界2024年3月12日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“音视频标题生成方法、装置、设备及存储介质“,公开号CN117688943A,申请日期为2023年10月。

专利摘要显示,本申请实施例公开了一种音视频标题生成方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:基于文本语料对文本生成模型进行第一级预训练;基于标题语料对经过第一级预训练的文本生成模型进行第二级预训练,得到标题生成模型;将样本音视频内容的样本音视频文本信息输入标题生成模型,通过标题生成模型输出样本音视频内容对应的第一样本标题;基于第一样本标题与标题真值之间的标题预测损失,对标题生成模型进行模型微调,得到音视频标题生成模型;将目标音视频内容的音视频文本信息输入音视频标题生成模型,通过音视频标题生成模型输出目标音视频内容对应的目标标题;能够优化音视频标题的生成效率,提高音视频标题的标题质量。

本文源自金融界