10月18日,多个微信群流传一则消息:“某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了8000多张卡,带来的损失可能超过千万美元。”
今天下午,字节跳动发声,针对近期“字节跳动大模型训练被实习生攻击”的传闻,字节跳动发布声明回应称,该涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务,但并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。网传“涉及8000多卡、损失上千万美元”严重夸大。
字节跳动称,经核实,涉事人一直在商业化技术团队实习,并没有AI Lab实习经历。其社交媒体个人简介及部分媒体报道有误。另外,该实习生已在8月被公司辞退。公司也将其行为同步给行业联盟和所在学校,交由校方处理。
据报道,此事发生在今年6月,涉事实习生田某某是在商业化技术团队实习,因为对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。
知情人士表示:受影响的业务不是该厂的大模型,而是商业化技术团队的模型训练任务,也就是影响了广告部门,更不是有些传言中所说的豆包大模型;“实习生被送进去”是假的,处理方式是辞退+同步行业联盟+同步情况给学校;损失上千万美元也不实。
不过,有行业专家表示,该事件也反映了字节跳动的安全管理问题,包括权限隔离、共用代码的审计等。
据悉,字节跳动豆包大模型是一款多模态预训练模型,于2024年5月15日发布。它包含多个模型,如豆包通用模型Pro、Lite等,支持文本、图片、视频等多种数据类型处理,具备跨模态理解和生成能力。豆包大模型广泛应用于内容创作、智能客服、教育、医疗、工业设计、金融、自动驾驶等领域。其技术特点包括高效训练和推理,以及根据需求自适应调整模型参数。市场需求强劲,日均Tokens使用量超1.3万亿,展现出卓越的产品能力和市场竞争力,为各行各业带来智能化变革。