/ 中存储网

字节跳动被OpenAI暂停账户:秘密使用OpenAI的技术来开发自家大语言模型(LLM),

2023-12-19 15:01:12 来源:科技号

科技号消息,近日有外媒报道称,字节跳动在使用OpenAI技术开发自己的大语言模型,违反了OpenAI服务条款。OpenAI发言人Niko Felix称已经暂停了字节跳动的账户。对此,字节跳动相关负责人回应称,公司在使用OpenAI相关服务时,强调要遵守其使用条款。字节跳动也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。

12月16日,有媒体报道字节跳动一直在秘密使用OpenAI的技术来开发自家大语言模型(LLM)。OpenAI发言人Niko Felix称已经暂停了字节跳动的账户。

据介绍,今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在4月公司引入GPT API 调用规范检查后,这种做法已经停止。 早在今年4月,字节大模型团队已经提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。

该负责人表示,9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型输出结果与GPT的相似度,避免数据标注人员私自使用GPT。未来几天里,公司会再次全面检查,以确保严格遵守相关服务的使用条款。 此前,字节跳动发言人Jodi·Seth回应表示,GPT生成的数据在“种子计划”(Project Seed)开发的早期被用于对模型进行注释,已在今年年中左右从字节跳动的训练数据中删除。

外媒称:这种做法在人工智能世界中通常被认为是失礼的。这也直接违反了OpenAI的服务条款,该条款规定其模型输出不能用于“开发任何与我们的产品和服务竞争的人工智能模型”。字节跳动(ByteDance)正在通过Microsoft购买其OpenAI访问权限,也有相同的政策。尽管如此,与我分享的字节跳动内部文件证实,OpenAI API 在开发的几乎每个阶段都依赖于其基础 LLM,代号为 Project Seed,包括用于训练和评估模型。