内部文件曝光:Meta担忧遭模型蒸馏,限制员工使用Claude与Codex
Meta平台正逐步摆脱对Anthropic、OpenAI旗下高价AI编程工具的依赖,但其眼下正面临一大难题:如何避免员工过度依赖外部工具,阻碍自研替代工具的开发进程。
Meta内部管理规范文件显示,公司对应用AI工程部工程师使用Anthropic的Claude代码工具、OpenAI的Codex模型作出严格限制。一份内部备忘录甚至要求多个团队暂停部分调用上述两款模型的工作,原因是企业担忧第三方模型的生成内容可能流入Meta自身的模型训练数据。文件警示,一旦发生此类情况,将引发与合作企业之间严重的纠纷升级。
Meta曾是Claude代码工具的最大客户之一。公司于今年年初成立应用AI工程团队,核心任务是迭代优化自研代码助手MetaCode,重点工作包括搭建高质量数据集、设计各类编程测试题,供工程师训练和测评自研代码大模型。尽管Meta允许该团队在部分场景下使用外部AI工具,但明确要求工程师必须独立设计编程测试题目,依托自身专业技术能力构思方案,严禁直接采用AI生成的创意思路。
据知情人士透露,这份5月出台的内部规范目前仍然生效。Meta之所以出台严苛限制,是害怕无意中实施模型蒸馏行为——即借助竞品大模型的输出结果,训练自家AI模型。这类行为涉嫌违反Claude、Codex的用户使用协议。
模型蒸馏,本质上是让研发企业直接复用同行在数据储备、算力投入、技术研发上的巨额沉淀成果,近些年该行为一直深陷行业争议。
Meta的内部沟通文件并未记载员工存在违规使用第三方模型的具体案例。该公司发言人表示:“我们已出台完善规范,明确团队使用AI工具的边界,确保员工能够合规聚焦高价值工作。”
尽管暂无违规实例,但最新管理规范表明,在全力迭代AI产品、为巨额算力基础设施投入寻求商业回报的背景下,企业管理层认为有必要给员工划定更细化的使用红线。
大力削减AI采购成本
随着AI相关开支飞速攀升,降低对外部AI工具的依赖、将研发工作向自研工具MetaCode(前身为DevMate)迁移,对Meta愈发重要。根据公司近期一份内部备忘录,Meta今年仅内部AI相关支出就将达到数十亿美元。在全公司大力推广AI工具落地后,Meta如今通过限制员工令牌调用量,遏制不断飙升的AI使用成本。
Meta允许应用AI工程团队在常规工作中使用第三方AI工具,例如搭建工作流、整理代码与文件、为自研AI工具搭建自动化校验类测试环境,这在规范中被称作“测试脚手架搭建”与“方案校准”,简单来说就是搭建、调试用于评测模型性能的整套体系。
即便在上述合规场景中,所有AI生成内容投入使用前,必须经过人工严格审核。规范明确禁止利用外部大模型的输出内容设计编程测试题来测评自研模型,文件指出:“该行为意味着工程师完全丧失项目主导权,我们绝不允许依托第三方模型生成任务素材。”
另一项限制规则为:工程师不得借助AI检索源代码漏洞、通过代码分析生成任务选题思路。简言之,模型不能参与确定需要测试的业务问题。
此外,规范要求:若自研待测试模型能够访问容器内资源,则任何AI生成内容均不得存入应用容器(容器用于封装程序运行所需的全部环境,包含代码、各类依赖库等)。
游走在合规钢丝之上
业内专家表示,科技企业在研发过程中使用竞品大模型,相当于时刻游走在合规的钢丝上:既要享受第三方模型带来的研发便利,又必须杜绝相关成果流入自家自研体系。
科技法律学者兼行业顾问马克·莱泽评价道:Meta这份内部文件,几乎完整画出了这条合规钢丝的边界。
尽管美国现行法律并未明令禁止模型蒸馏,AI生成内容也不受版权保护,但各大AI实验室普遍会直接封禁涉嫌蒸馏行为的企业或个人的模型调用权限。
去年,Anthropic就关停了OpenAI调用Claude的API接口权限。OpenAI当时解释,调用接口只是为了横向测评Claude的能力与安全测试表现,并称横向对标测评属于行业通用的技术基准测试方式。
Meta上月的内部备忘录提到,有员工利用AI制作、修改测评任务,已经难以界定相关内容究竟由人工还是大模型创作而成。
Meta限制Claude与Codex使用权限,一方面是担忧第三方模型的输出内容间接混入自研训练数据集,既会影响模型训练质量,也极易引发合作方纠纷;另一方面,临时暂停相关场景的工具调用,也是为了完善内部管控机制,由Meta人工智能研究院研究员、应用AI部门管理层共同审核研发流程,确保所有操作符合合规要求。


还没有评论,来说两句吧...