国家网信办:提供者开展预训练、优化训练等数据处理活动时,应当加强训练数据管理
36氪获悉,国家互联网信息办公室就《人工智能拟人化互动服务管理暂行办法(征求意见稿)》公开征求意见,其中提到,提供者开展预训练、优化训练等数据处理活动时,应当加强训练数据管理,遵守以下规定:(一)使用符合社会主义核心价值观、体现中华优秀传统文化的数据集;(二)对训练数据开展清洗、标注,增强训练数据的透明度、可靠性,防范数据投毒、数据篡改等行为;(三)提高训练数据的多样性,通过负向采样、对抗训练等手段,提升模型生成内容安全性;(四)利用合成数据进行模型训练和关键能力优化时,应当评估合成数据安全性;(五)加强对训练数据的日常检查,定期对数据进行迭代升级,持续优化产品和服务的性能;(六)保障训练数据来源合法、可追溯,采取必要措施保障数据安全,防范数据泄露风险。(国家互联网信息办公室官网)