Nature封面:AI训AI 越训越傻

AI训练AI,可能会让AI变傻?!

来自牛津、剑桥等学校机构的研究人员最新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为最新的Nature封面

直接一个:GARBAGE OUT!

Nature封面:AI训AI 越训越傻

要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解数据荒。这下无疑是整个行业浇了一波冷水。

研究团队给了这样一个例子。

他们测试了Meta的OPT-125m模型,询问了关于中世纪建筑的相关信息。

Nature封面:AI训AI 越训越傻

每一次微调都是由上一次生成的数据来训练。结果前面几轮回答还好。结果就在第九次,就开始胡说八道

扯到兔子是什么鬼?!

该论文主要作者表示,他们曾考虑过合成数据可能对大模型造成误差,但未曾预料到模型的恶化速度会如此迅速。

三个误差导致模型崩溃

首先,团队定义了什么是模型崩溃。

模型崩溃是一个退化过程,模型生成的内容会污染下一代的训练数据集。而在被污染的数据上训练之后,新一代模型就容易误解现实。

以此循环往复,一代更比一代差。

Nature封面:AI训AI 越训越傻

按照时间推移,主要分为两种情况:早期模型崩溃和晚期模型崩溃。

早期模型崩溃中,模型开始丢失一些尾部信息。(类似概率分布中一些低概率事件) 而在晚期模型崩溃,模型将收敛到同原始分布几乎没有任何相似之处。

这一过程的发生,同模型设计、学习过程和所用数据质量有关。

具体到理论中,主要包括了这三个误差导致大模型同原始模型的偏离。

统计近似误差。这是主要类型的误差,由于样本数量有限而产生,并随着样本数量趋于无穷大而消失。这是因为在重新采样的每一步中信息都有可能丢失,这种概率不为零。函数表达性误差。这种误差是由于函数近似表达能力有限而产生的。特别是,神经网络只有在其规模达到无穷大时才是通用近似值。不过,在没有其他两种误差的情况下,这种误差只会发生在第一代。函数近似误差。主要由学习过程局限性引起,例如随机梯度下降的结构偏差或目标的选择。这种误差可以看作是在无限数据和每一代都具有完美表达能力的情况下产生的误差。

对语言模型的影响

随后研究人员评估了模型崩溃对语言模型的影响。由于从头开始训练大模型成本非常高,他们选择评估语言模型最常见的设置:微调设置

每个训练周期都从具有最新数据的预训练模型开始。训练数据来自另一个经过微调的预训练模型。

他们用Meta因果语言模型OPT-125m,在wikitext2上进行了微调。

为了从训练好的模型中生成数据,团队使用了five-way波束搜索。他们将训练序列设为 64 个token长度;然后对于训练集中的每个token序列,要求模型预测下一个64个token。

他们会浏览所有原始训练数据集,并生成一个相同大小的人工数据集。如果模型的误差为0,它就会生成原始的wikitext2数据集。

为了进一步感受区别,他们采用两种不同的设置:一组是除了最开始训练,后续过程没有任何原始训练数据;另一组则是保留10%的原始数据。

Nature封面:AI训AI 越训越傻

结果显示,随着时间推移,模型产生的错误会增加。在模型完全崩溃之前,它还会导致模型遗忘数据集中低概率事件,他们的输出也变得更加同质化。最终也就出现了开头这一现象。

另外在VAE、GMM模型中看到了类似模型崩溃的现象。

Nature封面:AI训AI 越训越傻

Nature封面:AI训AI 越训越傻

来自杜克大学的Emily Wenger教授表示,到目前为止,要缓解这一问题并非易事。

有领先的科技公司已经部署了一项技术,即嵌入水印——

标记AI生成的内容,让其在训练数据中排除。但困难在于,这需要科技公司之间的协调,因此不太具有商业可行性。

这样一来,那从之前互联网获取数据的公司,他们训练的模型更能代表现实世界。所以,最开始那一波大模型算是有了先发优势。

对于这一观点,你怎么看呢?

以上就是关于【Nature封面:AI训AI 越训越傻】的相关消息了,希望对大家有所帮助!

主题测试文章,只做测试使用。发布者:联合网,转转请注明出处:https://www.anesthesia.org.cn/2024/07/28/4913.html

(0)
联合网的头像联合网
上一篇 2024年7月28日 上午9:10
下一篇 2024年7月28日 上午9:10

相关推荐

  • 四川应对强降雨 转移避险8万余人

    近日,四川盆地遭遇了连续强降雨天气,多个市州面临严峻的防汛形势。面对突如其来的暴雨,四川省各级政府和相关部门迅速响应,多措并举,成功转移避险8万余人,确保了人民群众的生命安全。 据四川省气象台发布的暴雨蓝色预警,自8月9日以来,四川盆地多个市州遭受了大雨到暴雨的袭击,局部地区甚至出现了大暴雨。连续的强降雨导致部分河流出现超警洪水,山洪、泥石流等自然灾害频发,…

    2024年8月11日
    3800
  • 犯罪团伙通过虚假手段骗取出口退税超2600万,11人获刑

    犯罪团伙以正规经营公司为幌子,通过买单卖单、虚构货物出口、虚假结汇等手段骗取出口退税2600余万元,11人被判刑。 近日,最高检、公安部联合发布了“依法惩治骗取出口退税犯罪典型案例”,《黄某鹏等人骗取出口退税,非法经营,伪造、买卖国家机关证件、印章案》入选。 案情显示,2017年3月,被告人黄某鹏与邱某富、邱某财、刘某等人合谋,以正规经营公司为幌子,通过买单…

    2024年8月23日
    2000
  • 秦岭留坝:从朱鹮栖息地到全球目的地

    如果飘散的种子掉落到肥沃的土壤之中,并且找到与环境的契合方式,它们就会发芽、生长,并最终在那个地方开始全新进化繁衍。 谨以此文献给即将10岁生日的小象,还有世界地球日、世界读书日。 本报告引用了以下成果观点,在此一并致谢: 《1972:回溯新中国环境保护旅程的起点》,马天杰) 《新时代的中国绿色发展》白皮书,国务院新闻办,2023 《额外性论证评价工具(第 …

    2024年8月20日
    3000
  • 玻璃大王曹德旺胞妹“退休”创业:五年干出182亿独角兽

    一家子硬核企业家。 就在最新IPO进展中,智能汽车产业链公司正力新能正式向港交所递表,冲刺IPO。 正力新能,主打动力电池,是宁德时代所代表的赛道里的一员,蓄力5年,挤入前十。 但正力新能之所以备受关注,不仅因为公司发展之迅猛,还在于背后的掌舵者——曹芳,现年66岁,北大硕士研究生学历。 以及曹芳还有另一重身份:玻璃大王福耀集团创始人…

    2024年8月1日
    2900
  • 河南唯一!郑州初二学生保送清华本硕博连读

    7月27日消息,别人家的孩子又出现了!当很多同龄人还在懵懵懂懂学习是为了什么,并想方设法贪玩的年纪,来自郑州外国语初二的男生已经被清华大学直接录取,跳过了中考和高考,本硕博连读。 据大参考报道,河南郑州初二学生刘仁泽通过丘成桐数学科学领军人才培养计划,直接被保送至清华大学。 他是河南首位初中生跳过中考和高考,直接保送进入清华大学就读的学生,也是该计划实施以来…

    2024年7月27日
    2400

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信