[CL]《BringingUpaBilingualBabyLM:Inv

爱生活爱珂珂 2026-04-02 06:23:49

[CL]《Bringing Up a Bilingual BabyLM: Investigating Multilingual Language Acquisition Using Small-Scale Models》L Zeng, S Y. Feng, M C. Frank [The Harker School & Stanford University] (2026)

在双语习得研究领域，「同时接触两种语言是否损害母语学习」是一个悬而未决的难题。过去的研究受困于无法对儿童进行随机分组、无法匹配两种语言的输入量，本质原因是真实的人类语言环境无法被实验控制。

本文的核心洞见是：把语言模型训练重新看作「可操控的受控养育实验」。由此，用100M词的合成英西双语对话数据，在固定学习者架构的前提下，系统切换输入结构（随机混合、按说话人分离、句级/词级语码转换），这一关键操作使「输入结构是否影响习得」的问题得以在因果框架下解开。

这项工作真正留下的遗产是：双语输入对纯粹的统计学习者不构成混淆或一语损耗，性能差异主要由各语言的数据量对数决定，而非输入结构。它为后来者打开的新门是：用计算模型为认知科学中的语言习得争论提供因果检验路径。但尚未跨过的门槛是：模型缺乏语音、韵律等区分语言的感知通道，合成数据也难以复现真实双语环境的社会性复杂度，因此结论能在多大程度上迁移至人类学习者仍是开放问题。

arxiv.org/abs/2603.29552

机器学习人工智能论文 AI创造营

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

[人人能懂AI前沿] 从推理生成、对齐博弈到共识学习网页链接

2

今日推介(第2093期)：推理驱动的合成数据生成与评估、何时能安全地优化思维链、

3

[LG]《Target-Aligned Reinforcement Learni

4

[CL]《Bringing Up a Bilingual BabyLM: Inv

5

[IR]《Zero-shot Cross-domain Knowledge Di

6

[LG]《Aligned, Orthogonal or In-conflict:

7

[CL]《Reasoning-Driven Synthetic Data Gen

8

早！早安

9

晚安～晚安

10

免费书《Claude Code从入门到精通：面向工程师与产品经理的AI编程完全指

热门分类

科技TOP

1

vivoX300s的爆料也来了，外围规格全部拉满了。6.78英寸144Hz蔡

2

尚界Z7预售价22.98万起，Z7T预售价23.98万起，CLTC续航至高9

3

追觅手机研发首期投入100亿追觅手机开始计划投资100亿，目标到2027年手机团

4

成本压力下，各家都在温和调整3月16日0点，OPPO商城正式开启调价：•一加1

5

苹果变形脸表情火了这个表情看上去不太聪明啊有一股子不聪明又透露着好奇和天真无邪的

6

国家超算互联网免费支持OpenClaw国家超算互联网免费给OpenCla

7

给国内的ai排排座次，感觉有的高了，有的低了，有的太高了，有的太低了。

8

当下高端手机市场同质化严重，各大品牌陷入参数堆砌的内卷怪圈，追觅AURORA手机

9

【OpenAI完成其史上最大融资：OpenAI融资1220亿美元，估值达8520

10

苹果iOS26.4Beta4可以关掉液态玻璃刺眼动效其实关于玻璃透明效果，

科技最新文章

1

甲骨文凌晨6点突发裁员3万人突发裁员，打工人该怎么应对真的太揪心了，凌晨突然被

2

甲骨文凌晨6点突发裁员3万人甲骨文公司大举投入资金建设人工智能基础设施，豪赌AI

3

实锤！甲骨文开始大裁员消息指出，近期CNBC证实了甲骨文此前被曝“裁员数千

4

【OpenAI完成其史上最大融资：OpenAI融资1220亿美元，估值达8520

5

国行版苹果AI突发推送了一部分，然后又撤掉了，三个条件：1）必须是8GB起步的国

6

国行版苹果AI？乌龙已下架。国行版苹果ai3月31日凌晨，大量国行(iOS2

7

荣耀Power2才是真·闷声发财王者WIN系列还在缺货水深火热，Power

8

想要换手机的朋友们！要特别注意了~虽然说目前已经有不少厂家调整了不少机型

9

荣耀600系列来了！这次要掀桌子了？荣耀600系列预计是5月发布，网传图不知

10

内存条价格暴跌这事儿，简直像坐过山车！深圳华强北电子市场里，DDR516GB单