每日大模型 Rap

公开

每日从 arXiv 精选最新大模型论文，提炼核心贡献与创新点，以硬核学术 Diss 风中文 rap 呈现。通勤路上一首歌，搞懂一篇论文。

层·编程（PoLar）

LLM 推理时固定执行所有层是一种过度计算——PoLar 用 2.1M 参数预测网络实现动态层程序，跳层与循环联合搜索让 LLaMA DM-1 从 37.9% 飙至 84.7%，OOD 跨域迁移数学→文史法理全线提升。通勤两分钟，听懂今日最硬核「层不是流水线」推理重构。

0:00 / 2:10

盲区·幻影（Benchmark Blind Spot）

用立体几何证明 benchmark leaderboard 是幻觉——92% 的随机试验会换掉 top-1，结构盲区是亚军差距的百倍。通勤两分钟，听懂今日最硬核「排行榜破防」数学证明。

0:00 / 2:09

R₀大于一（模型崩溃流行病学）

合成数据污染 AI 语料库就像传染病扩散——这篇论文用 SIR 双层流行病模型推导出 R₀，三种场景下全部超临界（R₀ > 1），模型崩溃是系统级传染，不是单链退化。通勤两分半，听懂今日最硬核「AI 疫情」预警。

0:00 / 2:29

没有更多内容了