正在学Deepseek新论文“mHC:Manifold-Constrained

蚁工厂 2026-01-03 15:01:34

正在学Deepseek新论文“mHC: Manifold-Constrained Hyper-Connections”的同学,可参考这个mHC.cu项目,非官方版本的 CUDA 实现。地址: github.com/AndreSlavescu/mHC.cu开发者AndreS,分享了他的开发过程:“在开始时花了大约1小时阅读论文中的4.3.1和4.3.2节,并围绕这些内容写了一个非常详细的计划,列出了我想尝试的技术。大部分代码是模板代码,并且已经通过opus 4.5很好地复制(这部分几乎不需要手动工作),但内核调优是手动完成的,通过使用编写的分析器和ncu工具,这通常是我在使用过程中发现LLM仍然存在困难的地方。在了解如何构建项目的结构方面,我过去曾广泛参与LigerKernel的工作,所以我大概知道如何组织这些内容。”科技先锋官AI创造营

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注