DeepSeek-V4论文中CSA（CompressedSparseAtte

蚁工厂 2026-04-28 21:24:21

DeepSeek-V4论文中CSA（Compressed Sparse Attention）的参考实现。www.k-a.in/CSA.html

作者把论文中的关键公式逐段落实成 PyTorch 实现，涵盖 token 压缩、稀疏索引、滑动窗口 KV、共享 KV 注意力和输出投影，并拿它和标准多头注意力（MHA）比较 KV cache 占用、训练收敛、前向延迟和长上下文 passkey retrieval 表现。AI创造营

0 阅读：1

外媒：DeepSeek新模型V4定价较OpenAIGPT-5.5低97%D

【1点赞】

deepseek openai ai GPT5

突然之间，DeepSeek和OpenAI正面开战！黄仁勋决定全力以赴力挺Ope

【1评论】【1点赞】

deepseek openai 黄仁勋芯片

DeepSeek过于朴素了摘自AGI接口，作者宋思杭和其他基模公司比，Deep

【1点赞】

deepseek 英伟达芯片华为麒麟芯片人工智能

三款AI编程工具对比Cursor定位：图形界面，门槛最低优势：开箱即用，V

【1评论】【2点赞】

编程 ai github copilot copilot 人工智能

从1%到34%！DeepSeek突然增资、梁文锋大手笔增持，背后藏着国产AI最硬

ai 梁文锋 deepseek 人工智能

本以为横空出世的DeepSeek，是去跟硅谷巨头硬刚的国货之光。弄了半天，梁老板

【2评论】【7点赞】

硅谷 deepseek ai

那个叫DeepSeek的东西，本以为是冲向美国人科技封锁线的一把尖刀。结果它交

【137评论】【162点赞】

deepseek ai 尖刀芯片人工智能

DeepSeekV4终于发布了，但这次的反馈剧本有些割裂。一边是开发者略显失

【3评论】【3点赞】

deepseek 英伟达

蚁工厂

感谢大家的关注

作者最新文章

DeepSeek-V4论文中CSA（Compressed Sparse Atte

Open Design ：Claude Design 的开源替代品。地址：git

原来美团longcat家的公仔长这个样子

clawd.rip/还有这种网站，claude翻车史，记录了claude的每一次

电子书《逻辑学简短入门》牛津通识读本的重译版。地址：wxflogic.gitbo

cc switch使用手册，出品网页链接很详细的教程

Larus Canus （推特id：MrLarus）创作的《平面几何字体海报》提

国产螺丝刀成了老外的梦中情刀喝热水的外国人正被中国螺丝刀硬控这波“螺丝刀出海”其

即梦AI的图标变这样了呢和HappyHorse的发布有关……？抓马？~~AI创造

热门分类

科技TOP

苹果公司近日为其员工送上了一份特殊的“生日礼物”，以此纪念品牌创立50周年。据悉

鸿蒙6.1的机型升级计划表，看看有没有你的机型，老机型几乎都是正式版，高端机型和

一图看懂OPPOFindX9sPro、OPPOFindX9Ultr

鸿蒙6.0系统又更新了，这次新增的功能还挺挺多的，主要是增加相机水印、以及图库的

我也越来越像个“旁观者”……用过功能机、翻盖机，也见过智能机怎么一步步把生活

折叠屏这些年一直被吐槽“能用但不好用”，所以到底是不好用还是做不好？这次华为

荣耀600Pro曝光：双2亿主摄+9000mAh电池，这配置绝了最近在网上看

主流大模型横向横评：DeepSeek最新一代到底强在哪？

【OpenAI完成其史上最大融资：OpenAI融资1220亿美元，估值达8520

一部地图，如何逼得苹果CEO公开承认错误

荣耀X80参数全曝光！13000mAh直接封神，千元机彻底疯了！家人们谁懂

一加Ace6至尊版165Hz京东方电竞屏，8600毫安时电池，120W快充。

8600mAh冰川电池+120W快充，支持旁路充电，搭载聚能芯片，这个续

iPhoneUltra真机超前瞻感觉最近手机品牌的黑科技都放出来了，荣耀在5月份

老板亲自下场开撕，这届生意人不装了追觅科技CEO俞浩在微博公开炮轰小红书，各

我也越来越像个“旁观者”……用过功能机、翻盖机，也见过智能机怎么一步步把生活

哥们儿不是说，现在我们都是世界上最幸福的果粉。国补+以旧换新，实在不行再上教育版

虽然2026年华为Mate80Pro早就出了，但是相信还有一堆人在用华为Mat

内存价格持续大涨，部分手机厂商的新品除了涨价之外，部分关键配置悄悄降级，现在天玑