
新智元报谈
【新智元读】DeepSeek正用开源、降价和底层架构立异,重画AI硬件生态的成本弧线,把方针指向十万亿好意思元产业与AGI的星辰大海。
DeepSeek近动作时常。
先是5月22日,彭博社爆出他们正在进700亿元东谈主民币的融资,投前估值达450亿好意思元。
同天,DeepSeek官宣V4-Pro API降价75——把促销价平直焊死成正价。
边向投资东谈主要钱,边向确立者让利。这操作,若干有点让东谈主朦胧。
那么问题来了,DeepSeek到底要靠什么赢利,何况还要赚好多好多钱?
毕竟,AGI可不是能口嗨出来的。
这恰是x博主@bookwormengr近谈判的个狠问题。
他在长文《DeepSeek's 10 trillion USD grand strategy》中建议个相等果敢的判断:DeepSeek实在的星辰大海,可能不是编程套餐,不是语音助手,而是参与塑造个价值10万亿好意思元别的AI硬件生态,并在这个生态里冲击万亿好意思元估值。
仔细读完@bookwormengr的这篇万字长文,你会发现:梁文锋不是子,他是棋手。
何况是手,他下的是盘价值10万亿好意思元的棋。
袼褙之旅长治塑料管材设备厂家
场反共鸣的技巧长征
总结DeepSeek的成长轨迹,用「袼褙之旅」来描述不为过。
在统共东谈主都在堆Dense模子、卷参数目的时辰,DeepSeek去啃难训的MoE(混模子),用少的测度量撬动的智能。
别东谈主用PPO作念强化学习,他们从旨趣启航,发明了低廉的GRPO算法。
别东谈主还在商讨RLHF的天花板,他们也曾跑通了RLVR(基于可考据励的强化学习),把明智力拉上了新台阶。
MLA、DSA(解耦寥落瞩想法)、mHC(流形箝制通顺)、CSA和HCA——这些都不是论文里的花拳绣腿,每项都在讨教同个问题:怎样在有限的硬件条目下,榨出大的AI算力?
Q Q:183445502袼褙从来不是启动就知谈我方的干事。他在路上握住战役、握住发现,终找到了我方的终宿命。
DeepSeek的宿命,从来都不是API套餐。
谈深嗜的数学题
KV Cache的阴私
让咱们从个具体的数字启动讲这个故事。
开kvcache.ai的在线测度器,输入100万token曲折文、8bit KV精度、16bit索引精度,你会看到组让东谈主瞠方针对比:DeepSeek V4仅需 5.48GB HBM。
比拟之下,其他顶开源模子则动辄需要 60GB HBM。
瞩目,DeepSeek V4是个1.6万亿参数的模子,体量宏大于其他开源模子,KV Cache占用却独一它们的头。
这意味着DeepSeek不错把缓存射中的价钱定到个令东谈主发指的低位——V4-Pro缓存射中价仅0.025元/百万Token,不到Claude Sonnet 4.6同类价钱的3长治塑料管材设备厂家,何况不错握续缓存数小时。
降价后,输入缓存未射中3元/百万Token,输出6元/百万Token,一王人是原价的四分之。
梁文锋两年前就说过DeepSeek的订价玄学:咱们的原则是不贴钱,也不赚取暴利。
目下看来,他说的是真话——当你的KV Cache独一别东谈主的十分之,你的成本即是别东谈主的头。
但的问题是:这个红利到底流向了那边?
十万亿好意思元的棋盘
硬件生态的重构
谜底藏在三个缩写里:SSD、LPDDR、HBM。
层:SSD与NAND闪存。 KV Cache被压缩到小之后,不错地卸载(offload)到SSD上,等需要时再快速加载回HBM。
DeepSeek在Dual Path论文中还门化了从SSD加载KV Cache的速率。这平直减少了对上流HBM的依赖。
谁是SSD和NAND闪存的大玩?DeepSeek每压缩分KV Cache,就在为NAND和SSD创造个纷乱的新商场。
二层:LPDDR内存。SGLang团队发表的谈判标明,LPDDR不错行动「权重暂存区」——模子权重先放在LPDDR里,需要时再流式传输到HBM中,大幅缓解HBM的容量压力。
DeepSeek的MoE架构适配这个案:数目多、权重不错4bit量化,塑料挤出机设备流式加载相等。
谁在作念LPDDR?国产速率只落伍0.5代长治塑料管材设备厂家,密度落伍1代,追逐的脚步也曾很近。
三层:GPU/ASIC的减压。 Engram模块用LPDDR中的哈希查表替代Transformer的前向传播测度,内容上是用每比特成本低的「内存读取」替代每比特成本的「GPU运算」。
这对AI芯片意旨要紧——由于EUV光刻机受限,国产GPU在原始FLOPs上落伍。但要是你能用多的低廉内存来替代少的上流算力,那这种「换谈车」就变得理了。
再加上TileLang——DeepSeek投资的跨硬件内核编译框架,不错让套测度代码同期跑在多种硬件平台上,荒谬于绕过了「CUDA护城河」。国产芯片厂商,都有可能因此得回生态层面的冲破。
目下你昭彰了吗?DeepSeek作念的每项技巧立异,都在指向同个向:裁减对顶硬件的依赖,让现存的存储、芯片、收集生态变得敷裕用,甚而好用。
@bookwormengr算了笔大账:人人AI磋磨股票的总市值早已远10万亿好意思元。
要是DeepSeek能匡助构建个等量的AI硬件生态,它我方在这盘棋里拿到1万亿好意思元的估值,乎逻辑。
不赚快钱的逻辑
回头看DeepSeek的统共「不作念」——不作念多模态(V4.1才启动试水图像和音频)、不作念语音模子、不作念模子、API降再降——就说得通了。
不是「不会赢利」,而是「暂时不屑于赚这种钱」。
@bookwormengr建议了个精彩的类比:OpenAI拿到了AMD和Cerebras的股权认购权证,只须竣事算力采购里程碑就不错廉价买入股票。这内容上是「用情愿换股权」——你帮我造芯片,我给你订单,咱们起把蛋糕作念大。
DeepSeek不错复制这个形状。
只不外它濒临的不是AMD和Cerebras,而是整条国产AI硬件产业链。
梁文锋是量化基金降生,被称为「 Jim Simmon的诚挚粉丝」。这么个东谈主,不行能不懂老本运作的精妙之处。
事实上,融资音信传出前,他也曾在2026年4月完成了次枢纽的股权调整——通过平直与曲折握股放置公司约84.29的股权,表决权。
宁德期间投DeepSeek——它要锁定往日AI数据中心的储能订单。京东、网易入局,各有各的计策诉求。
国大基金下场,是把DeepSeek定位成了国AI基础步伐。
这些投资者看到的,不是个API的小营业。他们看到的,是个可能重塑人人AI硬件面目的计策支点。
终干事
大范围强化学习与AGI
但要是你觉得DeepSeek的极度是「作念AI硬件生态的发动机」,那可能照旧低估了梁文锋。
据彭博社报谈,梁文锋在投资者会议上明确表态:DeepSeek的主要方针是动技巧鸿沟,追求AGI。
硬件生态是技能,AGI才是方针。
逻辑是这么:当多硬件聘请变得可用、当算力需求自身被技巧立异大幅压低,DeepSeek就能以低的成本启动大范围的本质——至极是强化学习(RL)后本质和递归自我改革(RSI)。
大范围RL意味着模子需要生成海量的理轨迹——万亿token的生成量,测度成本其。而100万曲折文的长程任务,要求轨迹自身也敷裕长。
要是莫得致的硬件率化,这种本质根柢跑不起来。
RSI则加果敢——让AI我方谋划实验、实施实验、分析效用、改革自身。这是个试错密度的历程,对算力的需求是底洞。
但要是DeepSeek通过重构硬件生态把算力成本下来,这条路就变得可行。
从MoE到MLA,从DSA到CSA,从Engram到TileLang,从KV Cache压缩到LPDDR流式加载——统共这些立异,终都汇注到同个极度:让AGI的本质从「不起」酿成「得起」。
梁文锋与DeepSeek的星辰大海,从来不是海面上的浪花,而是洋流自身。
相关词条:玻璃棉毡 塑料挤出机 预应力钢绞线 铁皮保温 万能胶生产厂家1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。