DeepSeek揭露赢利引服务商互怼 AI基建怎么降本 — 新京报
近期,网络上关于某位明星的"黑料"层出不穷,许多网友纷纷表示好奇。这些爆料内容涉及其私生活、工作背后的秘密以及不为人知的往事。虽然信息真伪尚待考证,但这也引发了公众对媒体曝光和明星隐私权的广泛讨论。无论如何,舆论的关注无疑让这位明星面临巨大的压力。
图/IC。
北京时刻3月1日正午,DeepSeek于“开源周”收官之际在知乎发文,不只解读了要害的降本增效技能,还初次揭露了API服务的本钱、收入以及理论上高达545%的赢利率。不过,这也意外引发了两家为用户供给DeepSeek服务的MaaS供货商“互怼”,让国内AI Infra(人工智能基础设施)企业稀有成为“吃瓜大戏”的主角。
MaaS,直译为模型即服务,指将模型布置到企业端供给给用户服务。新年期间DeepSeek“服务器繁忙”时,不少从事MaaS服务的大模型基础设施公司,如潞晨科技、硅基活动等为用户供给了运用“满血版”DeepSeek的时机。
关于该项服务,潞晨科技创始人尤洋曾揭露发文表明“MaaS形式下用户越多亏本越多”,而跟着DeepSeek揭露本钱和赢利率,面临网友质疑,尤洋发文辩驳并一度“辣评”竞对公司硅基活动,终究和硅基活动创始人袁进辉开端“互怼”。尔后,更延展到此前潞晨科技触及的抄袭风云上,引来了更多圈内人士“下场”。
对此,中存算董事长陈巍点评道:“创业不易,立异不易,需求多一点宽恕。技能上偶然呈现判别误差都很正常。”而关于终究DeepSeek的MaaS服务“亏不亏”这一问题,陈巍对新京报贝壳财经记者表明,“这个问题现已超出纯技能谈论领域了,触及产品定位和AI Infra企业的求生。主张两边放置争议,抓紧时刻做Infra优化,抢占用户日活攀升的工业窗口期。”。
DeepSeek展现盈余才干:一天收入56.2万美元,理论本钱赢利率545%。
工作产生在DeepSeek的“开源周”即将完毕之际——此前,DeepSeek曾表明将在从2月24日开端的“开源周”发布五项开源效果,但当五项效果悉数发布完毕后的第六天,DeepSeek又发布了《DeepSeek-V3/R1推理体系概览》技能文章,初次发布了模型推理体系降本增效的优化细节。
该篇文章以DeepSeek推理体系的优化方针:更大的吞吐,更低的推迟为中心,具体介绍了其解决计划:运用大规模跨节点专家并行(Expert Parallelism / EP)。以浅显的办法来了解,就相似把AI模型拆分红多个“小专家”,涣散到不同的显卡(GPU)上运转。就像餐馆里多个厨师一起备菜,每个厨师只担任自己最拿手的部分,全体出餐速度更快。V3体系中,每层有256个专家,但每次只用8个,经过动态分配完成高效核算。
此外,当不同显卡之间需求传递数据时,体系会像工厂流水线相同,让核算和传输一起进行。例如在生成文字时,前一部分还在核算,后一部分现已开端传输,防止“干等”浪费时刻。
对此,袁进辉谈论道,“DeepSeek官方发表大规模布置本钱和收益,又一次推翻了许多人的认知。现在许多供货商还做不到这个水平,首要是V3/R1架构和其他干流模型不同太大了,由很多小Expert(专家)组成,导致瞄准其他干流模型结构开发的体系都不再有用,有必要依照DeepSeek陈述描绘的办法才干到达出色的功率,而开发这样的体系难度很高,需求时刻,幸亏这周DeepSeek五连发现已把首要模块开源出来了,降低了社区复现的难度。”。
一个能够让人直观感触DeepSeek功率的数据是,其在文章最终展现了以2月27日12:00至2月28日12:00,一天内DeepSeek V3和 R1推理服务占用的节点,并核算了包含网页、APP和API的一切负载,核算发现假定GPU租借本钱为2美元/小时,总本钱为 8.7万美元,若所耗费的tokens(算力计价单位)悉数依照DeepSeek R1的API定价核算,理论上一天的总收入为56.2万美元,本钱赢利率为545%。
DeepSeek在知乎的文章中发表了其核算的本钱、理论收入和赢利率 图片来历:知乎截图。
“这份本钱赢利发表看似坦白,实则暗藏杀机。它告知一切人:大模型的游戏规矩早已变了,单靠算法或许简略囤积算力不能赢得大模型的成功。在算法+数据+算力的三要素中,有用算力(算力x算力功率)才是最暴力美学的生计规矩,唯快不破这个道理也适用于大模型职业。这份数据事实上是三头六臂‘大闹东海,脚踢很白的宫’的技能演绎,也是‘算力+智力’逆风翻盘的真挚描写。”陈巍表明。
值得注意的是,此前DeepSeek的重要信息发布一般在X、GitHub等以英文为主的渠道,而本次的发布还额定登录了知乎,这瞬间引发了国内AI圈的热心,到3月3日早,DeepSeek发布的文章在知乎获得了7735个赞,以及866条谈论。
尤洋遭网友“点名” DeepSeek API服务究竟“亏不亏”?
新京报贝壳财经记者注意到,不少网友本着“看热闹不嫌事大”的心态在这篇文章的谈论区里“呼叫尤洋”,其间一条尤洋知乎账号的谈论获得了475个点赞,点赞数为谈论区第二高。
这是由于,此前尤洋曾发文直言“MaaS在我国短时刻内可能是最差的商业形式”“满血版DeepSeek R1每日输出1000亿tokens,那么每个月亏本4亿”,引发了业界对MaaS商业形式的争辩。
潞晨科技创始人尤洋微博截图。
AI与云基础设施专家左鹏飞表明,DeepSeek和尤洋之间观念抵触的首要原因是对每台H800机器能跑出多大吞吐量的认知不同。
“依据尤洋教师的采访视频,4台机器跑出的吞吐量是1K tokens/s,而DeepSeek官方跑出的数据是均匀每台机器14.8K tokens/s, 有14.8*4 ≈ 59倍的功能距离。不同MaaS服务供给商对相同机器上相同模型跑出来的吞吐量能够相差59倍,那么天然有的MaaS服务商能赚钱,有的MaaS服务商大亏钱。这也证明AI Infra的体系优化才干是多么重要。”左鹏飞说。
关于网友的“点名”,尤洋自己也发文进行了回应,他以为DeepSeek文章中的数据对核算MaaS本钱没有太多参考价值,由于文章把DeepSeek网页,APP和MaaS API的token数加在一起核算,且数据是建立在很多用户把DeepSeek的APP和网页彻底超负荷占满的状况下,不是一个惯例的MaaS。
贝壳财经记者发现,DeepSeek说到的545%赢利率更多指的是“抱负状况”,DeepSeek在官方文章里也表明“当然咱们实际上没有这么多收入,由于V3的定价更低,一起收费服务只占了一部分,别的夜间还会有扣头。”。
尤洋着重,自己对DeepSeek的模型才干没有降低,但其运用体会十分差,“我新年期间用过几回,问一个问题,然后说繁忙,让我稍后测验,我等了15分钟或许一小时。这不是一个合格的MaaS产品。”。
好像为了证明自己的观念,尤洋在发布完回应文章后,宣告潞晨科技将在一周后中止供给DeepSeek的API服务,
潞晨科技大众号截图。
对此,左鹏飞告知新京报贝壳财经记者,尤洋的观念有必定的道理,但“即便考虑上资源预留,也便是545%的赢利率除以2或3,依然是盈余的,不影响我说到的中心逻辑。”。
两家MaaS供货商开吵“嘴架” 引出抄袭“旧账”。
这一工作的开展开端逐步“跑偏”。尤洋在回复网友后,又在知乎发文,锋芒直指新年期间最早开端接受DeepSeek流量,为用户供给“满血版DeepSeek服务”的硅基活动,以为该公司“献身职工新年假期绑缚华为宣扬、在小红书拉人头、API速度慢”等。
对此,袁进辉在朋友圈反击称“咱们团队乐意奋斗抓一个时机有什么错?约请用户送点免费券有什么错?新年那几天,全民都想拜访DeepSeek而不得时,咱们供给了仅有的一个安稳的服务。”一起,他还说到了此前潞晨科技曾抄袭过硅基活动。
这导致更多AI圈人士被牵涉进来,如尤洋说到该起抄袭工作代码的担任人是原潞晨科技CTO方佳瑞,但后者发长文回应了自己的“背锅”阅历,表明代码在自己入职之前就已存在。
此外,橘皮优团队在2024年11月发布的对潞晨科技的揭露信也被挖出,该揭露信说到,“潞晨云算力云渠道公开抄袭咱们的事务形式和机主协议,侵犯了知识产权。”袁进辉转发了该揭露信并配文称:“不是一次抄袭,屡次产生。”。
贝壳财经记者注意到,尽管潞晨科技和硅基活动互相责备,但二者都曾和华为云协作,为用户推出根据国产算力的DeepSeek服务,而在DeepSeek发布开源计划之后,这些AI Infra企业能否复现DeepSeek的技能细节,从中摊薄本钱,就成了检测企业技能实力的时分。
值得注意的是,尽管DeepSeek在曩昔一周中开源了多个代码库,但大多数是针对英伟达芯片架构的。对此,有开发者告知贝壳财经记者,这些开源效果无法直接用在华为云的推理服务中,但其思维能够学习。
当时,DeepSeek的本钱透明化好像一面镜子,照射出了AI Infra企业的抱负与实际,怎么更好地学习DeepSeek的解决计划,操控企业本钱,或许才是“破局”的钥匙,究竟545%的抱负赢利率现已被DeepSeek“点出”。
当技能盈利逐步衰退,AI Infra企业需答复更实质的问题:是持续内卷于算力租借的价格战,还是以模型优化、场景深耕和生态整合构建真诚的壁垒?这场争议或许仅仅前奏,职业的生计规律正在被从头书写。
记者联络邮箱:luoyidanxjbnews.com。
新京报贝壳财经记者 罗亦丹。
修改 王进雨。
校正 柳宝庆。