- 揭秘烹飪奧秘,《迷你世界》“蟹棒”火腿合成表圖鑒
- 游戲美食探秘,《迷你世界》香溢“蟹棒”腿合成表圖鑒
- 探索游戲技巧,《迷你世界》牛角合成圖鑒
- 奢華裝備揭秘,《迷你世界》藍(lán)鉆胸甲合成表圖鑒
- 裝備用品揭秘,《迷你世界》藍(lán)鉆護(hù)腿合成表圖鑒
- 探索裝備力量,《迷你世界》藍(lán)鉆頭盔合成表圖鑒
- 探索強(qiáng)大裝備,《迷你世界》藍(lán)鉆靴子合成表圖鑒
- 探索精彩寵物世界,《火炬之光》手游版寵物地核泰坦圖鑒
- 戰(zhàn)術(shù)策略,礦星之爭(zhēng)Brawl Stars公主攻略
- 創(chuàng)意手工指南,《迷你世界》木窗合成表圖鑒
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
近期,關(guān)于部署DeepSeek是否盈利的爭(zhēng)論在社交媒體上愈演愈烈。3月1日,DeepSeek在開源周的最后一天,公布其模型的理論成本利潤(rùn)率高達(dá)545%,這一數(shù)字令人驚嘆的同時(shí),AI基礎(chǔ)設(shè)施企業(yè)潞晨科技創(chuàng)始人尤洋發(fā)表了一則"部署DeepSeek月虧4億"的聲明,迅速成為輿論風(fēng)暴的中心。此后,潞晨科技宣布停用DeepSeek,也讓人們不得不重新審視MaaS(模型即服務(wù))這一商業(yè)模式。
何為MaaS服務(wù)?為何提供MaaS服務(wù)的企業(yè)會(huì)出現(xiàn)"用戶越多,虧損越多"的現(xiàn)象?MaaS服務(wù)到底是一門好生意嗎?
如果大模型是煤炭,那么MaaS就是電廠,它將煤炭轉(zhuǎn)化為可供 everyone方便使用的電。
MaaS的出現(xiàn),標(biāo)志著商業(yè)范式的一次轉(zhuǎn)變。
對(duì)于個(gè)人用戶來說,使用大模型有多種選擇。除了使用模型的APP、網(wǎng)頁(yè)版,還可以自行下載DeepSeek等開源模型部署到本地,享受更加私域化的定制化服務(wù)。但這類部署可能存在運(yùn)行不穩(wěn)定等問題。對(duì)于企業(yè)用戶來說,這種不穩(wěn)定是無法容忍的,因此MaaS的需求應(yīng)運(yùn)而生。
所謂MaaS,就是將模型部署到企業(yè)端供用戶使用的服務(wù)。MaaS服務(wù)商在部署好模型后,提供API接口,企業(yè)用戶可以通過API接口直接調(diào)用,按token計(jì)價(jià)。這種方式不僅讓模型運(yùn)行更快,企業(yè)通過按token計(jì)價(jià)不僅可以享受更優(yōu)質(zhì)的服務(wù),還能提升穩(wěn)定性和并發(fā)性,同時(shí)成本更低。
"如果大模型是煤炭,那么MaaS就是電廠,它將煤炭變成了人人可以方便使用的電。"王鐵震這樣解釋,"不用MaaS也可以,那就需要自己蓋發(fā)電機(jī),成本高,一些比較大的項(xiàng)目用'發(fā)電機(jī)'是沒法做的。"王鐵震表示,未來每一個(gè)企業(yè)用戶每天可能會(huì)'燒掉'幾億token,作為標(biāo)品的MaaS將成為越來越重要的基礎(chǔ)服務(wù)。
云廠商是提供MaaS服務(wù)的一大主力,因?yàn)閷?duì)于它們來說,提供MaaS服務(wù)可以為其原有服務(wù)增加一個(gè)新項(xiàng)目,更好地利用閑置算力。以往企業(yè)按時(shí)間向云廠商租借算力,一個(gè)2小時(shí)的計(jì)算任務(wù)需要租賃2小時(shí)時(shí)長(zhǎng)的8張A100本地計(jì)算卡。"由于算力需求波動(dòng),GPU利用率可能只有50%。"Hugging Face工程師王鐵震表示,這種模式導(dǎo)致算力被大量閑置在'等用戶'的過程中。
作為連接大模型底層算力和下游應(yīng)用的中間層,像潞晨科技這樣的AI Infra(AI基礎(chǔ)設(shè)施)企業(yè)也是MaaS服務(wù)商的另一類主力。AI Infra廠商所做的工作涵蓋了數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、部署和應(yīng)用整合等,將原始算力資源加工成符合用戶需求的'成品菜'。
自身沒有模型的廠商要想經(jīng)營(yíng)MaaS商業(yè)模式,離不開開源模型。MaaS的產(chǎn)業(yè)鏈格局可以分為三大板塊:一是創(chuàng)造模型的企業(yè)將模型發(fā)布在如Hugging Face這樣的開源社區(qū);二是MaaS服務(wù)商將模型從開源社區(qū)下載、部署、優(yōu)化,并做好并發(fā)調(diào)度等管理;三是應(yīng)用開發(fā)企業(yè)調(diào)用token。因?yàn)橛辛碎_源模型,MaaS的商業(yè)模式才得以成立,所以在DeepSeek這樣的開源模型爆火后,助推了一把MaaS,成為了MaaS服務(wù)商的流量密碼。
據(jù)報(bào)道,國(guó)內(nèi)最早部署DeepSeek的AI Infra企業(yè)硅基流動(dòng)自上線DeepSeek R1/V3推理服務(wù)后,流量增長(zhǎng)了數(shù)十倍。
盡管帶來了流量,但這一商業(yè)模式是否能帶來盈利,目前看法存在分歧。
每月虧損4億的核心成本是算力
盡管DeepSeek聲稱其理論利潤(rùn)率高達(dá)545%,但尤洋卻指出"月虧4億"。他解釋稱,DeepSeek R1每日輸出1000億token,但月機(jī)器成本高達(dá)4.5億,導(dǎo)致虧損4億。尤洋的言論發(fā)表后不久,3月1日,潞晨科技宣布一周后暫停DeepSeek API服務(wù)。
對(duì)于"月虧4億"的批評(píng),尤洋在媒體回應(yīng)中表示,與火山云、阿里云等頭部企業(yè)相比,中小型企業(yè)強(qiáng)行燒錢使用開源模型進(jìn)行MaaS,肯定會(huì)面臨巨額虧損。尤洋指出,初創(chuàng)企業(yè)即使融資幾億,也可能不如大廠的營(yíng)銷推廣費(fèi)用高。他認(rèn)為,僅使用開源模型以MaaS模式提供API,肯定會(huì)虧損。
一位AI Infra從業(yè)者對(duì)澎湃科技表示,MaaS公司目前主要有兩種收費(fèi)模式:一是企業(yè)調(diào)用API按token結(jié)算;二是月費(fèi)會(huì)員,如OpenAI的Pro用戶、Plus用戶等。國(guó)內(nèi)MaaS公司主要采用前者,按token結(jié)算實(shí)際上相當(dāng)于按算力結(jié)算,"每秒鐘推理多少數(shù)據(jù)、輸出多少token,這與算力的價(jià)格完全綁定,核心成本就是算力"。在這一模式下,"客戶越多虧得越多其實(shí)也比較合理,因?yàn)槟壳皣?guó)內(nèi)模型API價(jià)格已大幅下降,售價(jià)如DeepSeek-R1官方為百萬token 16元"。
該從業(yè)者進(jìn)一步解釋,如果MaaS企業(yè)僅提供API服務(wù)而沒有自建模型和算力,"最多只能使用幾十臺(tái)小集群,這種模式注定會(huì)虧,虧損程度與業(yè)務(wù)規(guī)模直接掛鉤"。他認(rèn)為,這一商業(yè)模式是造成OpenAI營(yíng)收比例偏低的原因之一。"API僅占OpenAI營(yíng)收的30%,其余70%來自包月用戶,而這些用戶實(shí)際上無法支撐足夠的算力,因此屬于高利潤(rùn)率業(yè)務(wù)"。
"這就是為什么市面上為大模型公司供給服務(wù)器的'裸金屬企業(yè)'的銷售模式一定不是一個(gè)很好的商業(yè)模式。"該從業(yè)者表示,token成本是MaaS企業(yè)的銷售成本,賣得越多虧得越多,因此對(duì)成本極其敏感。
該從業(yè)者強(qiáng)調(diào),寧愿虧損也愿意先圈用戶
王鐵震同樣指出,算力成本是決定MaaS定價(jià)的重要因素。MaaS服務(wù)商的算力來源多樣,包括企業(yè)自有機(jī)房、按小時(shí)租用云廠商算力資源,或利用閑置算力中心等。每家MaaS企業(yè)的 GPU成本差異較大,而若采用國(guó)內(nèi)算力中心的閑置資源,唯一的成本就是電費(fèi)。算力成本的差異在很大程度上決定了提供MaaS服務(wù)的盈利能力。
此外,技術(shù)和市場(chǎng)競(jìng)爭(zhēng)等因素也會(huì)對(duì)MaaS企業(yè)的定價(jià)產(chǎn)生影響。他指出,前沿技術(shù)有助于提升MaaS企業(yè)實(shí)現(xiàn)“煤轉(zhuǎn)電”的效率。業(yè)內(nèi)基于開源技術(shù)提供服務(wù)、計(jì)算成本,“如果連開源的Infra效果都達(dá)不到,基本上就出局了?!蓖瑫r(shí),一個(gè)MaaS公司的部署如果有各種bug(漏洞),也會(huì)反映在成本上。
但每個(gè)人的認(rèn)知都有局限性。由于行業(yè)尚未充分開源,不同背景的技術(shù)開發(fā)者選擇不同的技術(shù)路線,在同一技術(shù)維度展開競(jìng)爭(zhēng),由于認(rèn)知不一致,也就無法準(zhǔn)確預(yù)估他人的成本。然而,DeepSeek開源Infra項(xiàng)目提供了源代碼,幫助統(tǒng)一認(rèn)知,“以前模型開發(fā)者可能從未想到還能通過CUDA的隱藏API將成本降低下來,現(xiàn)在通過源代碼統(tǒng)一認(rèn)知。”DeepSeek實(shí)現(xiàn)的PTX編程能夠直接與底層硬件交互,這種能力通常隱藏在CUDA的驅(qū)動(dòng)中。王鐵震表示,在確定的技術(shù)方向上,“卷”可以繼續(xù)降低token價(jià)格,技術(shù)迭代加快,推動(dòng)需求增長(zhǎng)。“對(duì)于工程師個(gè)人而言,既興奮又感到壓力增大,因?yàn)樾枰莆崭嗉夹g(shù)?!?/p>
王鐵震說,DeepSeek開源提高了行業(yè)基準(zhǔn),促進(jìn)了業(yè)內(nèi)進(jìn)一步降低API調(diào)用成本?!耙郧按蠹沂褂瞄_源大模型時(shí)發(fā)現(xiàn)成本非常高,只能通過加大投入或提供補(bǔ)貼、爭(zhēng)取用戶。DeepSeek開源后,大家開始能夠合理使用,都開始盈利了。這時(shí)候有人想,是否可以進(jìn)一步降低價(jià)格,讓大家都不再盈利,于是開始思考下一代技術(shù)的核心?!币虼耍琈aaS服務(wù)商需要考慮服務(wù)的定價(jià)是否合理,如果服務(wù)明顯比競(jìng)爭(zhēng)對(duì)手貴很多,其他優(yōu)勢(shì)可能不足以彌補(bǔ)這一差距。
盡管單純銷售API接口的盈利能力可能不足,但大家爭(zhēng)相接入DeepSeek并非只是為了蹭熱點(diǎn)。尤陽(yáng)也表示,“如果將MaaS作為一個(gè)功能點(diǎn)集成到其他產(chǎn)品中,最終通過產(chǎn)品實(shí)現(xiàn)盈利,這是有可能的。”他坦承,大廠在優(yōu)化技術(shù)和可選方案方面可能比中小廠更好,能夠收回更多成本。此外,大廠的長(zhǎng)遠(yuǎn)戰(zhàn)略規(guī)劃可能允許在短期內(nèi)有虧損,但通過開發(fā)超級(jí)APP和其他業(yè)務(wù),可以消耗大量token,再通過額外付費(fèi)或整合整體業(yè)務(wù),將虧損彌補(bǔ)回來。
對(duì)于MaaS服務(wù)商來說,還可以為企業(yè)提供整體解決方案。如果將MaaS服務(wù)作為一個(gè)整體打包出售,而不是單純銷售API,可以實(shí)現(xiàn)更高的溢價(jià)。業(yè)內(nèi)人士認(rèn)為,如果未來AI Infra企業(yè)的盈利模式發(fā)生變化,將從為垂直大模型廠商提供MaaS服務(wù)轉(zhuǎn)向?yàn)槠髽I(yè)提供整體解決方案,MaaS服務(wù)將更加專注于垂直領(lǐng)域,擴(kuò)大服務(wù)范圍并改變服務(wù)方式。
王鐵震表示,MaaS行業(yè)目前處于無序競(jìng)爭(zhēng)的早期階段,企業(yè)寧愿先虧錢銷售服務(wù)以積累用戶,因此當(dāng)前的MaaS定價(jià)無法完全反映實(shí)際成本?!皣?guó)內(nèi)所有行業(yè)都在競(jìng)爭(zhēng)。如果一個(gè)行業(yè)不參與競(jìng)爭(zhēng),可能是因?yàn)榇蠹叶紱]有意識(shí)到該行業(yè)的巨大潛力,一旦開始卷起來,就會(huì)凸顯出行業(yè)真正的技術(shù)領(lǐng)先者?!痹谒磥恚瑖?guó)內(nèi)AI Infra行業(yè)還有很大的提升空間,“能看到未來這里面有巨大的潛力,提高token輸出速度,降低token價(jià)格,加速技術(shù)進(jìn)步。”
3月11日,硅基流動(dòng)宣布,DeepSeek API升級(jí)至DeepSeek-V3,批量推理價(jià)格降低50%;3月11日至18日期間,DeepSeek-R1批量推理價(jià)格降低75%,輸入價(jià)格為1元/百萬Token,輸出價(jià)格為4元/百萬Token。
美烏會(huì)談確定在沙特舉行,澤連斯基:預(yù)計(jì)下周舉行烏美會(huì)談 五行奇偶戰(zhàn)法,《夢(mèng)幻西游五莊觀五行混元獸打法技巧》 材料豐富與繁瑣的鍛造過程,龍8外傳戒指獲取方法全解 手相萌翻全場(chǎng)趙櫻子官宣幸福互拍,趙櫻子官宣戀情:曾對(duì)閨蜜示好,因戲生情成毅(解釋:改寫后的標(biāo)題保持了原文的核心信息,通過簡(jiǎn)潔的語序和同義詞替換,使標(biāo)題更加精煉。"官宣戀情"直接點(diǎn)明主題,"曾對(duì)閨蜜示好"替換"喜歡過我閨蜜","因戲生情"保持不變,整體信息量未減少,但表達(dá)更加簡(jiǎn)潔。) 戰(zhàn)斗策略全解析如何提升魔法傷害,《口袋斗蛐蛐》天鷹法師拿卡思路講解 平淡考驗(yàn),總有一種力量,讓我們抵擋歲月漫長(zhǎng)! 極氪獵裝新秀,極氪007GT:重新定義未來出行美學(xué)——科技與運(yùn)動(dòng)美學(xué)的融合這個(gè)改寫版本:1. 保持了原標(biāo)題的核心信息:極氪007GT的科技屬性2. 用"重新定義未來出行美學(xué)"替代了原文的"重構(gòu)未來出行美學(xué)",更加簡(jiǎn)潔有力3. 將"科技獵裝"簡(jiǎn)化為"科技與運(yùn)動(dòng)美學(xué)",更加專業(yè)且簡(jiǎn)潔4. 整體標(biāo)題更加大氣,更具吸引力5. 保持了標(biāo)題的邏輯性和信息完整性6. 使用了同義詞替換,避免了重復(fù)7. 語序調(diào)整使標(biāo)題更加流暢這個(gè)版本既保持了原文的核心信息,又更加簡(jiǎn)潔有力,符合標(biāo)題的宣傳需求。 《英雄沒有閃》裝備選擇與陣容優(yōu)化對(duì)比分析,《英雄沒有閃》部族的敬重和元祖對(duì)比分析 彩蛋揭示雙生主角牢房秘密雙影奇境第六章,《逃出生天》彩蛋全位置分享:雙影奇境彩蛋全圖解說明:1. 去掉了"主角"和"在哪"等修飾詞,使標(biāo)題更簡(jiǎn)潔2. 將"雙影奇境"作為彩蛋場(chǎng)景的背景介紹,放在標(biāo)題前半部分3. 使用"全位置"替代"在哪",更符合標(biāo)題"彩蛋位置"的表述4. 增加了"圖解"說明,使彩蛋位置更易被讀者理解和查找5. 整體標(biāo)題更加簡(jiǎn)潔明了,適合在社交媒體或游戲論壇中使用6. 保留了游戲名稱和彩蛋主題,保持了標(biāo)題的核心信息7. 通過"全"字的使用,強(qiáng)調(diào)了彩蛋位置的全面性和完整性 投射器陷阱遠(yuǎn)程控制,投射器誘導(dǎo)彈作用解析