持續兩天的2023騰訊全球數字生態大會在9月8號落幕了,在老板定調“AI是百年不遇的機會,因此不急于一時”過后,騰訊自研的通用大語言模型“混元”終于還是亮相了。
跟國內同行推出的競品相比,鵝廠的大模型節奏在常人眼里多少有點太沉得住氣了,比如據說隔壁的文心一言已經在從芯片到框架,從模型到應用方面經過了多輪優化。
不過很難說經過更多時間打磨但還沒實戰過的混元,能夠跟其他大模型在能力上有著差異化的優勢,盡管在官方舉例的一個邏輯推理場景里混元的表現超過了GPT3.5,處于跟GPT4一樣的水平。
當然,混元大模型的亮相對騰訊云來說仍然是個相當利好的因素。
在過去這大半年里,阿里云和百度云都把模型即服務(MaaS)當作敘事的核心,張勇和沈抖兩個人用略有差異的語言傳遞著相同的口號:所有行業都值得用大模型重做一遍。
在華為云憑借在政務市場的資源優勢對騰訊云實現彎道超車過后,騰訊在這幾年的聲量小了很多,這個轉變在馬化騰去年底那次著名的內部講話之前就已經發生了。
騰訊云自2020年開始不再單獨對外披露營收狀況,而是合并到了財報中的金融科技和企業服務(FBS)部分。在騰訊發布的最新二季報里,FBS部門的營收同比增長了15%,同時毛利率也達到了38.4%,是有記錄以來的最高值。
不過這部分業績增長的最大功臣并不在云計算業務,出力的大頭是以支付業務為核心的金融科技和視頻號。云計算部門的營收增長相當有限,官方的用詞是“modest growth”。
對外界而言,有關騰訊云的一個靈魂之問是,經歷了這么長時間的“可持續轉型”,騰訊的盈利時刻還有多遠。要知道百度云的市場份額是低于騰訊云的,而沈抖在去年五月輪崗上任過后,已經在今年一季度實現了盈利。
湯道生該著點急了。
01、托底下限取中庸
在中國信通院發布的《云計算白皮書(2023)》當中,阿里云、天翼云、移動云、華為云、騰訊云和聯通云分別占據中國公有云IaaS市場份額的前六名;而在公有云PaaS層面,騰訊云的份額則僅次于阿里和華為兩家,排在第三位。
所以一個客觀的情況是,雖然騰訊云整體營收在前兩年被華為云超過了,但騰訊云仍然是國內云計算市場里除三大運營商之外的Top玩家,并且跟華為云的差距也還算穩定。背靠著騰訊龐大的社交和游戲生態,只要騰訊還想做云計算這塊業務,這部分下限永遠都是有保障的。
然而下限有保障不代表業務能做到出色,甚至不排除有時候會因為有人托底而缺乏進取的動力。如果排除掉三大運營商,騰訊云大概是中國互聯網云廠商最缺乏特色的,從上到下透著一股中庸之道。
試想,提起阿里云,人們能想起馬云的遠見和王堅的隱忍,能想到阿里云研發的飛天因而給其投射上一層技術濾鏡。百度云這邊,雖然李彥宏最初關于云計算的論斷成了業界的談資,但人家死死抓住AI這面大旗,國內第一個搞出文心一言也算是不辱人設。華為云就不用說了,繼承了華為的狼性作風和政企領域的深厚基礎,因而才能快速后發先至。跟這些競爭對手相比,你似乎很難找到騰訊云的特色。
比如,談到騰訊云在大模型方面的技術優勢時,無論是官方的公眾號文章推送,還是財報電話會議上的PPT演示文稿,抑或是騰訊云內部高管對外的專訪,《新立場》注意到除了各家都會聊的一些軟硬件生態支持,騰訊云還著重強調了自研的向量數據庫。
從目前各家云廠商在營銷和PR方面的實踐看,騰訊云似乎是唯一拿這點出來強調宣傳的。
所謂向量數據庫,是近年來在傳統關系型數據庫(SQL)之外,衍生出來的非關系型(NoSQL)數據庫的一種。它將數據以向量形式存儲,可實現向量數據的相似度搜索、聚類、降維等操場。
跟傳統數據庫相比,向量數據庫能夠高效地處理大規模和高維的復雜數據,例如圖像、音頻和視頻等,因此廣泛應用在以圖搜圖、推薦引擎、聊天機器人等領域。
把原始的多模態數據轉換成向量實際就是壓縮的過程,這對于需要現在動不動就需要接收上萬億token預訓練語料的通用大模型來說非常重要。
舉個例子,人類在見到一個熟悉的對象時,大腦的思考過程是這樣的。首先,眼睛中的視桿細胞和視錐細胞會記錄下光感強度,然后把信號傳遞到大腦的視覺皮層。隨后皮層中數以百萬計的神經元被激活,當激活信號傳遞到顳葉時,大腦就會解釋成“我看到了某人”。所以,當大腦試圖理解信息時,真正解讀的是視覺皮層輸出的神經表示,而非進入到眼睛的原始圖像。
深度學習模型其實也是如此。盡管大模型是端到端的呈現形式,從文本輸入到文本輸出,但是模型實際接觸和學習的數據并不是文本本身,而是向量化的文本。因為文本本身直接作為數據的話,會因維度太高導致學習起來過于低效。而向量化的文本相當于對自然語言的壓縮和總結,會大大改善這個過程。
所以從技術背景上說,向量數據庫的確在大模型時代具有基礎作用。但問題是,這是否能成為騰訊云開展業務的差異化基礎。
實際上,在國內向量數據庫幾乎是所有做大模型研發的大廠標配,百度、阿里、科大訊飛這些公司都有自己的產品。同時還有一波創業公司在做這件事,無論是開源的Milvus還是閉源的Pinecone,并且在benchmark上還普遍比大廠表現更好。
2018年,當騰訊大張旗鼓向2B方向轉型的時候,騰訊云這塊業務是先鋒。當時很多人質疑一直以來都是2C產品見長的騰訊沒有2B基因,馬化騰不信。后來到了2020年Q4,FBS對騰訊營收的貢獻首次與游戲持平,并在2021年四季度成為最大營收來源。
從這個角度看,似乎騰訊的2B戰略的確取得了成功。然而從FBS業務的構成看,撐起局面的最大功臣顯然是微信支付。即便騰訊籠統地把這塊劃到了2B里面,但支付業務的成績顯然應該歸功于微信作為社交工具的成功。倒是過去幾年透出中庸甚至平庸的騰訊云,作為真正的2B業務試金石,某種程度上表明了騰訊2B轉型面臨的挑戰。
02、湯道生不比沈抖難
相較于國外同行,國內的云計算廠商在賺錢這條路上走得非常艱難。
在這個問題上,行業的發展可以被大致分成兩個階段。大概在2020年之前,這些云廠商是主觀的不太想掙錢。從移動互聯網浪潮興起開始,國內的互聯網企業經歷了一波又一波的燒錢擴張,得到的經驗是燒錢最終不一定成功,但不燒錢一定立刻就死。
云計算行業保留了這種慣性,各大云企都有過花錢做慈善賠本賺吆喝的非理性行為,一分錢一元錢中標的案例不勝枚舉。后來隨著互聯網的用戶滲透達到頂峰,資本市場氛圍收緊,行業的整體基調很快轉向了業務可持續性上來。當然由于前些年的高強度內卷搞得太過,客戶的口味多少有點刁了,陡然間云廠商想掙錢并不容易。
阿里云這邊因為業務開展得最早,同時體量也最大,所以最早邁過盈虧平衡的門檻。根據阿里的財報,阿里云在2021財年Q3(自然年2020年Q4)實習了首次盈利:單季營收116.15億元人民幣,經調整EBITA盈利為2400萬元。隨后阿里云保持了上述趨勢,并在2022財年實現了年度扭虧。
不過需要注意的是,即便實現了穩定盈利,阿里云實際的變現水平仍然偏低,最近財年的經調整EBITA利潤只有14.22億元人民幣。除阿里云之外,國內其他云廠商無論體量大小,基本都仍在虧損。
最近一個成功扭虧的廠商是百度智能云,該業務已經連續兩個季度實現non-GAAP層面扭虧,背后的功臣是百度的中生代高管沈抖。
沈抖是在去年五月以輪崗的名義被安排到負責智能云業務的,但正如《新立場》在此前文章中提到的,這種輪崗從性質上說有“發配”的意思。此前沈抖主導了手機百度的信息流轉型,推動移動生態事業群從搜信息拓展到搜服務,被李彥宏形容為“具有戰略視野,敢打硬仗、能打勝仗”。
而當時ChatGPT還沒冒頭,智能云雖然名義上是百度極其重要的前景業務,但錯過先發優勢后增長明顯乏力,沈抖去能做的事情十分有限。
然而到2023年5月,僅僅一年過后,百度發布2023Q1財報時,智能云業務就首次實現了季度盈利。在去年五月宣布輪崗安排的那封公開信里,李彥宏給沈抖的指示是“實現規模和健康度的量變到質變,為百度第二曲線的發展建立新的功勛”。
從實際效果看,沈抖證明當初他帶領手百成功轉型不是偶然。另外,就時間點而言,百度發布文心一言是在3月16號,所以沈抖在一季度的扭虧是沒有趕上任何大模型方面的紅利的。
而騰訊云這邊,從馬化騰本人的表態看,他對公司的云業務有著跟李彥宏類似的期待,只不過湯道生目前還沒做到沈抖的成績。湯道生負責騰訊的云計算業務有些年頭了,論根基比沈抖深多了。
騰訊2018年成立云與智慧產業事業群的時候他就是CEO,在2018年以前也掌管著騰訊的云計算業務。騰訊云的體量也比百度智能云要大,所以綜合來看湯道生這么多年還沒能帶領騰訊云扭虧沒有道理。
湯道生并不比沈抖難。
03、寫在最后
一個頗為有趣的細節是,馬化騰似乎要比李彥宏寬容得多。
在去年底那次著名的內部講話里,他說過去三年CSIG做了很多沖量的事情,追求做前端集成,追求大數字營收。但他同時也給湯道生找了臺階下,“湯道生之前并不想這樣做,但騰訊經常被市場份額和輿論的大勢裹挾,被迫做總包去拿市場份額”。
從這個角度說,騰訊云作為騰訊2B最關鍵的招牌,湯道生理應更加不負期待。