今年6月,在2023騰訊股東大會上,當被問及大模型進展時,馬化騰曾說,“我們一樣在埋頭研發,但是并不急于早早做完,把半成品拿出來展示。”
如今雖遲但到,鵝廠終于也推出了自己的通用大模型。9月7日,騰訊在一年一度的全球數字生態大會上,正式“亮相”了自己的混元大模型。
【資料圖】
騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生介紹:混元大模型通過騰訊云對外開放,并已接入了騰訊廣告、游戲、金融科技、騰訊會議、微信搜一搜等產品。
湯道生表示,該大模型產品是由騰訊全鏈路自研的通用大語言模型,擁有超千億參數規模,預訓練語料超2萬億tokens,將作為騰訊云MaaS服務的底座,支持API直接調用,以及專屬大模型產品應用構建。
如今一個普遍行業共識是:大模型正在改變云生態。它有可能成為互聯網云廠商在價格戰之外謀求份額增長的新動力,并為云計算行業帶來全新的變革契機。
而在今年以來,騰訊云在公有云業務(IaaS+PaaS)市場份額下降的現實基礎上,抓住此次時機,也顯得尤為重要。騰訊云總裁邱躍鵬也在會上表示:“云是大模型的最佳載體,大模型將開創下一代云服務的全新形態。”
為何騰訊姍姍來遲
據賽迪顧問數據顯示,截至 2023 年 7 月,中國累計已經有130個大模型問世。
今年上半年,在百度、阿里等一眾大廠爭發大模型之時,“不趕風頭”的鵝廠,顯得較為謹慎。不過相較于各家大廠普遍踏足的通用大模型,騰訊從一開始就把大模型重心引向了B端應用。
6月19日,騰訊云首次公布了行業大模型進度,發布了TO B客戶解決方案:騰訊云MaaS(Model-as-a-Service,模型即服務),覆蓋了金融、文旅、政務、傳媒、教育等10大行業的多個模型,并提供了超過50個解決方案。
那時,行業和客戶已經有很多關于大模型的需求。在經歷幾個月的在騰訊文檔、會議等應用磨練后,騰訊才終于有信心把大模型開放出來,服務更多企業。
▲圖注:騰訊集團副總裁蔣杰
據騰訊副總裁蔣杰介紹,彼時,已經收到了很多客戶需求詢問,但還沒有對模型進行全面深度的評測,處于半研發半應用的階段。
“騰訊的混元的大模型的體系,一開始不光是為了業界做一個發布,甚至評測、去打榜,我們一開始就是根據騰訊企業自己的自身的應用,去做了一個這樣的研發和匹配,去做一些跟大模型更深度結合的應用,才能夠去抵消整個大模型高昂的設備、訓練、人員的成本。”蔣杰說。
早在2022年4月,騰訊首次對外披露了旗下“混元”AI大模型的研發進展,完整覆蓋了NLP(自然語言處理)、CV(計算機視覺)、多模態等基礎模型和眾多行業模型。但類chat大語言模型則是遲遲未推出。
事實上,過早地推出大模型,也容易“翻車”,出現“幻覺”。
所謂“幻覺”,簡單說就是大模型“胡言亂語”。為了確保大模型更加可靠,降低“幻覺率”是大語言模型的重中之重,即便不能徹底解決,但也盡力從概率上降到最低。
據介紹,騰訊混元的“幻覺率”相比主流開源大模型可降低30%至50%, 用的是自研的“探真”技術來解決“幻覺”。
“外界其實一般多會用到知識圖譜,甚至搜索外掛來讓模型的檢索支持能力變得更強,騰訊也會用,但不能用的比例很高。我們一定要在整個的大模型的預訓練階段把這個問題解決掉,控制掉。現在看到很多家開源模型和廠家發布的模型,搜索增強用到10%以上甚至更多,但這個會導致出現不一樣的幻覺。”蔣杰說。
終局還是云之戰
如今,大模型與To B的結合,已經越來越成為行業共識。在國內大模型之戰打到焦灼之時,最近OpenAI 也推出了ChatGPT企業版,開始探索To B市場。
根據第三方網站 SimilarWeb 的監測數據,今年7 月,OpenAI 網站與移動客戶端流量月環比下降了10.35%。8月中旬,市場調查分析機構 Gartner 也在發布的生成式 AI 炒作周期報告中指出,當前大模型發展已達到“膨脹預期峰值”,在未來的兩到五年內,要么實現轉型,要么跌入幻滅的低谷。
當下,前有ChatGPT企業板,后有開源的Llama2(Meta 的大語言模型),整個大模型行業門檻降低,市場則陷入了營收難的境地。
云廠商們也開始意識到 , 相較于難以預見的大模型商業化落地前景, 云作為最前端可以售賣的 To B產品, 更容易盡早賺錢。大模型的發展需要依靠算力、算法和數據的支持,這都需要云計算應用場景。也就是說,大模型之戰的最終落地,還是要搶奪公有云市場。
而今年以來,隨著個人、中小企業用戶使用量減少,增速放緩,加之“政務云”的崛起,阿里云和騰訊云的市場份額均有所減少。
從資源利用率以及趨勢來看,私有云難以成大勢,公有云依然是主流市場。
根據中國信通院最新發布的《云計算白皮書(2023年)》,2022 年IaaS 市場收入穩定,規模在2442億元,是PaaS+SaaS的3倍,依然占據主導地位。
IaaS靠規模效應賺錢,但投入過程長。但在激烈競爭下,產品同質化嚴重,云廠商不得已通過價格戰來搶占市場。今年4月,新一波的降價潮開啟,先是阿里云帶頭降價,京東云、騰訊云、華為云、天翼云等緊隨其后。
IaaS 業務的高度雷同,低價策略難以可持續發展,騰訊云也開始探索不同的路線。PaaS、SaaS業務雖然體量小,但毛利率更高。但這兩塊業務投入大,騰訊云仍處于艱難的“爬坡”時期。
也因此,騰訊推出大模型,以提效為第一要義。“大語言模型更有商業永遠價值的應該是提效,提效是更有價值的。”
蔣杰提到,騰訊是一個海量高并發的業務。“開源的很多的架構是不適應騰訊的體量,所以一定要走出一套基于自主體系的研發的道路,才能夠去應對這些海量高并發的業務的沖擊。”
大模型之戰的同質化,讓大廠間的競爭身位也難分軒輊。
蔣杰提到,如果未來對大語言模型進行評分,是一個綜合實力的過程,“可能未來幾個大的頭部的廠家,評分差距只可能僅僅1分和2分的差距。這個版本他高了1分,下一個版本另外一個國內廠家就是再高了一兩分,這是一個不斷博弈和循序漸進的過程。所以其實隨著大家投入這種資源不一樣,摳的細節不一樣,到最后這個差異才會出來。”
作者 | 趙子坤
編輯 | 李 原
運營 | 解一帆