騰訊混元大模型:不著急,但不缺席
如何在具體行業(yè)和場景中落地,如何把大模型的能力在應(yīng)用層上跑通,正在成為大模型較量的關(guān)鍵。
撰文|藍(lán)洞商業(yè) 趙衛(wèi)衛(wèi)
打開微信,搜索「騰訊混元助手」,在內(nèi)測版小程序注冊申請,就會跳出「排隊中」界面,「你已經(jīng)在等待體驗中,本期內(nèi)測開放名額有限,加入成功將會有短信進(jìn)行提醒。」
(資料圖片)
這是目前,一個普通人接觸騰訊混元大模型最快的方式。
騰訊的大模型,姍姍來遲。終于在9月7日的騰訊全球數(shù)字生態(tài)大會上發(fā)布,擁有超千億參數(shù),騰訊云、騰訊廣告、騰訊會議等都已經(jīng)開始接入。
騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生介紹:「騰訊混元大模型擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超2萬億tokens,具有強(qiáng)大的中文理解與創(chuàng)作能力、邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力?!?/p>
「已經(jīng)有 50 多個產(chǎn)品在應(yīng)用混元大模型,在騰訊內(nèi)部,混元大模型已經(jīng)成為業(yè)務(wù)底座,可以說騰訊已經(jīng)全面擁抱大模型?!跪v訊集團(tuán)副總裁蔣杰表示。
坐擁微信和QQ兩大國民級應(yīng)用,大語言模型的C端落地場景是騰訊最具想象力的部分;而大語言模型如何在B端市場的行業(yè)側(cè)落地,也成為騰訊在今年9月逐漸開放的能力方向。
ChatGPT帶動了大語言模型創(chuàng)業(yè)熱潮。自今年3月以來,先是百度發(fā)布文心一言內(nèi)測版;4月,阿里旗下的通義千問也開始內(nèi)測,此后國產(chǎn)大模型爭搶發(fā)布,被行業(yè)內(nèi)戲稱為「百行千?!?。
如今,騰訊的大語言模型混元雖遲但到,終于讓BAT在大語言模型的戰(zhàn)場上再次成為對手。
之前,包括百度文心一言在內(nèi)的第一批大模型在8月31日通過備案正式上線,意味著大模型市場競爭進(jìn)入了公開化的全新階段,面向用戶全面開放,也就加速了產(chǎn)品應(yīng)用的落地。
百度集團(tuán)執(zhí)行副總裁、智能云事業(yè)群總裁沈抖曾對媒體說,在文心一言開放當(dāng)天,在百度智能云千帆大模型平臺(百度面向企業(yè)端推出的大模型開發(fā)與管理平臺)上,日活企業(yè)數(shù)增長超過 40%。
左手to C,右手to B,已經(jīng)成為大模型的一體兩面。
而「百行千模」帶來的審美疲勞,也最終讓行業(yè)認(rèn)識到,如何在具體行業(yè)和場景中落地,如何把大模型的能力在應(yīng)用層上跑通,正在成為大模型較量的關(guān)鍵。
在爭搶用戶和客戶為主題的大模型冷靜期中,騰訊如何后來居上也成為留給自己最大的考驗。
大模型爭搶方向:更實用
對標(biāo)ChatGPT一直是國內(nèi)大模型的主要基調(diào),「在口語化文本精確理解、超長記錄高效提煉、理解生成實時處理上,騰訊混元大模型中文能力已經(jīng)超越GPT3.5?!?/p>
蔣杰稱,「你可以把混元看作是一個在內(nèi)部開源的模型,公司的每個業(yè)務(wù)都可以看到我們發(fā)布的所有能力,并基于這個能力去與應(yīng)用相結(jié)合?!?/p>
混元大模型的核心賣點在于,它是由騰訊全鏈路自研的通用大語言模型,可以流暢進(jìn)行專業(yè)領(lǐng)域的多輪對話,具備強(qiáng)大的中文創(chuàng)作能力,復(fù)雜語境下的邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力,對行業(yè)更重要的是,混元將作為騰訊云MaaS服務(wù)的底座,客戶可直接調(diào)用或作為基底模型構(gòu)建專屬應(yīng)用。
而數(shù)字生態(tài)大會上,蔣杰展示混元大模型的一個突出能力,就是「更可靠」。
此前,大模型產(chǎn)品經(jīng)常出現(xiàn)答非所問胡編亂造的情況,這就是突出的「幻覺」問題,蔣杰通過關(guān)羽和秦瓊的問答案例,意在說明經(jīng)過大量的研究和嘗試,混元大模型找到一種更強(qiáng)大的推理和思維能力,有效降低大語言模型30%-50%的幻覺率。
「百模大戰(zhàn)」開戰(zhàn)已久,比拼參數(shù)并不能成為當(dāng)下大模型市場競爭的最大亮點。誰在市場上更實用,誰能在自己的生態(tài)中跑出爆款應(yīng)用,成為當(dāng)下大模型廠商們爭先巧奪的關(guān)鍵之一。
比如百度就通過「文心杯」創(chuàng)業(yè)大賽,選拔百度大模型生態(tài)內(nèi)的優(yōu)秀選手,通過投資和技術(shù)支持等方式,讓基于大模型上的應(yīng)用層開發(fā)和創(chuàng)新,成為大模型進(jìn)入更大市場的關(guān)鍵變量。
也就是說,誰的大模型更實用,誰的大模型擁有更多伙伴,是當(dāng)下大模型廠商最焦慮的事情。
而蔣杰在發(fā)布大模型時提到,相比混元大模型的能力測試,騰訊更關(guān)注大模型的應(yīng)用,旨在助力行業(yè)側(cè)的能力提升和效率提高,混元大模型已經(jīng)在騰訊會議、騰訊文檔、騰訊廣告等多個業(yè)務(wù)取得明顯效果。
他舉例說,混元大模型在騰訊文檔中,已經(jīng)支持?jǐn)?shù)十種文本生成場景,可以做到上百種專業(yè)文書的規(guī)范書寫;支持?jǐn)?shù)百種Excel公式生成,Exce公式生成的正確率,GPT3.5達(dá)到了71%,而混元達(dá)到了82%;
在騰訊會議的應(yīng)用中,混元大模型與騰訊會議打造的AI助手,只需要用戶用簡單的自然語言指令,就可以完成會議內(nèi)容的提取、分析、生成內(nèi)容總結(jié)等復(fù)雜任務(wù);
在騰訊廣告的應(yīng)用中,騰訊也試圖去適應(yīng)不同行業(yè)和地域的特色,滿足千人千面的需求,讓圖片、文字和視頻等廣告內(nèi)容更自然結(jié)合。根據(jù)騰訊透露的數(shù)據(jù),混元大模型生成的廣告內(nèi)容采納率,高于目前火熱一時的大模型應(yīng)用層面產(chǎn)品Midjourney。
總體來說,騰訊混元大模型更實用能力的展示將在B端和C端兩個方向探索。
一個是C端用戶層的挖掘,雖然混元大模型在微信上的應(yīng)用還沒有全面公測,但根據(jù)發(fā)布會透露的內(nèi)容,其依然沿用文本生成能力展現(xiàn),不管是文案創(chuàng)作還是AI繪畫,其本質(zhì)上都是創(chuàng)意層面的加持,讓營銷等行業(yè)的生產(chǎn)力得以提高。
另一個是B端行業(yè)側(cè)的應(yīng)用升級,混元大模型是通用底座,在底座之上構(gòu)建更具針對性的行業(yè)模型是關(guān)鍵。
比如,打造零門檻對話式數(shù)據(jù)分析的企點分析AI助手、提升精準(zhǔn)度和泛化性的OCR模型等針對具體行業(yè)側(cè)的模型能力,都在9月開始面向大客戶開放內(nèi)測。目前騰訊云已支持20多款開源模型,讓企業(yè)能通過API(應(yīng)用程序編程接口)接入這些開源模型。
一系列混元大模型的應(yīng)用將在9月徐徐展開,騰訊顯然在大模型之路上不肯掉隊。
大模型決戰(zhàn)還早?
「流水不爭先,爭的是滔滔不絕」,這句話或許就是騰訊在大模型市場上的寫照。
「我們也一樣在埋頭研發(fā),但是并不急于早早做完,把半成品拿出來展示?!菇衲?月,2023年騰訊股東大會上,騰訊創(chuàng)始人馬化騰的表態(tài)讓人警醒,他認(rèn)為大模型是互聯(lián)網(wǎng)百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇。
馬化騰用的是歷史的眼光去衡量,騰訊在乎的是這個「電燈」的實用性和耐用性,而不是死盯著早一步投入市場激起的那簇虛無的水花。
早一個月不是至關(guān)重要的,關(guān)鍵是還是要把底層的算法、算力和數(shù)據(jù)扎扎實實做好,「而且更關(guān)鍵的是場景落地,相信我們是有很多場景是可以落地的,目前(我們)還在做一些思考。」
不急功近利,想明白自己的擅長,抓住擅長的機(jī)會,讓過去的業(yè)務(wù)在大模型的加持下產(chǎn)生1+1大于2的效益,這可能是馬化騰對騰訊大模型的最大期許。
對現(xiàn)在的騰訊來說,混元大模型是騰訊云MaaS(Model-as-a-Service)服務(wù)的底座,如何讓客戶可以基于混元、也可以基于開源模型,做自己專屬的行業(yè)大模型,成為騰訊自身生態(tài)不斷發(fā)展壯大的方向之一,
因此,一個最好的理解就是,衡量大模型到底好不好,客戶說了才算。
「我們的大模型能力,也正在重塑騰訊云廣泛的PaaS、SaaS產(chǎn)品,這些探索實踐,也進(jìn)一步驗證了我們MaaS能力的可用性、易用性?!乖隍v訊全球數(shù)字生態(tài)大會上,騰訊云副總裁吳運聲介紹。
大模型目前應(yīng)用最廣泛的落地場景就是客服,大幅降低客服的構(gòu)建成本。
騰訊發(fā)布的新一代騰訊企點,就引入了混元大模型能力,針對對話交互、人工輔助和知識構(gòu)建三個層面進(jìn)行提升,目前騰訊已經(jīng)在推動文旅、政務(wù)、地產(chǎn)等領(lǐng)域落地標(biāo)桿案例。
從本質(zhì)上說,目前大模型核心重塑的一個是降本,一個是提效,客戶需要通過大模型提升自身的效率變革,這是大模型滿足的最大痛點。
比如,在閱文集團(tuán)展現(xiàn)的內(nèi)容創(chuàng)作領(lǐng)域上,文生圖、圖生圖就是一種方式。閱文基于騰訊云TI平臺搭載的Angel推理加速引擎,推理能力平均提升30%,在文生文領(lǐng)域,更是把成本降低到原來的四分之一。此外,TI平臺提供動態(tài)batch和自動服務(wù)調(diào)度機(jī)制,大幅提高了服務(wù)吞吐量。
大模型底座上如何長出的更具有適配性的行業(yè)模型,也成為大模型適用能力的展現(xiàn)的途徑之一。
騰訊混元大模型之上的分析模型,就通過騰訊企點分析AI助手來覆蓋了四大場景:覆蓋對話式分析,輔助數(shù)據(jù)配置,提取智能結(jié)論、一鍵生成報告。「未來,人人都能擁有專業(yè)數(shù)據(jù)分析能力,讓數(shù)據(jù)跑得更快,為業(yè)務(wù)一線提供決策支持。」吳運聲介紹。
而在直播短視頻內(nèi)容的帶動下,用數(shù)字技術(shù)創(chuàng)造的人物形象也成為越來越普遍的應(yīng)用之一。在數(shù)智人的落地上,騰訊此前推出過數(shù)智人工廠,如今在大模型的加持下,數(shù)智人的生產(chǎn)周期,已經(jīng)從從原來的24小時縮短到1個小時,大大提升了生產(chǎn)效率。
相對而言,騰訊混元大模型的能力依然沒有完全展露,例如企點分析AI助手在9月只面向大客戶開放內(nèi)測申請,微信上的混元大模型小程序還需申請才能內(nèi)測,騰訊旗下諸多游戲產(chǎn)品如何結(jié)合大模型進(jìn)行升級,并沒有在這次大會上得以詳細(xì)展現(xiàn)。
「務(wù)實創(chuàng)新,專注打好基礎(chǔ),不急于拿出半成品展示」,騰訊混元大模型雖然姍姍來遲,但一系列動作起碼標(biāo)志著中文世界內(nèi)的大模型之戰(zhàn)還將持續(xù)很長一段時間。
當(dāng)下仍舊是大模型冷靜期,距離大模型的決戰(zhàn)為時尚早。
關(guān)鍵詞:
相關(guān)閱讀
-
騰訊混元大模型:不著急,但不缺席
如何在具體行業(yè)和場景中落地,如何把大模型的能力在應(yīng)用層上跑通,正在 -
里程牌!韓國Sunic OLED蒸鍍設(shè)備獲重大...
眾所周知,OLED作為新型顯示領(lǐng)域中最熱門的技術(shù)路線之一,是我國重點支 -
智能密碼鎖專用觸摸芯片GTX314L
由工采網(wǎng)代理的韓國greenchip(綠芯)GTX314L是一款專用于智能密碼鎖上 -
不用花一分錢的免費電視,可能虧本也賺...
免費的會是最貴的嗎? 自從誕生以來,電視一直被視作是家庭娛樂的中心 -
華為Mate 60 Pro+預(yù)售正式開啟,真正...
在蘋果iPhone15系列機(jī)型還沒發(fā)布的情況下,目前手機(jī)界受關(guān)注度最高的產(chǎn) -
數(shù)據(jù)|電解槽和核心材料成為氫能領(lǐng)域融資...
氫能投融資特點反應(yīng)了行業(yè)趨勢本文將從氫能領(lǐng)域的融資金額、數(shù)量、輪次