騰訊混元大模型：不著急，但不缺席

2023-09-08 18:48:01 來源：維科號

如何在具體行業(yè)和場景中落地，如何把大模型的能力在應(yīng)用層上跑通，正在成為大模型較量的關(guān)鍵。

撰文|藍(lán)洞商業(yè) 趙衛(wèi)衛(wèi)

打開微信，搜索「騰訊混元助手」，在內(nèi)測版小程序注冊申請，就會跳出「排隊中」界面，「你已經(jīng)在等待體驗中，本期內(nèi)測開放名額有限，加入成功將會有短信進(jìn)行提醒。」

(資料圖片)

這是目前，一個普通人接觸騰訊混元大模型最快的方式。

騰訊的大模型，姍姍來遲。終于在9月7日的騰訊全球數(shù)字生態(tài)大會上發(fā)布，擁有超千億參數(shù)，騰訊云、騰訊廣告、騰訊會議等都已經(jīng)開始接入。

騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生介紹：「騰訊混元大模型擁有超千億參數(shù)規(guī)模，預(yù)訓(xùn)練語料超2萬億tokens，具有強(qiáng)大的中文理解與創(chuàng)作能力、邏輯推理能力，以及可靠的任務(wù)執(zhí)行能力?！?/p>

「已經(jīng)有 50 多個產(chǎn)品在應(yīng)用混元大模型，在騰訊內(nèi)部，混元大模型已經(jīng)成為業(yè)務(wù)底座，可以說騰訊已經(jīng)全面擁抱大模型?！跪v訊集團(tuán)副總裁蔣杰表示。

坐擁微信和QQ兩大國民級應(yīng)用，大語言模型的C端落地場景是騰訊最具想象力的部分；而大語言模型如何在B端市場的行業(yè)側(cè)落地，也成為騰訊在今年9月逐漸開放的能力方向。

ChatGPT帶動了大語言模型創(chuàng)業(yè)熱潮。自今年3月以來，先是百度發(fā)布文心一言內(nèi)測版；4月，阿里旗下的通義千問也開始內(nèi)測，此后國產(chǎn)大模型爭搶發(fā)布，被行業(yè)內(nèi)戲稱為「百行千?！?。

如今，騰訊的大語言模型混元雖遲但到，終于讓BAT在大語言模型的戰(zhàn)場上再次成為對手。

之前，包括百度文心一言在內(nèi)的第一批大模型在8月31日通過備案正式上線，意味著大模型市場競爭進(jìn)入了公開化的全新階段，面向用戶全面開放，也就加速了產(chǎn)品應(yīng)用的落地。

百度集團(tuán)執(zhí)行副總裁、智能云事業(yè)群總裁沈抖曾對媒體說，在文心一言開放當(dāng)天，在百度智能云千帆大模型平臺（百度面向企業(yè)端推出的大模型開發(fā)與管理平臺）上，日活企業(yè)數(shù)增長超過 40%。

左手to C，右手to B，已經(jīng)成為大模型的一體兩面。

而「百行千模」帶來的審美疲勞，也最終讓行業(yè)認(rèn)識到，如何在具體行業(yè)和場景中落地，如何把大模型的能力在應(yīng)用層上跑通，正在成為大模型較量的關(guān)鍵。

在爭搶用戶和客戶為主題的大模型冷靜期中，騰訊如何后來居上也成為留給自己最大的考驗。

大模型爭搶方向：更實用

對標(biāo)ChatGPT一直是國內(nèi)大模型的主要基調(diào)，「在口語化文本精確理解、超長記錄高效提煉、理解生成實時處理上，騰訊混元大模型中文能力已經(jīng)超越GPT3.5?！?/p>

蔣杰稱，「你可以把混元看作是一個在內(nèi)部開源的模型，公司的每個業(yè)務(wù)都可以看到我們發(fā)布的所有能力，并基于這個能力去與應(yīng)用相結(jié)合?！?/p>

混元大模型的核心賣點在于，它是由騰訊全鏈路自研的通用大語言模型，可以流暢進(jìn)行專業(yè)領(lǐng)域的多輪對話，具備強(qiáng)大的中文創(chuàng)作能力，復(fù)雜語境下的邏輯推理能力，以及可靠的任務(wù)執(zhí)行能力，對行業(yè)更重要的是，混元將作為騰訊云MaaS服務(wù)的底座，客戶可直接調(diào)用或作為基底模型構(gòu)建專屬應(yīng)用。

而數(shù)字生態(tài)大會上，蔣杰展示混元大模型的一個突出能力，就是「更可靠」。

此前，大模型產(chǎn)品經(jīng)常出現(xiàn)答非所問胡編亂造的情況，這就是突出的「幻覺」問題，蔣杰通過關(guān)羽和秦瓊的問答案例，意在說明經(jīng)過大量的研究和嘗試，混元大模型找到一種更強(qiáng)大的推理和思維能力，有效降低大語言模型30%-50%的幻覺率。

「百模大戰(zhàn)」開戰(zhàn)已久，比拼參數(shù)并不能成為當(dāng)下大模型市場競爭的最大亮點。誰在市場上更實用，誰能在自己的生態(tài)中跑出爆款應(yīng)用，成為當(dāng)下大模型廠商們爭先巧奪的關(guān)鍵之一。

比如百度就通過「文心杯」創(chuàng)業(yè)大賽，選拔百度大模型生態(tài)內(nèi)的優(yōu)秀選手，通過投資和技術(shù)支持等方式，讓基于大模型上的應(yīng)用層開發(fā)和創(chuàng)新，成為大模型進(jìn)入更大市場的關(guān)鍵變量。

也就是說，誰的大模型更實用，誰的大模型擁有更多伙伴，是當(dāng)下大模型廠商最焦慮的事情。

而蔣杰在發(fā)布大模型時提到，相比混元大模型的能力測試，騰訊更關(guān)注大模型的應(yīng)用，旨在助力行業(yè)側(cè)的能力提升和效率提高，混元大模型已經(jīng)在騰訊會議、騰訊文檔、騰訊廣告等多個業(yè)務(wù)取得明顯效果。

他舉例說，混元大模型在騰訊文檔中，已經(jīng)支持?jǐn)?shù)十種文本生成場景，可以做到上百種專業(yè)文書的規(guī)范書寫；支持?jǐn)?shù)百種Excel公式生成，Exce公式生成的正確率，GPT3.5達(dá)到了71%，而混元達(dá)到了82%；

在騰訊會議的應(yīng)用中，混元大模型與騰訊會議打造的AI助手，只需要用戶用簡單的自然語言指令，就可以完成會議內(nèi)容的提取、分析、生成內(nèi)容總結(jié)等復(fù)雜任務(wù)；

在騰訊廣告的應(yīng)用中，騰訊也試圖去適應(yīng)不同行業(yè)和地域的特色，滿足千人千面的需求，讓圖片、文字和視頻等廣告內(nèi)容更自然結(jié)合。根據(jù)騰訊透露的數(shù)據(jù)，混元大模型生成的廣告內(nèi)容采納率，高于目前火熱一時的大模型應(yīng)用層面產(chǎn)品Midjourney。

總體來說，騰訊混元大模型更實用能力的展示將在B端和C端兩個方向探索。

一個是C端用戶層的挖掘，雖然混元大模型在微信上的應(yīng)用還沒有全面公測，但根據(jù)發(fā)布會透露的內(nèi)容，其依然沿用文本生成能力展現(xiàn)，不管是文案創(chuàng)作還是AI繪畫，其本質(zhì)上都是創(chuàng)意層面的加持，讓營銷等行業(yè)的生產(chǎn)力得以提高。

另一個是B端行業(yè)側(cè)的應(yīng)用升級，混元大模型是通用底座，在底座之上構(gòu)建更具針對性的行業(yè)模型是關(guān)鍵。

比如，打造零門檻對話式數(shù)據(jù)分析的企點分析AI助手、提升精準(zhǔn)度和泛化性的OCR模型等針對具體行業(yè)側(cè)的模型能力，都在9月開始面向大客戶開放內(nèi)測。目前騰訊云已支持20多款開源模型，讓企業(yè)能通過API（應(yīng)用程序編程接口）接入這些開源模型。

一系列混元大模型的應(yīng)用將在9月徐徐展開，騰訊顯然在大模型之路上不肯掉隊。

大模型決戰(zhàn)還早？

「流水不爭先，爭的是滔滔不絕」，這句話或許就是騰訊在大模型市場上的寫照。

「我們也一樣在埋頭研發(fā)，但是并不急于早早做完，把半成品拿出來展示?！菇衲?月，2023年騰訊股東大會上，騰訊創(chuàng)始人馬化騰的表態(tài)讓人警醒，他認(rèn)為大模型是互聯(lián)網(wǎng)百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇。

馬化騰用的是歷史的眼光去衡量，騰訊在乎的是這個「電燈」的實用性和耐用性，而不是死盯著早一步投入市場激起的那簇虛無的水花。

早一個月不是至關(guān)重要的，關(guān)鍵是還是要把底層的算法、算力和數(shù)據(jù)扎扎實實做好，「而且更關(guān)鍵的是場景落地，相信我們是有很多場景是可以落地的，目前（我們）還在做一些思考。」

不急功近利，想明白自己的擅長，抓住擅長的機(jī)會，讓過去的業(yè)務(wù)在大模型的加持下產(chǎn)生1+1大于2的效益，這可能是馬化騰對騰訊大模型的最大期許。

對現(xiàn)在的騰訊來說，混元大模型是騰訊云MaaS（Model-as-a-Service）服務(wù)的底座，如何讓客戶可以基于混元、也可以基于開源模型，做自己專屬的行業(yè)大模型，成為騰訊自身生態(tài)不斷發(fā)展壯大的方向之一，

因此，一個最好的理解就是，衡量大模型到底好不好，客戶說了才算。

「我們的大模型能力，也正在重塑騰訊云廣泛的PaaS、SaaS產(chǎn)品，這些探索實踐，也進(jìn)一步驗證了我們MaaS能力的可用性、易用性?！乖隍v訊全球數(shù)字生態(tài)大會上，騰訊云副總裁吳運聲介紹。

大模型目前應(yīng)用最廣泛的落地場景就是客服，大幅降低客服的構(gòu)建成本。

騰訊發(fā)布的新一代騰訊企點，就引入了混元大模型能力，針對對話交互、人工輔助和知識構(gòu)建三個層面進(jìn)行提升，目前騰訊已經(jīng)在推動文旅、政務(wù)、地產(chǎn)等領(lǐng)域落地標(biāo)桿案例。

從本質(zhì)上說，目前大模型核心重塑的一個是降本，一個是提效，客戶需要通過大模型提升自身的效率變革，這是大模型滿足的最大痛點。

比如，在閱文集團(tuán)展現(xiàn)的內(nèi)容創(chuàng)作領(lǐng)域上，文生圖、圖生圖就是一種方式。閱文基于騰訊云TI平臺搭載的Angel推理加速引擎，推理能力平均提升30%，在文生文領(lǐng)域，更是把成本降低到原來的四分之一。此外，TI平臺提供動態(tài)batch和自動服務(wù)調(diào)度機(jī)制，大幅提高了服務(wù)吞吐量。

大模型底座上如何長出的更具有適配性的行業(yè)模型，也成為大模型適用能力的展現(xiàn)的途徑之一。

騰訊混元大模型之上的分析模型，就通過騰訊企點分析AI助手來覆蓋了四大場景：覆蓋對話式分析，輔助數(shù)據(jù)配置，提取智能結(jié)論、一鍵生成報告。「未來，人人都能擁有專業(yè)數(shù)據(jù)分析能力，讓數(shù)據(jù)跑得更快，為業(yè)務(wù)一線提供決策支持。」吳運聲介紹。

而在直播短視頻內(nèi)容的帶動下，用數(shù)字技術(shù)創(chuàng)造的人物形象也成為越來越普遍的應(yīng)用之一。在數(shù)智人的落地上，騰訊此前推出過數(shù)智人工廠，如今在大模型的加持下，數(shù)智人的生產(chǎn)周期，已經(jīng)從從原來的24小時縮短到1個小時，大大提升了生產(chǎn)效率。

相對而言，騰訊混元大模型的能力依然沒有完全展露，例如企點分析AI助手在9月只面向大客戶開放內(nèi)測申請，微信上的混元大模型小程序還需申請才能內(nèi)測，騰訊旗下諸多游戲產(chǎn)品如何結(jié)合大模型進(jìn)行升級，并沒有在這次大會上得以詳細(xì)展現(xiàn)。

「務(wù)實創(chuàng)新，專注打好基礎(chǔ)，不急于拿出半成品展示」，騰訊混元大模型雖然姍姍來遲，但一系列動作起碼標(biāo)志著中文世界內(nèi)的大模型之戰(zhàn)還將持續(xù)很長一段時間。

當(dāng)下仍舊是大模型冷靜期，距離大模型的決戰(zhàn)為時尚早。

關(guān)鍵詞：