學(xué)習(xí)曲線4:更精進(jìn)的AI模型與不斷演進(jìn)的語(yǔ)言
移動(dòng)AI普及背后的故事——來(lái)自三星電子中國(guó)研究院的人們與創(chuàng)新
在三星不斷創(chuàng)新,持續(xù)引領(lǐng)卓越移動(dòng)AI體驗(yàn)的背景下,我們拜訪了位于世界各地的三星電子研究院,力求探究Galaxy AI是如何助力用戶釋放無(wú)限潛能的。如今,Galaxy AI憑借已支持的16種語(yǔ)言,可以服務(wù)更多不同語(yǔ)種的用戶,即便是在離線狀態(tài)下,用戶也能利用基于端側(cè)AI的通話實(shí)時(shí)翻譯、翻譯助手、筆記助手和瀏覽助手等功能,跨越語(yǔ)言壁壘。那么,關(guān)于Galaxy AI語(yǔ)言翻譯的研發(fā),又有哪些背后的故事呢?上一期,我們拜訪了位于越南的三星電子研究院,了解了用于AI模型訓(xùn)練的數(shù)據(jù)是如何收集的。這一期,我們將走近中國(guó)團(tuán)隊(duì),看他們是如何為中國(guó)用戶們提供獨(dú)特的Galaxy AI體驗(yàn)的。
在全球范圍內(nèi),基于大語(yǔ)言模型(LLM)的AI工具正在飛速發(fā)展,中國(guó)也不例外。隨著百度 ERNIE Bot 和美圖 Miracle Vision的發(fā)展普及,三星電子中國(guó)研究院也選擇了與這兩家公司深入合作,共同打造屬于中國(guó)市場(chǎng)的Galaxy AI功能。
攜手不同AI合作伙伴,使得Galaxy AI在后端乃至底層技術(shù)的整合面臨了巨大的挑戰(zhàn),但三星電子中國(guó)研究院的北京和廣州團(tuán)隊(duì)必須在規(guī)定的時(shí)間內(nèi),讓中國(guó)用戶獲得與全球其他用戶相同的 Galaxy AI 體驗(yàn)。因此,他們利用第三方合作伙伴提供的中國(guó)方言專用資源,為中國(guó)用戶打造了獨(dú)一無(wú)二的 Galaxy AI 解決方案。
三星電子廣州研究院軟件創(chuàng)新團(tuán)隊(duì)負(fù)責(zé)人張海榕表示:“我們的優(yōu)勢(shì)在于能夠?qū)⑷蜃詈玫膶?shí)踐經(jīng)驗(yàn)與中國(guó)本土的實(shí)踐經(jīng)驗(yàn)相融合,并通過(guò)與中國(guó)用戶的日常交流了解用戶的需求,不斷改進(jìn)提升,開(kāi)發(fā)新功能。我們的團(tuán)隊(duì)?wèi){借在Galaxy S24項(xiàng)目中積累的豐富開(kāi)發(fā)經(jīng)驗(yàn),與百度、美圖等中國(guó)本土人工智能公司攜手合作,帶來(lái)了真正贏得用戶共鳴的解決方案,對(duì)此我深感自豪。”
一開(kāi)始,各團(tuán)隊(duì)都需要適應(yīng)彼此的工作方式,并解決項(xiàng)目初期信息不對(duì)等的問(wèn)題。對(duì)此,三星電子中國(guó)研究院院長(zhǎng)張代君成立了一個(gè)特別工作組,以確保項(xiàng)目能夠按照研發(fā)規(guī)劃快速地推進(jìn)并完成目標(biāo)。
憑借北京團(tuán)隊(duì)在大模型生成方面的豐富經(jīng)驗(yàn),以及與第三方合作伙伴的成功合作,所有的生成式AI功能最終在中國(guó)成功問(wèn)世,為中國(guó)用戶帶來(lái)了更為本土化的具備特定市場(chǎng)功能(如“觸摸搜索”)的解決方案。
基于中文開(kāi)發(fā)粵語(yǔ)方言模型
早在2024年1月Galaxy S24上市之際,Galaxy AI便已支持了普通話,但對(duì)于三星電子中國(guó)研究院而言,工作仍未結(jié)束。在此之后,中國(guó)團(tuán)隊(duì)投入到了支持粵語(yǔ)的AI模型研發(fā)工作中。該項(xiàng)研究將在普通話語(yǔ)言模型的基礎(chǔ)上,進(jìn)一步解決粵語(yǔ)語(yǔ)言特征所帶來(lái)一系列新問(wèn)題。
在粵語(yǔ)AI語(yǔ)言模型的開(kāi)發(fā)過(guò)程中,研發(fā)團(tuán)隊(duì)面臨的主要難題就是文化方面的差異。首先,香港的書(shū)寫(xiě)和口語(yǔ)是兩套不同的系統(tǒng)。香港用戶在書(shū)寫(xiě)時(shí)使用類似普通話的語(yǔ)法和表達(dá)方式,而在日常交流時(shí)則采用完全不同的口語(yǔ)語(yǔ)法。此外,粵語(yǔ)發(fā)音有九個(gè)聲調(diào),而普通話則有四個(gè)。
另一個(gè)文化差異則是粵語(yǔ)方言本身也在與時(shí)俱進(jìn),并且很多時(shí)候人們經(jīng)常會(huì)在對(duì)話中將粵語(yǔ)和英語(yǔ)混在一起用,因此,創(chuàng)建測(cè)試用例、驗(yàn)證語(yǔ)言包的復(fù)雜程度不言而喻。
"粵語(yǔ)是一種非常獨(dú)特的方言,在不同的粵語(yǔ)地區(qū)會(huì)有不同的說(shuō)法,"負(fù)責(zé)粵語(yǔ)AI解決方案測(cè)試工作的李靖表示,"一些俚語(yǔ)、短語(yǔ)、詞匯甚至音調(diào)在不同地方都不盡相同。因此,我們對(duì)大量香港的詳細(xì)數(shù)據(jù)進(jìn)行了核對(duì),并校對(duì)了數(shù)以萬(wàn)計(jì)的相關(guān)測(cè)試案例。"
考慮到這些復(fù)雜性,三星電子中國(guó)研究院的北京和廣州團(tuán)隊(duì)合作實(shí)現(xiàn)了在粵語(yǔ)和英語(yǔ)的混合語(yǔ)音識(shí)別中支持深層代碼混合、在機(jī)器翻譯中支持書(shū)面和口語(yǔ)表達(dá)、在語(yǔ)音合成中使用當(dāng)前的發(fā)音。
溝通中的文化影響
當(dāng)Galaxy AI的粵語(yǔ)語(yǔ)言包可供使用時(shí),消費(fèi)者的反饋很好地表明了三星研發(fā)團(tuán)隊(duì)的辛勤工作都是值得的。
三星Galaxy AI的項(xiàng)目經(jīng)驗(yàn)表明,不管是在中國(guó)大陸還是中國(guó)香港地區(qū),一個(gè)全球品牌不僅應(yīng)擁有專業(yè)的當(dāng)?shù)貓F(tuán)隊(duì)和相關(guān)的當(dāng)?shù)刂R(shí),還要具備與當(dāng)?shù)氐谌胶献骰锇殚_(kāi)展開(kāi)放合作的能力。在中國(guó)香港地區(qū),粵語(yǔ)是構(gòu)建當(dāng)?shù)鼐用裎幕匦缘闹匾糠帧榇?,?dāng)?shù)貓F(tuán)隊(duì)必須研發(fā)正確的人工智能語(yǔ)言模型。
三星電子中國(guó)香港地區(qū)負(fù)責(zé)人Henry Wat表示:“在任何地方、任何行業(yè)中,語(yǔ)言以及溝通交流都非常重要。無(wú)論是來(lái)自哪里的語(yǔ)言,任何能幫助人們溝通交流的工具都是非??少F的,我堅(jiān)信我們的工作很有意義。”
在下一期《學(xué)習(xí)曲線》中,我們將前往巴西,了解一個(gè)團(tuán)隊(duì)如何跨越文化和國(guó)界,讓更多人體驗(yàn)到Galaxy AI。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣依據(jù)。
關(guān)鍵詞:
相關(guān)閱讀
-
學(xué)習(xí)曲線4:更精進(jìn)的AI模型與不斷演進(jìn)的語(yǔ)言
移動(dòng)AI普及背后的故事——來(lái)自三星電子中國(guó)研究院的人們與創(chuàng)新在三 -
億道數(shù)碼參展臺(tái)北Computex,前沿科技產(chǎn)...
6月4日至6月7日,亞洲最大、全球第二大的電腦展Computex 2024臺(tái)北電 -
電動(dòng)汽車占比或超50%,加油站怎么生存?
近日,國(guó)際能源署發(fā)布預(yù)測(cè)稱,2035年電動(dòng)汽車全球銷量占比或超50%。 -
德國(guó)卡赫?qǐng)A滿亮相第二十一屆中國(guó)畜牧業(yè)...
近日,為期三天的第二十一屆中國(guó)畜牧業(yè)博覽會(huì)暨2024中國(guó)國(guó)際畜牧業(yè) -
聯(lián)發(fā)科在COMPUTEX 2024展出創(chuàng)新生成式A...
在近期拉開(kāi)帷幕的COMPUTEX 2024科技展覽上,聯(lián)發(fā)科展示了一系列尖 -
聯(lián)發(fā)科亮相COMPUTEX 2024,端側(cè)生成式A...
近日,備受全球科技界矚目的COMPUTEX 2024科技展會(huì)盛大開(kāi)幕,聯(lián)發(fā)