Fellows Fund 創(chuàng)始人 Alex Ren :硅谷視角下的 AI 價值創(chuàng)造丨GAIR 2023
2023-08-23 05:43:10 來源:程序員客棧
【資料圖】
01 AI 投資的四大方向 我們是一家位于硅谷的風(fēng)險投資基金,與其他 VC 公司看項目的角度不同,我們會從三個點出發(fā):空間,即初創(chuàng)公司的空間在哪里;時間,技術(shù)發(fā)展的程度如何、是否已進(jìn)入可大量商業(yè)化階段;維度,公司的核心能力是什么、與大公司競爭的方法論。 圍繞這三大維度出發(fā),我們提出了 AI 投資的四大方向。 第一個方向就是生產(chǎn)力的釋放,即 AI 驅(qū)動的工具自動執(zhí)行任務(wù)并提供輸出。今天用戶已經(jīng)普遍可以感受到 AI 工具帶來的效率提升,比如用 ChatGPT 生成文本、寫一首歌、或是寫代碼等等,很快就能完成。在我們投資的公司中, Gamma.app、Taskade、CodeComplete、Opus Clip 等幾家AI公司,其技術(shù)模式都是通過 AI 工具組合來提供 AI 能力,從而提升模型在領(lǐng)域中處理問題的能力,提高工作生產(chǎn)率。 第二個方向是行業(yè)的模式轉(zhuǎn)換。許多行業(yè)都會有自己的數(shù)據(jù),例如生物、保險、家居服務(wù)等等,通過將 AI 嵌入至行業(yè)的 Workflow 中進(jìn)行優(yōu)化,可以提高效率、降低成本并改善結(jié)果。如我們投資的生物領(lǐng)域的Diffuse Bio,保險領(lǐng)域的Kyber,生活服務(wù)領(lǐng)域的LiveX AI等。 第三個方向是 AI 的中間層。如果說 AI 技術(shù)的底層是大模型,那在技術(shù)通往最終的應(yīng)用之間,我們將需要更多的中間件,比如 LangChain、LlamaIndex 或其他面向某個領(lǐng)域或架構(gòu)的中間件工具。如我們投資的Anarchy AI。 第四個、也是近一兩個月最熱門的一個方向,就是 AI Agent(AI 智能體),AI Agent 很早之前就被提出來,但直至 GPT 的出現(xiàn),引起大家對 AI Agent 的思考,目前硅谷有很多工程師都在做這方面的創(chuàng)業(yè),我們所投的 Anothermind.ai 正是一家新型的 AI Agent 初創(chuàng)公司。 簡單回顧 AI 過去的三個階段:最早是 Classical ML 時期,出現(xiàn)了很多從結(jié)構(gòu)化數(shù)據(jù)和預(yù)定義特征中學(xué)習(xí)的統(tǒng)計方法。隨后進(jìn)入了深度學(xué)習(xí)階段,神經(jīng)網(wǎng)絡(luò)可以從圖像、文本和音頻等非結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行學(xué)習(xí)。Transformer 以后,我們也邁向了生成式人工智能和基礎(chǔ)模型階段,基于 GPT 方法可以生成各種文本、圖像、代碼或芯片設(shè)計算法等,可以說,生成式 AI 就是下一輪的突破。 我們團隊自 2016、2017 年關(guān)注 AI ,可以發(fā)現(xiàn),目前 AI 公司與此前的創(chuàng)業(yè)公司相比,其核心區(qū)別在于:過去幾年中,以自動駕駛為代表的場景應(yīng)用在盈利上未及預(yù)期,但今天許多 AI 公司均具備很強的盈利能力,我們已經(jīng)可以看到一些 AI 公司在賺錢。 那么 AI 到底能夠產(chǎn)生什么價值?我們將其總結(jié)為更好的決策、更好的行動、更好的結(jié)果以及更好的體驗。 首先是用 AI 去做更好的決策,比如在市場銷售場景中使用其分析信用評分、解析金融風(fēng)險等。 第二,更好的行動,即通過用戶動作推斷、提供更好的推薦個性化服務(wù)。 第三,更好的結(jié)果,也就是通過優(yōu)化來獲得更好的產(chǎn)出結(jié)果。 最后是給用戶提供更好的體驗。舉個例子,如果你在美國打電話給某個銀行或航空公司經(jīng)常需要等很長時間,用戶服務(wù)體驗非常差,但有了 AI 客服對內(nèi)部流程進(jìn)行優(yōu)化后,用戶的體驗也能得到極大提升。 具體應(yīng)用時,上述所提及的 AI 體驗都需要有一個 Workflow 來完成。 舉個例子,媒體寫一篇文章需要經(jīng)歷稿件批注、編輯等流程后才能發(fā)表,如果借助 AI 從最開始的草稿、文章修改、總結(jié)等來進(jìn)行輔助,使用 AI 和不使用 AI 情況下,其價值曲線會有所不同。 在沒有 AI 輔助的情況下,受限于個人能力或速度效率,很快就會達(dá)到極限。但有了 AI 的幫助,即便是一個沒有法律文書撰寫經(jīng)驗的作家,也可以借助大模型來完成相關(guān)文書的編寫,對內(nèi)容進(jìn)行有效的補充,同時通過人的不斷學(xué)習(xí),進(jìn)一步提升我們創(chuàng)造價值的能力。在這個過程中,AI 通過理解人的需求做推斷和執(zhí)行,最后在寫作的流程中完成對人的輔助。 這里簡單介紹一下大模型如何用 Agent 來提升自身的能力。 由于大模型是基于歷史數(shù)據(jù)進(jìn)行訓(xùn)練的,因此無法理解當(dāng)下所發(fā)生的事件。假設(shè)我們讓大模型將今天東南亞所有城市的天氣溫度做個排名,這個時候,大模型就需要一些工具去能夠同外界溝通以獲取這些信息,再基于信息完成推理,這就是 Agent 的概念。也就是說,Agent 是大模型的眼睛、耳朵,使大模型能夠理解環(huán)境,從而能夠處理我們現(xiàn)在的信息。
02 大模型革新 Agent 范式 接下來我想討論的問題是,AI 能為我們做些什么事情呢? 主要包括三個方面,分別是自動化和輔助性 AI,即 AI 在 Workflow 里邊如何將流程自動;釋放創(chuàng)造性;更好的人機交互。 在自動化和輔助性 AI 中,我們可以用兩個維度區(qū)分其不同價值。面對復(fù)雜度較低、任務(wù)量大的問題,通過將 AI 嵌入至 workflow 自動化流程,可極大提高企業(yè)的生產(chǎn)效率;在面對復(fù)雜度更高的任務(wù)時,AI 則是作為人的工具、扮演輔助性角色。比如在藥物開發(fā)、材料設(shè)計領(lǐng)域中,任務(wù)本身比較復(fù)雜,對專業(yè)性知識的要求也更高,因此它所利用的 AI 能力往往不是一個會畫畫的 AI 所能解決的。 舉一個我們之前投的用 AI 做項目管理的案例。在Taskade中,向 AI 發(fā)出一個市場營銷方案的指令,并生成各種用戶身份角色,將打包好的各種 PDF 文件交給 AI 作文本分析和處理,這種就屬于任務(wù)驅(qū)動 AI。 它是一個集成式的任務(wù)管理工具,加上 AI 嵌入,可對完成的生產(chǎn)環(huán)節(jié)實現(xiàn)全流程管理。這個工具中很重要的一點,就是對用戶行為的研究,以內(nèi)容去跟用戶做交互,內(nèi)容的生產(chǎn)也可以直接根據(jù)用戶行為來生成,并從用戶側(cè)得到反饋反哺模型,同時還可以借助個性化推薦把產(chǎn)品廣告推送給用戶。 因此我們認(rèn)為,這應(yīng)該是下一代電商、零售領(lǐng)域發(fā)展的大趨勢。 要注意的是,基于大模型釋放生產(chǎn)力這件事今天如微軟等大公司也在做,初創(chuàng)公司又該如何競爭? 我們發(fā)現(xiàn),很多大公司在 AI 產(chǎn)品體驗上往往存在「最后一公里」未能達(dá)到的問題,也就是說,雖然它們的產(chǎn)品、技術(shù)能力非常強,但是在后期的迭代、用戶交付體驗等方面通常會做得比較差,這或許可以成為初創(chuàng)公司同大公司競爭的一個間隙——迭代足夠快,給用戶提升更好的體驗。 例如此前我們投資的一家AI 視頻生成公司Opus.pro,上線僅兩個月時間已經(jīng)收獲了一大批忠實客戶。用戶只需輸入一個 YouTube 視頻鏈接,平臺即可在三四分鐘內(nèi)生成十幾個短視頻,并將視頻直接分發(fā)至 TikTok、Instagram、YouTube 上。類似的AI內(nèi)容生成能力在游戲、電影等方面都有很大的潛力。 而在用戶交互溝通上,AI 還可以解決在自然語言理解上的問題,例如人和機器的交互、不同地區(qū)語言的溝通等,與過去以 API Call 為主的交互方式不一樣,大模型的出現(xiàn)使得交互方式也發(fā)生巨大轉(zhuǎn)變,這種通過大語言模型理解、人機和人人交互的模式,形成了以 Agent 為主的全新交互范式。例如在翻譯、搜索等場景,許多工作正在被 AI 重新定義。 但同時我們也要看到大模型的局限性。比如搜索的幻覺、信息滯后等問題。舉個例子,當(dāng)我們向 Google 搜索某個人的離職消息時,由于模型訓(xùn)練使用了大量過去的數(shù)據(jù)進(jìn)行訓(xùn)練,信息未能及時更新時,大模型所生成的答案就會產(chǎn)生錯誤結(jié)果。需要通過人的指正或引導(dǎo),對問題加以進(jìn)一步的綜合處理和迭代,最后才能得出一個正確的結(jié)論,這就是我們目前強調(diào)在搜索場景下的大模型革新。 在自動化測試應(yīng)用上,目前 AI 也被應(yīng)用于藥物篩查、新材料設(shè)計等方面,比如在藥物篩查設(shè)計領(lǐng)域,過去一個藥物元素的研發(fā)周期長達(dá) 7 到 12 年,通過 AI 輔助可以有效縮短藥物的研發(fā)周期。如我們投資的Diffuse Bio和Persist AI,分別將AI應(yīng)用在藥物篩查和藥劑封裝上面。 AI 生態(tài)系統(tǒng)和投資架構(gòu)如今也發(fā)生了很大的變化。如果將最底層定義為 AI 的操作系統(tǒng),這個操作系統(tǒng)中包括了各種框架,比如 TensorFlow、PyTorch、計算機硬件以及開放領(lǐng)域數(shù)據(jù)等?;陂_放領(lǐng)域數(shù)據(jù)可以處理一些開發(fā)領(lǐng)域的模型,例如常見的各種 GPT 模型、Diffusion model 等,這是我們對最新的操作系統(tǒng)的定義。 在這個基礎(chǔ)上加入垂直領(lǐng)域數(shù)據(jù),這些數(shù)據(jù)是 OpenAI 或者 Google 等公司都不具備的數(shù)據(jù),基于特定領(lǐng)域訓(xùn)練專有的領(lǐng)域大模型,輔以工具對模型進(jìn)行更好的訓(xùn)練,解決向量數(shù)據(jù)庫以及數(shù)據(jù)私有化等問題,加上今天很熱的 Chat Agent 輔助人做一些事情,還有部分面向特定應(yīng)用領(lǐng)域用 AI 重塑用戶體驗的工作。 過去,互聯(lián)網(wǎng)將我們數(shù)字化,不管是人、場景、物體、或行為,基于數(shù)字化衍生搜索引擎、各種電商平臺等,以互聯(lián)網(wǎng)的形式對其進(jìn)行管理。但到今天,我們所要做的事情,變成了如何將部分任務(wù)或 AI 可實現(xiàn)的問題做成 Agent,實現(xiàn)自動化、更高效地處理,這將成為AI下一個突破的焦點。 通過 AGI(Artificial General Intelligence、通用人工智能),未來 AI 超越人將成為可能,并將人釋放至更具創(chuàng)造性、有價值的事情中去。我們可以轉(zhuǎn)去做一些更有意思、有價值或是更需要「人」的能力的一些事情。AI 的發(fā)展?jié)摿Ψ浅4?,但我并不?dān)心,在這當(dāng)中,我們看到的是每一代的技術(shù)革新給人類帶來的便利,使人類得以做更多有價值的事情。因此,我們也希望未來能夠更好地為各個領(lǐng)域的創(chuàng)新者提供支持,在硅谷、在全球各地幫助大家創(chuàng)立一些偉大的事業(yè)!
03 Alex Ren 對話華映資本邱諄 邱諄:我在硅谷投資多年,近期主要是中美之間跑得多,比較關(guān)注中國企業(yè)出海的一些方向,AI 正是這當(dāng)中最重要的一塊。想請教 Alex 的第一個問題,剛剛你提到了許多關(guān)于 AI Value Creation(AI 價值創(chuàng)造),我們常說當(dāng)中 Value Creation 的部分就是 AI,作為創(chuàng)業(yè)公司中的一個關(guān)鍵因素,可否分享一些案例是如何落地的?社交媒體和電商目前已經(jīng)進(jìn)入瓶頸期,AI 能否帶來什么顛覆性的改變?從投資角度如何評估? Alex Ren :當(dāng)前我們看到很多關(guān)于 AI 的討論,主要圍繞如何融入日常工作生活幫人們節(jié)省時間提高效率,另一方面就是在娛樂和交互上。 AI 的一大優(yōu)勢在于其講故事的能力,傳統(tǒng)的故事內(nèi)容生產(chǎn)無論是電影、小說還是 YouTube 上的視頻,其背后都是人完成的。我經(jīng)常舉個例子,例如曹雪芹寫《紅樓夢》,賈寶玉出家、林黛玉死去,這個故事是既定的,但新時代的敘事邏輯中,每個人應(yīng)該都能去體驗紅樓夢,并且所得到的結(jié)果是不一樣。例如在我的故事里,我可以跟賈寶玉聊天,問他為什么要出家,我也可以改變林黛玉的結(jié)局。 因此,Gen AI實際上是一個產(chǎn)生新時代下內(nèi)容敘事邏輯非常好的機會。每一代的社交媒體用新的方式產(chǎn)生內(nèi)容,這種新的方式也產(chǎn)生了一種新的媒體,因此,新的媒體實則是一個高度個性化的敘事工具。電商同樣如此,未來的亞馬遜電商平臺是不是可以用 Peer to Peer 的模式,用模型在背后去理解人的需求,匹配需求,甚至是生產(chǎn)。因此,這種傳統(tǒng)大平臺的形式在未來 AI 發(fā)展過程中或許將被完全顛覆,我們需要做的是找到、并放大這些機會,去產(chǎn)生新代社交媒體、新的電商平臺,它的方式可能完全不同于我們今天所用的方式。 邱諄:這個很有意思,也提醒了我電商最早的形態(tài)其實是 P2P。確實,從 Unit Economics(單位經(jīng)濟效益)角度來講,這種有太多人工運營干預(yù)的模式較難實現(xiàn),但如果用 AI、尤其用大模型的方式,這可能變成一個很非常核心的方向。第二個問題,如果從商業(yè)化路徑層面來看,能否給大模型創(chuàng)業(yè)公司一些方向? Alex Ren :從初創(chuàng)公司的角度來說,我們要清楚自身的局限性,也即是我們能做什么?擅長什么? 正如我前面所說的,初創(chuàng)公司在跟大公司競爭時,其優(yōu)勢并不在訓(xùn)練模型或是做 Infra 上,反而在實現(xiàn)客戶價值上有一定的可能性。中國創(chuàng)業(yè)者有一個特別的優(yōu)勢,就是在互聯(lián)網(wǎng)時代學(xué)會了如何快速迭代、找到用戶的痛點。消費互聯(lián)網(wǎng)不是一個「你告訴我需求、我給你做」,而是「我們大家講一句話,把一大堆泥巴扔到墻上,看哪一塊可以黏住,我們就選擇那個東西」的模式,這種模式今天做 AI 也適用。另外,我們要注意 adoption(落地)速度。市場上有三種不同的客戶,一種是 To C,一種是 Prosumer(專業(yè)消費者),第三種是企業(yè)。就今天市場而言,顯然 To C 和 Prosumer 的落地速度要快多了,但企業(yè)場景會更慢。因此在這個過程中,初創(chuàng)公司要想清楚你的落地場景、你的客戶是誰,他們的痛點是什么?你 adoption 的速度快不快。如果落地速度比較慢,對公司發(fā)展而言是比較痛苦的,企業(yè)能夠構(gòu)建的就是技術(shù)門檻。當(dāng)然這也可以做,但就相對比較慢一點。 邱諄:我也補充一下。其實今天我們看很多跟商業(yè)化相關(guān)的項目,我們還是比較看重創(chuàng)業(yè)者本身及其產(chǎn)業(yè)背景、他對應(yīng)用場景的理解等。從大模型領(lǐng)域來看,中美初創(chuàng)公司路徑差異主要有兩塊:一個是實現(xiàn)的路徑,第二塊是 adoption 的狀況。從你的觀察來看,二者有沒有一些差異? Alex Ren :今天不管是中國還是新加坡的創(chuàng)業(yè)者,普遍在 To C 和 To SMB 上比較有優(yōu)勢,但 To Enterprise 是比較難一些,因為企業(yè)客戶在美國市場化這塊也是一個很大的挑戰(zhàn),每個美國 To B 企業(yè)中都需要建立一個很大的銷售團隊和市場團隊,這不僅是中國的公司,可以說是所有海外創(chuàng)業(yè)者都會遇到的挑戰(zhàn)。 二者的差異在于,硅谷多數(shù)初創(chuàng)公司在 A 輪之前很少會講宏觀戰(zhàn)略,更多聚焦在產(chǎn)品如何解決用戶痛點,這個是最關(guān)鍵的,另外就是發(fā)展趨勢,因此會更落地一些。硅谷往往強調(diào) PLG,Power Lead Growth,通過產(chǎn)品功能的提升來吸引用戶使用,這是一個核心捷徑,關(guān)注用戶每次對產(chǎn)品的問題反饋,再進(jìn)行快速迭代。 邱諄:目前國內(nèi)的AI公司非常多,不管是應(yīng)用層、底層包括 Infra 層,大家都很活躍。相比之下在美國創(chuàng)業(yè)公司的 adoption 進(jìn)度如何衡量?大概在一個什么樣的階段? Alex Ren :現(xiàn)階段比較成熟的是文本、文生圖。從最早的公司 Jasper AI,到 ChatGPT,以及文生圖領(lǐng)域的 Midjourney,其實它們落地的速度都很快。但它們共同的特點就是,都是面向 C 端的消費者或 Prosumer。 美國公司有一個很有意思的現(xiàn)象,就是比如說 Midjourney 是通過 Discord 這樣的一個平臺去調(diào)用的,即我們在互聯(lián)網(wǎng)時代講的網(wǎng)絡(luò)效應(yīng),在 Discord 社區(qū)里使用 Midjourney 時,每次生成的圖片用戶都能看到,Prompt 也都能看到,有了別人的案例后我也可以來進(jìn)行生成,這個網(wǎng)絡(luò)效應(yīng)就在用戶之間互相學(xué)習(xí),因此 Discord 也是一個很重要的產(chǎn)品發(fā)行平臺,尤其是針對 Prosumer 來講,大家可以很快形成社區(qū)。 這種模式對早期公司而言非常重要,在用戶之間形成的網(wǎng)絡(luò)效應(yīng)能加速產(chǎn)品傳播,使用戶群體很快就爆發(fā)了。當(dāng)然,就目前來說,現(xiàn)在爆發(fā)的應(yīng)用還是以文本、二維圖像生成處理為主,其他技術(shù)還不夠ready,仍在發(fā)展中。 //
近期熱門文章
今天,在新加坡,大模型在GAIR 2023上迎來高光時刻
GAIR 2021 回顧:AI創(chuàng)新與人才培養(yǎng)
GAIR 2020 回顧:紀(jì)念 Thomas S.Huang
關(guān)鍵詞:
相關(guān)閱讀
-
Fellows Fund 創(chuàng)始人 Alex Ren :...
“AI創(chuàng)業(yè)差異:國內(nèi)聚焦大模型,硅谷更強調(diào)PLG(增長驅(qū)動)帶動的AI產(chǎn) -
從“黑掉衛(wèi)星”挑戰(zhàn)賽分析美太空安全攻...
據(jù)美國“政治新聞網(wǎng)”報道,拉斯維加斯當(dāng)?shù)貢r間11日舉行了一場網(wǎng)絡(luò)... -
百度Q2財報超預(yù)期:智能云、廣告業(yè)務(wù)強...
“百度智能云持續(xù)季度盈利?!弊髡哓繒蚤庉嬝钟X民 -
總時長翻倍的視頻號,似乎并未沖擊到快手
8月22日,快手公布一份整體不錯的二季度業(yè)績報告,收入同比增長28%至27 -
東方甄選入駐淘寶直播,俞敏洪下了一盤大棋
俞敏洪:沒有商業(yè)頭腦,遲早要被玩死。出品|電商行業(yè)作者|李響東方甄選 -
一套“簡單”架構(gòu)下實現(xiàn)的 HTAP 能支...
“HTAP”作為數(shù)據(jù)庫領(lǐng)域的當(dāng)紅炸子雞,其熱捧度逐年遞增。特別是在...