首頁 > 運動

A16Z:生成式AI平臺,誰主沉浮?

由 創業邦 發表于 運動2023-02-05

簡介aiHugging Face:機器學習模型和資料集託管平臺,向客戶交付可用模型,公司成立於2016年,迄今已開放10萬個預訓練模型和1萬個資料集,2022年5月宣佈完成1億美元C輪融資,估值達20億美元

ai的擴充套件是幹嘛的

A16Z:生成式AI平臺,誰主沉浮?

編者按:本文來自微信公眾號 我思鍋我在(ID:thinkxcloud),作者:我思鍋我在GN,創業邦經授權釋出。

美國著名投資機構A16Z近日發表了一篇文章題為《Who Owns the Generative AI Platform?(生成式AI平臺,誰主沉浮?)》,裡面包含幾個月以來對AIGC領域內大廠與初創公司的訪談調研和資料分析,可能是我最近看到對此類話題最客觀且詳實的討論。

從去年Midjourney火爆出圈,隨後一系列相關公司如Stability。AI、Runway、Jasper。AI等相繼得到資本的青睞,年底ChatGPT更是讓普通大眾看到了下一代AI技術可能帶來的“魔法”,背後的技術平臺OpenAI更傳言估值高達290億美金。

熱鬧之下,這篇文章給出了非常多公開整理和實際調研獲得的資料,並結合對上百家公司的真實訪談,得出的階段性結論——“目前,生成式AI領域似乎不存在任何系統性的護城河”,這一定程度上給大家“潑了冷水”,但似乎又與很多投資人和從業者的困惑相符。

且看A16Z是如何將這個話題層層剖析,由淺入深,並在最後給出誠實也充滿希望的答案的,Enjoy!

——

我們已開始見證生成式AI(AIGC)技術棧的興起。數以百計的初創公司正在湧入市場,開發基礎模型,構建人工智慧原生的應用程式,並建立基礎設施和開發工具。

不像許多熱門的技術趨勢在市場跟上其步伐前就被過度炒作了,生成式AI的熱潮卻伴隨著極高的市場歡迎度以及真實的市場收益。如Stable Diffusion和ChatGPT的模型們正在創造使用者增長的歷史記錄,一些應用在釋出不到一年的時間裡就實現了1億美元的年營收。對照表明,AI模型在某些任務上的表現優於人類好幾個數量級。

已有足夠的早期資料表明正規化轉移正在發生。而我們尚未明確的關鍵問題是:

這個市場中的價值將在哪裡積累?

過去一年裡,我們會見了幾十位生成式AI的從業者,他們有些是初創公司的創始人,有些在大公司中負責與生成式AI相關的工作。據我們觀察:

基礎設施提供商可能是迄今為止市場上的最大贏家,他們賺取了流經技術棧的大部分資金;

應用類公司的營收增長得非常快,但在留存率、產品差異化和毛利率上卻容易遇到瓶頸;

模型提供商雖然對這個市場而言不可或缺,但絕大多數都還沒有實現大規模的商業化。

換言之,創造最大價值的公司——即訓練生成式AI模型並將其應用在新的應用程式中的那些公司——尚未獲取最大的價值。

我們很難預測接下來將發生什麼,但我們認為,核心是理解技術棧的哪些部分真正具有差異化和壁壘。這將對市場結構(公司的橫向或縱向發展)和其長期價值的驅動因素(利潤率和留存)產生重大影響。至今,除了經典的護城河之外,我們很難在技術棧中找到堅實的壁壘。

我們非常看好生成式AI,相信它將對軟體行業和其他行業產生巨大的影響。這篇文章的目標是描繪出市場的驅動力,並嘗試回答和生成式AI的商業模式相關的更廣泛的問題。

高階技術棧:基礎設施、模型和應用

為了理解生成式AI市場是如何形成的,我們首先需要定義當前的技術棧是如何構成的的。以下是我們的初步觀點:

A16Z:生成式AI平臺,誰主沉浮?

該棧(自上而下)可分為三個層級:

應用層:將生成式AI模型整合進面向使用者的應用軟體,它們或執行著自己的模型(端到端應用),或依賴於三方模型的API;

模型層:驅動AI產品的模型,它們要麼以專有API的形式提供,要麼開源提供(這種情況需要一個對應的託管解決方案);

基礎設施:基礎設施供應商(如雲廠商或硬體製造商),它們負載著生成式AI模型的訓練和推理。

值得注意的是:這並非一幅市場全景圖,而是一個分析該市場的框架。在每個類別中,我們列出了部分知名的供應商,沒有試圖窮舉所有已釋出的生成式AI應用。關於MLOps(機器學習運維)或LLMOps(大語言模型運維)工具的深入探討也將在後續的文章中展開,目前它們尚未高度標準化。

第一波生成式AI應用正邁向規模化,但在留存率和差異化上仍面臨困難

在之前的技術週期中,人們普遍認為要建立一個獨立的大企業,公司必須擁有終端客戶——無論是個人消費者還是企業買家。因此人們更容易相信,生成式AI領域的最終贏家也會是面向終端的應用程式。而目前,生成式AI的探索之旅依然迷霧重重。

可以肯定的是,生成式AI應用程式的增速是驚人的,這得益於產品的新穎性和豐富的使用者用例。

我們瞭解到至少有三類產品年營收已經超過了1億美元,即影象生成、文案寫作和程式碼編寫。

然而,僅靠高增長還不足以建立經久不衰的軟體公司。關鍵之處在於增長的背後必須有利可圖——從某種意義上說,使用者一旦註冊,就會產生收益(高毛利),並長期留在應用中(高留存)。在技術缺乏差異化的情況下,B2B和B2C應用多數透過網路效應、資料沉澱和日益複雜的工作流來推動長期客戶價值。

在生成式AI中,這些假設並不一定成立。那些與我們交談過的應用軟體公司,毛利率落在一個很大的區間——少數情況下可高達90%,但更多數情況僅有50-60%,主要受限於模型推理成本。雖然使用者漏斗頂端的增長十分驚人,但鑑於我們已經看見付費轉化和留存的開始下降,現有的獲客策略是否可規模化尚未可知。由於依賴類似的資料模型,許多應用軟體在產品層面相差無幾,並且它們均尚未找到友商難以複製的顯著網路效應、資料積累或獨特工作流。

因此,目前還無法明確直接銷售終端應用是否是構建生成式AI可持續商業模式的唯一甚至是最佳途徑。隨著語言模型的競爭加劇和效率提升,應用的利潤空間將會提高(下文將詳述),而後面“白嫖黨”會逐漸離場,產品的留存也可能有所提升。一個強有力但仍待驗證的觀點是,縱向整合的應用(如上圖裡的Midjourney)將在差異化上具有優勢。

展望未來,生成式AI應用公司將面臨的主要問題包括:

縱向整合(應用+模型):將AI模型視作一種服務,小型應用開發團隊可以快速迭代並隨著技術的演進替換模型供應商。另一方面,部分開發者認為模型就是產品本身,只有從頭開始訓練才能建立壁壘——即不斷對產品積累下來的專有資料進行訓練。這麼做的代價是燒更多的錢並犧牲部分產品團隊的靈活性。

構建功能還是應用:生成式AI的產品形態五花八門:桌面應用程式、移動應用程式、Figma/Photoshop外掛、Chrome瀏覽器擴充套件應用甚至Discord機器人…在使用者已經習慣的工作介面中整合AI通常比較容易,因為互動介面往往只是一個文字框。這些公司中的哪些將成長為獨立的公司,哪些又將被已有AI產品線的大廠(如微軟或谷歌)收入麾下,值得拭目以待。

設法穿越炒作週期(Hype cycle):使用者流失究竟是因為產品自身的產品力不足還是早期市場的人為表現目前尚無定論,對生成式AI的濃厚興趣是否會隨著炒作的消退而淡去也暫時沒有答案——何時加速融資?如何激進地獲客?優先考慮哪些使用者群體?何時宣告PMF成功?這些問題對於應用程式類公司而言意義重大。

模型提供商發明了生成式AI,但尚未實現大規模商業化

如果沒有谷歌、OpenAI和Stability。AI等公司奠定了傑出的研究和工程基礎,我們現在所說的生成式AI將無從存在。創新的模型架構和不斷擴充套件的訓練管道使我們均受益於大語言模型(LLMs)和影象生成模型的“超能力”。

然而,這些公司的收入規模在其用量和熱度面前似乎不值一提。在影象生成方面,得益於其使用者介面、託管產品和微調方法組成的操作生態,Stable Diffusion已經見證了爆炸性的社群增長。但Stability仍將免費提供其主要檢查點作為核心業務宗旨(願景是開源)。在自然語言模型中,OpenAI以GPT-3/3。5和ChatGPT佔據主導地位,但到目前為止,基於OpenAI構建的殺手級應用仍相對較少,而且其API定價已經下調過一次。

這可能只是一個暫時的現象。Stability。AI仍是一家尚未專注於商業化的新興公司,隨著越來越多殺手級應用的構建——尤其當它們被順利整合進微軟的產品矩陣,OpenAI也有成長為龐然大物的潛力,屆時將吃走NLP領域一塊很大的蛋糕。當模型被大量使用,大規模的商業化自然水到渠成。

但阻力依然存在。開源模型可以由任何人託管,包括不承擔大模型訓練成本(高達數千萬或數億美元)的外部公司。是否有閉源模型可以長久地保持其優勢目前還是未知數。我們看見由Anthropic、Cohere和Character。ai等公司自行構建的大語言模型開始嶄露頭角,這些模型和OpenAI基於類似的資料集和模型架構進行訓練,在效能上已經逼近OpenAI。但Stable Diffusion的例子表明,如果開源模型擁有足夠高的效能水平和充分的社群支援,那麼閉源的替代方案將難以與其競爭。

如今,對專有API(如OpenAI)的需求正在迅速增長,託管可能是目前對模型提供商而言最明確的商業化路徑。開源模型託管服務(如Hugging Face和Replicate)正在成為便捷地分享和整合模型的有效樞紐——甚至在模型提供者和消費者之間產生了間接的網路效應。模型提供商透過模型微調和與企業客戶簽訂託管協議來變現,看上去是十分可行的。

除此之外,模型提供商將面臨的主要問題還包括:

商品化:人們普遍認為,AI模型的效能將隨時間推移趨於一致。在與應用開發者的交談中,我們可以確定這種情況尚未發生,在文字和影象模型領域都還存在實力強勁的領跑者。它們的優勢並非基於獨特的模型架構,而是源自大量的資本投入、專有的互動資料沉澱和稀缺的AI人才。但這些會是持久的優勢嗎?

客戶流失:依賴模型提供商是應用類公司起步甚至(早期)發展業務的絕佳方法。但當業務達到一定體量,這些公司就有動力構建或託管它們自己的模型。許多模型提供商的客戶分佈高度不均衡,少數應用貢獻了絕大多數收入。一旦這些客戶轉向自研AI,對模型提供商將意味著什麼?

錢重要嗎:生成式AI的未來是把雙刃劍,前景無比光明卻也潛在巨大危害,以至於許多模型供應商以共益企業(B corps)的模式組織成立,它們或發行有上限的利潤份額,或以其他方式明確地將公共利益納入公司使命。這些舉措絲毫不影響它們融資。但此處有一個合理的爭議——即多數模型提供商是否真的想要獲取價值,以及它們是否應該這麼做?

基礎設施供應商觸及一切並採摘了果實

生成式AI中的近乎一切都會在某個時刻透過雲託管的GPU(或TPU)。無論是對於訓練模型的模型提供商和科研實驗室、執行推理和微調任務的託管公司或是兩者兼顧的應用程式公司,每秒浮點運算(FLOPS)都是生成式AI的命脈。這是很長時間以來第一次,最具顛覆性的計算技術的進步嚴重受限於計算量。

因此,生成式AI市場裡的大量資金最終流向了基礎設施公司。可以用一些粗算數字加以說明:

我們估計,應用程式公司平均將約20-40%的年收入用於推理和定製化的微調,這部分通常直接支付給雲服務提供商以獲取例項或支付給第三方模型提供商——相應地,這些模型提供商將大約一半的收入投入於雲基礎設施。

據此我們有理由推測,生成式AI總營收的10-20%將流向雲服務提供商。

除此之外,訓練著自有模型的初創公司們已經籌集了數十億美元的風險投資——其中大部分(早期階段高達80-90%)通常也花在雲服務提供商身上。許多上市科技公司每年在模型訓練上花費數億美元,它們要麼與外部的雲服務提供商合作,要麼直接與硬體製造商合作。

這就是我們常說的“一大筆錢”——尤其是對於一個新興市場而言。其中大部分的錢都花在了三大雲上:AWS、谷歌雲(GCP)和微軟Azure。三朵雲每年花費超千億美元的資本支出以確保它們擁有最全面、最可靠、最具成本優勢的雲平臺。尤其在生成式AI領域,三朵雲還受益於有限的供給,因為它們可以優先使用稀缺的硬體(如英偉達的A100和H100 GPU)。

眼下,我們看見該領域的競爭也開始出現。甲骨文等挑戰者已經透過鉅額的資本支出和銷售激勵進軍市場;一些提供針對大模型開發人員提供解決方案的初創公司,如Coreweave和Lambda Labs也正在快速發展,它們在成本、可用性和個性化支援上展開角逐。此外,初創公司還公開更細粒度的資源抽象(即容器),而受限於GPU虛擬化,大型雲廠商只提供虛擬機器例項。

迄今為止,生成式AI領域最大的幕後贏家,可能是運行了絕大多數AI工作負載的英偉達(NVIDIA)。該公司報告稱,2023財年第三季度,其資料中心GPU的收入為38億美元,其中相當一部分用於生成式AI用例。透過數十年對GPU架構的投資、產學研深入合作以及軟硬體生態系統的構建,英偉達已圍繞該業務建立了堅固的護城河。最近一項分析發現,研究文獻中引用英偉達GPU的次數是頂級AI晶片初創公司總和的90倍。

其他硬體選項確實存在,包括谷歌張量處理單元(TPU)、AMD Instinct GPU、AWS Inferentia和Trainium晶片,以及來自Cerebras、Sambanova和Graphcore等初創公司的AI加速器。後發者英特爾(Intel)也帶著高階的Havana晶片和Ponte Vecchio GPU 進入了這個市場。但到目前為止,仍然鮮有新晶片能夠佔據可觀的市場份額。

有兩個例外值得關注,一個是谷歌,其TPU在Stable Diffusion社群和谷歌雲平臺的一些大型案例中表現出了巨大吸引力,另一個是臺積電,據說它生產了以上所列舉的所有晶片,包括英偉達的GPU(英特爾的晶片則由自有晶圓廠和臺積電共同生產)。

換句話說,基礎設施可能是整個技術棧中可持續獲利且有壁壘的一層。基礎設施供應商需要回答的主要問題包括:

保持無狀態工作負載:無論在哪裡租用英偉達的GPU都是一樣的。大多數AI工作負載是無狀態的,從某種意義上說,模型推理無需附加的資料庫或儲存(除模型權重本身外)。這意味著AI工作負載可能比傳統應用程式的工作負載更易於跨雲遷移。在這種情況下,雲服務提供商應如何創造使用者粘性,防止客戶轉向便宜的選擇?

晶片荒終結後的較量:雲服務提供商和英偉達產品的定價都是基於最理想的GPU目前供給稀缺。一位供應商告訴我們,A100的售價自發布以來有所上漲,這對於計算硬體而言是極不尋常的。若透過增加產量和/或採用新的硬體平臺可最終消除晶片的供給限制,雲服務提供商將受何影響?

挑戰者能否破局:我們堅信,垂直雲將透過提供更加專業的服務從三朵雲手中奪取市場份額。到目前為止,在AI領域,部分挑戰者透過適度的技術差異化和英偉達的支援已經獲得了一定的市場吸引力——對英偉達而言,現有的雲服務提供商既是最大的客戶,也是新興的競爭對手。但長期的問題是,這些助力是否足以幫助新興雲廠商攻克三朵雲的規模優勢?

那麼……價值最終將在哪裡積累?

顯然,我們還不知道答案。但結合生成式AI的早期資料和我們關於AI/ML初創公司的經驗,我們有以下直覺:

如今,生成式AI領域似乎不存在任何系統性的護城河。

由於基於相似的模型構建應用,應用程式提供商缺乏顯著的的產品差異。其次,由於模型基於相似架構和相似的資料集訓練而來,模型提供商長期可能會趨於一致。最後,由於運行同樣的GPU,甚至硬體公司在相同的晶圓廠生產晶片,雲服務提供商缺乏深度的技術差異。

當然,老生常談的護城河依然存在,比如:規模護城河(“我能比你融到更多的錢!”),供應鏈護城河(“我擁有你所沒有的GPU!”),生態護城河(“所有人都已經在使用我的軟體”),演算法護城河(“我們比你更聰明!”),分發護城河(“我已經組建了銷售團隊並且客戶數比你多!”)以及資料管道護城河(“我在網際網路上爬取了比你更多的資訊!”)。

但長期而言,這些護城河並不可持續。強大的網路效應是否會在生成式AI技術棧中的任何一層佔據上風?現在下定論,一切還為時過早。

根據現有資料,我們很難判斷,生成式AI長期是否會形成贏者通吃的局面。

這很不尋常,但對我們而言是個好訊息。這個市場的潛在規模難以把握——它介於所有軟體和所有人類的努力之間——因此我們預計將有許多玩家參與到技術棧各個層級的有序競爭中。

我們也希望公司無論橫向延展或是縱向深耕都能取得成功,為終端市場和終端使用者提供最佳解決方案。舉例來說:

如果終端產品的差異化源自AI本身,那麼縱向深耕(即緊密耦合面向使用者的應用和自研模型)可能會取勝;

如果AI屬於一個更大的長尾功能組合,那麼橫向延展將更可能發生。隨著時間的推移,我們將看見更多典型護城河的建立——甚至可能見證新型護城河的誕生。

無論如何,有一件事我們可以確定,生成式AI正在改變這場遊戲,而我們都在與時俱進地學習著遊戲規則。大量價值將被AI釋放,科技領域終將發生翻天覆地的變化。

此刻,我們正在這浪潮之上,擁抱生成式的新未來!

文中提及的初創公司/產品:

Midjourney:基於Stable Diffusion的AI影象生成平臺,產品於2022年7月公測,據相關資料表明以實現盈利。https://midjourney。com/home/

Runway:基於Stable Diffusion的AI內容生成平臺,目前核心功能為text to image和text to vide,公司成立於2018年,2022年12月宣佈完成5000萬美元C輪融資,估值達5億美元,預計年營收為500萬美元。https://runwayml。com/

Jasper。AI:基於GPT-3的AI文案生成平臺,公司成立於2021年,2022年10月宣佈完成1。25億美元的A輪融資,估值達15億美元,預計2022年全年營收將達9000萬美元。https://www。jasper。ai/

GitHub Copilot:基於OpenAI Codex的AI程式碼編寫平臺,產品釋出於2021年7月,據Growjo預計其年營收為150萬美元。https://github。com/features/copilot

GPT-3(OpenAI):由OpenAI建立的語言預訓練模型,擁有1750億引數,2020年5月釋出,迄今已有超300款應用基於GPT-3構建;OpenAI成立於2015年,是一家人工智慧研究實驗室,擁有包括GPT系列、DALL-E、Codex等覆蓋多應用領域的基礎模型,據推測公司目前的年營收在5000-8000萬美元之間,繼2019年獲微軟10億投資後,於今年1月在此獲得微軟的多年期100億美元投資。https://openai。com/

Stable Diffusion(StabilityAI):由Stability建立的深度學習文字轉影象模型,2022年8月釋出,該模型為開源模型,引數量在10億級別,https://stablediffusionweb。com/;與Open AI類似,Stability AI是一家人工智慧研究實驗室,致力於為內容創作者提供多樣化的開源模型,2022年10月,公司宣佈完成1億美元融資,估值達10億美元。https://stability。ai/

Anthropic:研究型AI公司,目標是建立一個可解釋、更強大的AI系統,2021年由OpenAI前研究副總裁達里奧·阿莫代帶頭成立,2022年4月宣佈完成5。8億美元A輪融資。https://www。anthropic。com/

Cohere:自然語言模型處理平臺,旨在提升NLP模型的易用性,其核心模型為谷歌的Transformer,公司成立於2019年,2022年2月宣佈完成1。25億美元B輪融資。https://cohere。ai/

Character。ai:提供神經語言模型和基於此構建的Chatbot,2022年9月釋出beta版本。https://beta。character。ai/

Hugging Face:機器學習模型和資料集託管平臺,向客戶交付可用模型,公司成立於2016年,迄今已開放10萬個預訓練模型和1萬個資料集,2022年5月宣佈完成1億美元C輪融資,估值達20億美元。https://huggingface。co/

Replicate:機器學習模型託管平臺,幫助模型實現快速交付,公司成立於2019年,並於2020年獲得Y Combinator的種子輪投資。https://replicate。com/

CoreWeave:為大規模GPU加速工作負載的雲服務提供商,公司成立於2017年,累計融資額達1。5億美元。https://www。coreweave。com/

Lambda Labs:為深度學習打造的雲GPU,公司成立於2012年,累計融資額近7000萬美元。https://lambdalabs。com/

Cerebras:AI晶片研發商,為深度學習構建計算系統,公司成立於2015年,2021年11月宣佈完成2。5億美元F輪融資,估值超40億美元。https://www。cerebras。net/

Sambanova:AI晶片研發商,設計和構建整合的硬體和軟體解決方案,公司成立於2017年,2021年4月宣佈完成6。76億美元D輪融資,估值超50億美元。https://sambanova。ai/

Graphcore:AI晶片研發,設計和研發智慧處理器單元(IPU)硬體和相應軟體,公司成立於2016年,2020年12月宣佈完成2。22億美元E輪融資,估值達27。7億美元。https://www。graphcore。ai

參考文章:

Art Isn‘t Dead, It’s Just Machine-Generated | Andreessen Horowitz

September 2022 - OpenAI API Pricing Update FAQ

Follow the CAPEX: Cloud Table Stakes 2021 Retrospective

SEC Filings Details

State of AI Report 2022 - ONLINE

Verticals clouds are on the rise, as traditional clouds give way to specialization。

The New Business of AI (and How It‘s Different From Traditional Software) | Andreessen Horowitz

本文(含圖片)為合作媒體授權創業邦轉載,不代表創業邦立場,轉載請聯絡原作者。如有任何疑問,請聯絡

Tags:AI模型生成式https公司