Intelligence with Everyone,這是MiniMax創(chuàng)業(yè)的初衷。
本文為IPO早知道原創(chuàng)
作者|Stone Jin
據(jù)IPO早知道消息,MiniMax創(chuàng)始人、CEO閆俊杰作為特邀嘉賓出席WAIC 2025大會開幕式并在大會主論壇(上午場)發(fā)表主題演講《每個人的AI,Everyone's AI》。
以下為分享全文:
大家好,我給大家分享的題目是《每個人的AI,Everyone's AI》。講這個題目,跟我個人過去經(jīng)歷有關。當Hinton先生開始設計 AlexNet 之時,我是國內(nèi)第一批從事深度學習研究的博士生;當AlphaGo人機大戰(zhàn)上演,也是人工智能走進所有人視野之時,我在參與一家創(chuàng)業(yè)公司;而當ChatGPT出來的前一年,我們開始創(chuàng)立MiniMax,也是國內(nèi)第一批大模型公司。
在過去的15年里,當我每天面對任務寫代碼,看論文做實驗的時候,一直都在想一件事:如此受關注的人工智能到底是什么?人工智能跟這個社會到底有什么樣的聯(lián)系?
隨著我們模型變得越來越好,我們發(fā)現(xiàn)人工智能正逐步成為社會的生產(chǎn)力。比如,我們在做人工智能研究的時候,每天需要分析大量的數(shù)據(jù),一開始我們需要來寫一些軟件來分析這些數(shù)據(jù),后續(xù)我們發(fā)現(xiàn)其實可以讓 AI 來生成一個軟件,來幫助分析所有數(shù)據(jù)。作為一個研究員, 我非常關心每天AI領域的所有進展,一開始我們設想,是不是可以做一款APP,來幫我們追蹤各領域的進展?后面我們發(fā)現(xiàn),這件事也不需要自己來做,讓一個 AI Agent 來自動跟蹤更加高效。
AI是更強的生產(chǎn)力,也是越來越強的創(chuàng)意。比如,15 年前上海舉辦世博會的時候,有一個非?;鸨募槲锝小昂殹?。過去 15 年,上海有了全方位的發(fā)展,我們?nèi)绻肜^續(xù)用“海寶”IP生成一系列更具上海特色,符合時下潮流的衍生形象時,AI 可以做得更好。正如現(xiàn)場屏幕展示的,徐匯書院×海寶、武康大樓×海寶,AI 能一鍵直出,幫我們生成各種各樣的創(chuàng)意形象。
再比如最近非常火的Labubu,此前制作一個Labubu創(chuàng)意視頻,可能需要兩個月,花費大約幾十甚至百萬人民幣。通過越來越強的AI視頻模型,像大屏幕右邊展示的Labubu視頻,基本一天時間就可以生成出來,成本只有幾百塊錢。
過去六個月,我們的視頻模型海螺(Hailuo)已經(jīng)在全世界生成超過3億個視頻。通過高質量的 AI 模型,互聯(lián)網(wǎng)上的大部分內(nèi)容與創(chuàng)意會變得越來越普及,低門檻讓每個人的創(chuàng)意得以充分發(fā)揮。
除了釋放生產(chǎn)力與創(chuàng)意之外,我們發(fā)現(xiàn),AI 的使用其實已經(jīng)超出最初的的設計與預期,各種各樣想象不到的應用場景正在發(fā)生;比如解析一個古文字、模擬一次飛行、設計一個天文望遠鏡……這樣意想不到的場景,隨著模型能力越來越強,變得越來越可行;僅僅需要少量協(xié)作,就可以把每個人的想法變成現(xiàn)實。僅僅需要少量協(xié)作,就可以把每個人的想法變成現(xiàn)實。
面對這么多變化,一個想法開始在我的心里涌現(xiàn)出來:作為一個AI創(chuàng)業(yè)者,AI 公司并不是重新復制一個互聯(lián)網(wǎng)公司,AI 是一個更基礎更根本的生產(chǎn)力,是對個人能力和社會能力的持續(xù)增強。這里有兩點比較關鍵:第一、AI是一種能力,第二是AI是可持續(xù)的。
人類很難突破生物定律,永不停歇學習新知識,持續(xù)變聰明,而AI可以。當我們在建造更好的 AI 模型時,我們也發(fā)現(xiàn),AI 也在和我們?nèi)祟愐黄疬M步,一起做出來更好的AI。就在我們公司內(nèi)部,員工每天需要寫很多代碼,做很多研究型實驗,這里邊大概有 70% 的代碼是 AI 來寫,90% 數(shù)據(jù)分析是靠 AI 來做。
AI 怎么能變得越來越專業(yè)?大約在一年前,當時訓練模型還需要大量的基礎標注工作,標注員是一個不可或缺的工種。而今年,當 AI 能力變得越來越強的時候,大量機械的標注工作被專業(yè)AI完成,標注員則可以專注于更有價值的專家型工作,一起幫助模型變得更好。標注工作也不再是簡單給 AI一個答案,而是教會AI思考的過程,讓AI來學習人類的思考過程,從而使AI能力變得更加泛化,越來越接近人類頂尖專家的水平。
除了通過專家來教 AI 之外,還有另外一種進步,就是在環(huán)境中大量學習。在過去半年, 通過各種環(huán)境,從編程IDE,到 Agent 環(huán)境, 再到游戲沙盒,當我們把 AI 放到一個能夠持續(xù)提供可驗證的獎勵環(huán)境中學習,只要這個環(huán)境可以被定義出來,有明確的獎勵信號,AI 就可以把問題給解決。這個強化學習也變得可持續(xù),規(guī)模越來越大。
基于這些觀察,我們有一個非常確定性的判斷:AI 會變得越來越強,而且這種增強幾乎是沒有盡頭的。
接下來出現(xiàn)的問題是,AI這么強,對社會的影響越來越大,那么AI到底會不會被壟斷?它是會被掌握在一家組織里,還是掌握在多家組織里呢?
我們認為,AI領域一定會有多個玩家持續(xù)存在。原因有三點:第一,我們目前用到的所有模型,都依賴對齊(Model Alignment)。很明顯,不同模型的對齊目標其實是不一樣的,比如有的模型對齊目標是一個靠譜的程序員,那么做 Agent 就會特別的強;有的模型它對齊目標是與人的交互,那么它就會比較有情商, 能夠做流暢的對話;有的模型可能會充滿想象力。不同的對齊目標反映了不同公司或者組織的價值觀,這些價值觀最終會導致模型的表現(xiàn)非常不一樣,也會使得不同的模型擁有各自的特點,并且長期存在。
第二,我們在最近半年用的 AI 系統(tǒng)其實都已經(jīng)不是單個模型了,而是一個多 Agent系統(tǒng),里面涉及多個模型, 不同的模型也可以使用不同的工具,通過這樣的方式讓AI智能水平越來越高,能夠解決越來越復雜的問題。這個東西帶來的結果是,單一模型的優(yōu)勢在這樣一個多 Agent 系統(tǒng)里逐漸變?nèi)酢?/p>
第三,在過去半年,有很多非常智能的系統(tǒng),都不是大公司所擁有的。背后的原因,是過去一年開源模型如雨后春筍般涌現(xiàn),開源模型變得越來越有影響力。這張圖是過去一年比較受關注 AI 的排行榜,可以發(fā)現(xiàn)最好的模型還是閉源的,但最好的開源模型越來越多,同時也在不斷逼近最好的閉源模型。
基于這三點原因,我們認為, AI 一定會被掌握在多家公司的手中。
與此同時,我們認為 AI 一定會變得越來越普惠,使用成本也會變得更加可控。
在過去一年半, AI 模型的大小沒有發(fā)生特別大的變化,即便我們可使用算力更多了。為什么呢?對所有實用模型而言,計算速度是一個比較關鍵的因素。如果模型計算速度特別慢,就會降低用戶的使用意愿,所以所有公司都關注模型的參數(shù)量和智能水平之間的平衡。
此前,模型大小增長和芯片的進步速度基本上是成正比的。我們知道芯片的進步速度是每 18 個月會翻一倍,模型也會相應保持這樣的增長趨勢。而現(xiàn)在,雖然大家都有更多的算力了,模型參數(shù)卻沒有變得更大。那這些增長的算力花在哪呢?
首先說訓練,規(guī)模增長的速度在過去半年已經(jīng)變得比較緩慢,訓練單個模型的成本實際上卻沒有顯著增加。這些算力花在做更多的研究跟探索上。而我們知道研究和探索,除了取決于算力之外,還取決于高效的整體實驗設計,高效的研發(fā)團隊,以及一些天才的創(chuàng)意。結果是,擁有非常多算力的公司和沒擁有那么多算力的公司,在訓練上其實的差異可能不會那么大。沒有那么多算力的公司,可以通過持續(xù)提升自己的實驗設計、提升思考能力和組織形式,讓實驗探索變得更加高效。
再說推理,在過去一年,最好模型的推理成本其實是降了一個數(shù)量級,通過大量的計算網(wǎng)絡系統(tǒng)和優(yōu)化算法,我們認為在接下來一兩年之內(nèi),最好模型的推理成本可能還能再降低一個數(shù)量級。總結而言,我們認為訓練單個模型的成本不會顯著地增加。
我們認為,大量創(chuàng)新能讓 AI 研發(fā)變成一個沒有那么燒錢的行業(yè),但是算力使用還會增加。盡管 Token 會變得很便宜,但是使用 Token 的數(shù)量會顯著增加。去年ChatBot單個對話只要消耗幾千個Token,現(xiàn)在 Agent 單個對話可能消耗幾百萬個Token,并且因為AI解決的問題越來越復雜,越來越實用,那么用的人也會越來越多。
讓每個人都用得起AI,這是我們對 AI 發(fā)展的判斷。Intelligence with Everyone,這也是我們創(chuàng)業(yè)的初衷。我們認為 AGI一定會實現(xiàn),并且一定會服務大眾、普惠大眾。
如果有一天 AGI 實現(xiàn)了,其過程一定是由做 AI 的公司們和他們的用戶一起來實現(xiàn),并且這個 AGI 應該屬于多家AI 公司和它的廣泛用戶,而不是只屬于單個組織某家公司。
我們也愿意長期為這個目標而奮斗。感謝大家!
本文來源:IPO早知道
來源:IPO早知道
重要提示:本文僅代表作者個人觀點,并不代表樂居財經(jīng)立場。 本文著作權,歸樂居財經(jīng)所有。未經(jīng)允許,任何單位或個人不得在任何公開傳播平臺上使用本文內(nèi)容;經(jīng)允許進行轉載或引用時,請注明來源。聯(lián)系請發(fā)郵件至ljcj@leju.com,或點擊【聯(lián)系客服】
樂居財經(jīng)APP
?2017-2025 北京怡生樂居財經(jīng)文化傳媒有限公司 北京市朝陽區(qū)西大望路甲22號院1號樓1層101內(nèi)3層S3-01房間756號 100016
京ICP備2021030296號-2京公網(wǎng)安備 11010502047973號