“一個有著超大‘內(nèi)存’的智能助手,可以一口氣讀完二十萬字的小說,還會上網(wǎng)沖浪。”這是Kimi Chat官方對自家推出的智能助手的介紹。
3月18日,月之暗面(Moonshot AI)宣布其旗下推出的智能助手Kimi Chat在大模型長上下文窗口技術(shù)上取得新的突破,目前已經(jīng)可以支持200萬字超長無損上下文,并宣布開啟產(chǎn)品內(nèi)測。
此消息一出立刻引起資本市場和AI界的關(guān)注,相關(guān)話題很快登上熱搜,諸多網(wǎng)友前往Kimi Chat官網(wǎng)親自體驗,一度讓Kimi Chat因為過于火爆而“罷工”。而此時,距離月之暗面第一次向世人介紹Kimi Chat這款A(yù)I長文本領(lǐng)域的突破性成果僅過去不到半年。
半年內(nèi)提升10倍,Kimi開啟千億大模型長文本時代
2023年10月9日,月之暗面向公眾推出世界首個支持輸入20萬漢字的智能助手產(chǎn)品,這是月之暗面第一次在公眾面前亮相,也是Kimi Chat的名字首次被公眾聽到。在此之后,月之暗面就漸漸淡出人們視野,只是在今年2月完成新一輪超10億美元融資時才再度淺淺露個面。此時估計誰也未曾想到,一個月后這家AI新秀將再度爆出大驚喜,把AI長文領(lǐng)域賽道競爭的激烈程度“自我內(nèi)卷”到難以企及的新高度。
相比于此前的20萬字長文本上限,全新的Kimi智能助手支持文本上限的長度直接提升到原先10倍,而更大容量的長上下文處理能力無疑將幫助Kimi用戶解鎖更多新的使用場景,包括長篇文本的翻譯和理解、輔助分析法律問題、一次性整理幾十張發(fā)票、快速理解API開發(fā)文檔等。
而除了長文本處理能力大幅提升之外,新的Kimi同樣還強化了自身的上下文窗口和無損記憶功能以及多語言支持優(yōu)勢,這使得Kimi在聯(lián)網(wǎng)搜索與信息搜集、數(shù)據(jù)處理、編寫代碼和模擬對話等多種使用場景中同樣可以表現(xiàn)出色,也意味著國產(chǎn)AI在文本領(lǐng)域上或已超過海外頂尖水平。
“過去要 10000 小時才能成為專家的領(lǐng)域,現(xiàn)在只需要 10 分鐘,Kimi就能接近任何一個新領(lǐng)域的初級專家水平。用戶可以跟 Kimi 探討專業(yè)領(lǐng)域的問題,讓Kimi幫助自己練習專業(yè)技能,或者啟發(fā)新的想法。”月之暗面方面為此舉例道:用戶可以上傳一份完整的近百萬字中醫(yī)診療手冊讓Kimi閱讀學習,之后Kimi就可以針對用戶提出的問題給出專業(yè)診療建議。
資本市場望風而動,新概念股流行
有趣的是,Kimi升級的消息最先震動的并非AI圈,Sora出世以來對AI市場風向敏感的資本市場反應(yīng)迅速,搶先一步開始了狂歡,推動Kimi很快成為資本市場的新寵。
首先開始大漲的,是素有A股“妖王”之稱的九安醫(yī)療。自3月19日起,九安醫(yī)療股價突然垂直起飛,從當日開盤的41.96元/股,在4個交易日內(nèi)一度漲至最高54.98元/股,而原因僅僅是因為在去年8月時,九安醫(yī)療曾經(jīng)投資過月之暗面。
3月20日開始,與Kimi相關(guān)的概念股終于集體爆發(fā),“kimi概念股”成為A股市場上冉冉升起的一個全新的概念,多家上市公司因此集體收益,其中包括華策影視、掌閱科技、中廣天擇等。根據(jù)一周牛熊股發(fā)布的“本周漲幅最大個股TOP10”,3月18日到3月22日,華策影視股價一周大漲95.41%,堪稱“最強Kimi概念股”。
但Kimi概念股高歌猛進的勢頭并沒能持續(xù)太久,多家股市在短期驟漲后就很快開始降溫。25日開始,中廣天擇收盤跌停,福昕軟件、華策影視雙雙大跌,跌幅分別為15.01%、12.93%;廣宇軟件、深信服、易點天下跌幅均超10%,掌閱科技更是險些在短期內(nèi)上演了一出“天地板”。開盤以來,掌閱科技一度實現(xiàn)10天6板,但很快股價就大幅劇震,收盤跌近6%。
“Kimi延續(xù)了人工智能領(lǐng)域的火熱,因能與智能車等諸多產(chǎn)業(yè)結(jié)合,所以市場天花板很高。加上政策扶持,受資金青睞在意料之中。”科技分析師趙松解釋道:“該板塊的注意力一般聚焦在資金面和企業(yè)估值抬升上。券商炒熱概念然后退出賺錢,導致該板塊短期內(nèi)出現(xiàn)較大的波動性。”
舊賽道新高度,AI長文本內(nèi)卷升級
事實上,Kimi主打的長文本賽道本身并不算是目前AI領(lǐng)域的“潮流”賽道,甚至在Sora推出之前,業(yè)內(nèi)就有聲音認為單一的大語言模型必將被淘汰,多模態(tài)轉(zhuǎn)型才是未來趨勢。但就是在這樣的背景下,月之暗面依然將長文本大語言模型內(nèi)卷到一個所有人都始料未及的新高度,讓AI長文本再度成為一時熱點。
無論走哪個賽道,只要做到業(yè)內(nèi)頂尖就不怕沒有市場。隨著Chat GPT發(fā)布,AI文本分析和生成就已經(jīng)不再是什么稀奇事,日常的工作學習和生活中,不少人也已經(jīng)逐漸習慣于利用AI助手處理文本,但自始至終,由于目前市面上主流的AI大模型產(chǎn)品在promot的輸入上都存在字數(shù)限制,應(yīng)用場景還是相當局限。
比如GPT-3.5上下文輸入長度約在1.6萬token(token即模型輸入和輸出的基本單位),GPT-4在3.2萬token。把token量化成人類語言的話,3.2萬token的GPT-4達到了閱讀一篇短篇小說的程度,但并不支持閱讀長篇小說。
相比于同賽道的其他文生文大語言模型應(yīng)用,Kimi自誕生起的核心競爭力就聚焦于長文本分析聯(lián)網(wǎng)搜索、文檔處理等功能,在處理分析長文本材料,如厚重的學術(shù)文獻、古籍之類,Kimi的性能遠超其他模型。因此Kimi的出現(xiàn)和突破可以說填補了目前AI文本處理方面的市場空白。
有用戶實測了Kimi在長文本閱讀上的表現(xiàn),發(fā)現(xiàn)其在理解超長文本,比如小說和長篇文件上確實具有獨到優(yōu)勢。輸入一本長達70多萬字的《紅樓夢》,Kimi只用耗時數(shù)秒就能給出一篇漂亮的總結(jié)報告。
但是舊賽道的內(nèi)卷并沒有被Kimi終結(jié),反而很快卷出新高度。在Kimi宣布升級后,阿里和360在幾日后就相繼宣布自家AI助手將免費開放長文本功能。阿里旗下國產(chǎn)大語言模型通義千問預(yù)告即將免費開放1000萬字的長文檔處理功能,如果順利問世就會成為全球文檔處理容量第一的AI應(yīng)用。360更是在23號直接宣布其AI大模型智腦正式開啟內(nèi)測500萬字長文本處理功能,并入駐360AI 瀏覽器。
Kimi讓AI界再度聚焦大語言模型領(lǐng)域的藍海商機,一批資本開始回流。“隨著競爭對手們相繼發(fā)力長文本處理,Kimi的差異化優(yōu)勢或?qū)⒉粫怀?。如果大家都宣布免費開放,企業(yè)們的盈利問題將日益嚴峻。”趙松表示。
無損長文——通往通用人工智能的鑰匙
通用人工智能(General Artificial Intelligence),是指具有高效的學習和泛化能力、能夠根據(jù)所處的復雜動態(tài)環(huán)境自主產(chǎn)生并完成任務(wù)的通用人工智能體,具備自主的感知、認知、決策、學習、執(zhí)行和社會協(xié)作等能力,且符合人類情感、倫理與道德觀念。換言之,通用人工智能就是具有真正“智能”的人工智能,是幾個世紀以來人工智能努力發(fā)展的最終方向。
即便當下現(xiàn)有的人工智能已經(jīng)足以突破人類的固有想象,但實際上依然都停留在弱人工智能階段,離真正的人工智能相差甚遠。而無損的長上下文,就將會是走向通用人工智能的一個關(guān)鍵的基礎(chǔ)技術(shù)。月之暗面創(chuàng)始人楊植麟表示:“歷史上所有的模型架構(gòu)演進,本質(zhì)上都是在提升有效的、無損的上下文長度。上下文長度可能存在摩爾定律,但需要同時優(yōu)化長度和無損壓縮水平兩個指標,才是有意義的規(guī)?;?。”
時間回溯到2022年底,AI界的“破壁人”ChatGPT問世,相比以往AI產(chǎn)品,這款不僅可以流暢地與人類進行對話,還能夠在這個過程中完成多項自然語言處理任務(wù)的大語言模型徹底打破人工智能局限于某一特定領(lǐng)域的桎梏,讓人工智能摘下了“人工智障”的標簽,為通用人工智能帶來了曙光。而今天,Kimi揭開AI大模型在長文本領(lǐng)域的高速發(fā)展序幕,強大的長文本處理能力必將使AI在知識獲取、專業(yè)文檔分析以及語義理解等更加復雜的任務(wù)上產(chǎn)生巨大的實用價值,拓展AI應(yīng)用前景。
編輯/劉曉茹