摘要:中國新推出的人工智能應(yīng)用程序DeepSeek以驚人的速度震撼了科技行業(yè)、市場以及美國在人工智能領(lǐng)域的優(yōu)越感。
最近DeepSeek橫空出世,給了全球科技界“億點(diǎn)點(diǎn)”震撼。短短幾日,DeepSeek應(yīng)用就超越ChatGPT,登頂蘋果美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜。應(yīng)用上線20天,日活已迅速突破2000萬。
DeepSeek出自深度求索公司。其成立于2023年,由知名量化資管巨頭幻方量化創(chuàng)立,專注研究世界領(lǐng)先的通用人工智能底層模型與技術(shù)。
2024年1月5日,DeepSeek LLM發(fā)布,這是深度求索的第一個大模型。2024年12月26日,DeepSeek正式上線全新系列模型DeepSeek-V3首個版本并同步開源。
擁有驚人的6710億參數(shù)、14.8萬億高質(zhì)量token的DeepSeek-V3,不僅在推理速度上大幅提升,更以557.6萬美元的訓(xùn)練成本和280萬個GPU小時的計(jì)算需求,成功實(shí)現(xiàn)了與現(xiàn)有頂尖模型的競爭。在目前大模型主流榜單中,DeepSeek-V3 在開源模型中位列榜首,與世界上最先進(jìn)的閉源模型不分伯仲。
而真正讓 DeepSeek在全球嶄露頭角的是,今年1月20日發(fā)布的開源大模型DeepSeek-R1。R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,比肩OpenAI o1正式版,并采用MIT許可協(xié)議,支持免費(fèi)商用、任意修改和衍生開發(fā)等。這不僅降低了企業(yè)和開發(fā)者的使用成本,還大大提高了AI技術(shù)的普及度。
此外,在商業(yè)化落地方面,DeepSeek-R1展現(xiàn)出極具競爭力的成本優(yōu)勢。其API服務(wù)采用差異化定價策略:輸入tokens每百萬收費(fèi)1元(緩存命中)或4元(緩存未命中),輸出tokens每百萬僅需16元,顯著低于OpenAI o1每百萬輸入tokens 15美元及輸出tokens 60美元的水平,極大降低了AI技術(shù)的使用門檻。
憑借高性能、低成本、開放性三大優(yōu)勢,國產(chǎn)開源大模型DeepSeek迅速破圈,吸引了海內(nèi)外巨頭紛紛接入。
1月31日,英偉達(dá)、亞馬遜和微軟三家美國科技巨頭在同一天宣布接入先進(jìn)大語言模型DeepSeek-R1。
2月,華為云、京東云、聯(lián)通云、天翼云等國內(nèi)主流云平臺也爭先上線R1大模型。目前京東云已正式上線DeepSeek-R1和DeepSeek-V3模型,支持公有云在線部署、?;焖接谢瘜?shí)例部署兩種模式,供用戶按需部署,快速調(diào)用。
在芯片領(lǐng)域,國內(nèi)GPU廠商加速與DeepSeek模型對接并完成適配。2月5日,華為官方表示,DeepSeek系列新模型正式上線昇騰社區(qū)。
DeepSeek選擇開源,為全球人工智能領(lǐng)域提供了高性能、低成本的模型范例。隨著越來越多的廠商接入,圍繞DeepSeek的產(chǎn)業(yè)生態(tài)正在形成,云平臺提供計(jì)算資源和模型部署服務(wù),芯片廠商提供算力支持,應(yīng)用廠商拓展應(yīng)用場景,實(shí)現(xiàn)相互協(xié)作相互促進(jìn)。
英國《衛(wèi)報(bào)》網(wǎng)站日前刊文指出,中國人工智能(AI)企業(yè)深度求索(DeepSeek)打破了美國對AI的話語權(quán)壟斷。BBC則報(bào)道稱,中國新推出的人工智能應(yīng)用程序DeepSeek以驚人的速度震撼了科技行業(yè)、市場以及美國在人工智能領(lǐng)域的優(yōu)越感。
目前DeepSeek正在全力加快AI智能生態(tài)的發(fā)展和豐富,加快從工具到生態(tài)的躍進(jìn)。未來,隨著技術(shù)的不斷迭代和產(chǎn)業(yè)生態(tài)的日益完善,DeepSeek有望在全球AI領(lǐng)域發(fā)揮更加重要的作用,引領(lǐng)人工智能技術(shù)的創(chuàng)新與應(yīng)用。
編輯/劉曉茹