91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

斯坦福 423 頁 AI 報告出爐!中美差距僅 2.7%,清華 DeepSeek 沖進全球前十

新智元 2026/4/14 11:37:45 責(zé)編:遠洋

今天,斯坦福 HAI 重磅發(fā)布「2026 年 AI 指數(shù)報告」!這份長達 423 頁的年度報告,全面揭示了全球 AI 產(chǎn)業(yè)的最新權(quán)力版圖。

它給出了一條核心結(jié)論:AI 的本事漲得飛快;但人類衡量和管好它的能力,卻沒怎么跟上步伐。

其中,最震撼的結(jié)論是 —— 中美 AI 模型性能差距已基本消失,雙方在巔峰對決中頻繁易主,目前 Anthropic 領(lǐng)先優(yōu)勢僅剩 2.7%。

美國在 AI 上砸的錢比誰都多,但招攬頂尖人才卻越來越吃力了。

報告還指出,AI 的進化不僅沒有遭遇所謂的「瓶頸」,反而正以史無前例的速度狂飆。過去一年,全球超 90% 的頂尖模型,在博士級科學(xué)問題、多模態(tài)推理、競賽數(shù)學(xué)上的表現(xiàn),追平甚至超越了人類。

特別是在代碼能力上,SWE-bench 的成績在一年內(nèi),從 60% 飆升至近 100%。

然而,AI 的「偏科」現(xiàn)象極其嚴重,呈現(xiàn)出一種畸形的現(xiàn)狀:LLM 可以拿下 IMO 金牌,卻讀不對模擬時鐘,正確率僅為 50.1%。與此同時,AI 搶飯碗這事兒已經(jīng)從預(yù)測變成了現(xiàn)實,而且最先遭殃的就是當(dāng)代年輕「打工人」。

下面直接上干貨,「2026 年 AI 指數(shù)報告」最值得關(guān)注的 12 個硬核趨勢。

其他亮點速覽:

  • 全球 AI 算力 3 年漲 30 倍,英偉達獨占 60%,幾乎所有芯片都出自一家臺積電

  • 2025 年全球企業(yè) AI 投資 5817 億美元,同比翻倍,美國一國吃下近一半

  • 進入美國的 AI 研究人員 7 年跌 89%,僅過去一年就跌 80%

  • 22-25 歲軟件開發(fā)者就業(yè)自 2024 年起下滑 20%,入門崗位被精準切掉

  • 中國累計建成 85 臺公共 AI 超算,是北美的兩倍以上,全球第一

  • 中國職場 AI 使用率超 80%,遠超全球 58% 的平均

  • 最強模型越來越黑箱,95 個代表性模型里 80 個沒有公開訓(xùn)練代碼

中美貼臉,差距只剩 2.7%

斯坦福把 2023 年 5 月以來 Arena 榜單上的美國第一和中國第一,畫在了同一張坐標系里。2023 年 5 月,gpt-4-0314 拿 1320 分領(lǐng)跑,中國這邊還是 chatglm-6b,差距 300 多分。2025 年 2 月,DeepSeek-R1 第一次和美國頭部模型短暫打平。

2026 年 3 月,美國的 Claude Opus 4.6 拿到 1503 分,中國 dola-seed-2.0-preview 拿到 1464 分。如今中美 AI 之間的差距,僅有 39 分。換算成百分比,2.7%。

更值得說的是過去一年的換位頻率。從 2025 年初開始,兩國頭部模型已經(jīng)在 Arena 上你來我往換了好幾次位置。

數(shù)量上同樣接近五五開。2025 年美國發(fā)布了 50 個「顯著模型」,中國緊跟著也發(fā)布了 30 個頂尖大模型。

第一梯隊里 OpenAI、谷歌、阿里、Anthropic、xAI 同臺站位,全球 TOP 5 五五分賬。再往下看到 TOP 10,中國機構(gòu)和企業(yè)占了四席,阿里、DeepSeek、清華、字節(jié)。

開源生態(tài)這一年的重心也明顯東移。DeepSeek、Qwen、GLM、MiniMax、Kimi 一路把開源權(quán)重的能力曲線往前推。再算上論文發(fā)表量、被引數(shù)、專利產(chǎn)出量、工業(yè)機器人裝機量,中國統(tǒng)統(tǒng)全球第一。

價格層面是另一條戰(zhàn)線。海外開發(fā)者在 X 上算過一筆賬,Seed 2.0 Pro 的輸出價格大約只有 Claude Opus 4.6 的十分之一。性能貼臉,價格只要十分之一。這件事的連鎖反應(yīng)才剛剛開始。

90% 前沿模型出自產(chǎn)業(yè),封神速度史無前例

去年發(fā)布的 95 個最具代表性的模型里,超過九成都來自產(chǎn)業(yè)界,不是學(xué)術(shù)機構(gòu),也不是政府實驗室。學(xué)術(shù)界已經(jīng)追不上前沿了。

發(fā)布速度也在變態(tài)加速。光是 2026 年 2 月一個月,就有 Gemini 3.1 Pro、Claude Opus 4.6、GPT-5.3 Codex、Grok 4.20、Qwen 3.5、Seed 2.0 Pro、MiniMax M2.5、GLM-5 八九個旗艦?zāi)P屯氯雸?。封神周期從「年」變成了「月」?/p>

基準一年封頂,AI 沒有瓶頸

最猛的曲線是編程。SWE-bench Verified 這個真實修 Bug 的基準,一年時間從 60% 漲到接近 100%。不是漲了幾個點,是基本封頂。

Terminal-Bench 測試 Agent 處理真實終端任務(wù)的能力,從去年的 20% 漲到 77.3%。網(wǎng)絡(luò)安全 Agent 解決問題的成功率,從 15% 漲到 93%。

Gemini Deep Think 在國際數(shù)學(xué)奧林匹克拿到金牌。PhD 級科學(xué)問答(GPQA Diamond)、競賽數(shù)學(xué)(AIME)、多模態(tài)推理(MMMU)這些原本被認為「人類不可超越」的硬骨頭,全部被前沿模型啃了下來。

最能說明問題的是 Humanity's Last Exam。這是一個專門被設(shè)計來「難倒 AI、偏袒人類專家」的測試,題目由各個領(lǐng)域的頂尖專家提供。

去年 OpenAI 的 o1 拿到 8.8%,前沿模型在一年時間里把分數(shù)往上又推了 30 個百分點,目前 Claude Opus 4.6 和 Gemini 3.1 Pro 已經(jīng)雙雙過了 50%。

鋸齒前沿,能拿 IMO 金牌卻看不懂表

但同一份指數(shù)甩出了另一組數(shù)字。最強模型在「讀模擬時鐘」這個任務(wù)上的正確率,是 50.1%。

機器人在實驗室仿真環(huán)境(RLBench)里的操作成功率已經(jīng)達到 89.4%。但搬到真實家庭場景里完成洗碗、疊衣服這類家務(wù),成功率立刻掉到 12%。

實驗室和廚房之間,差了 77 個百分點。

研究者把這種現(xiàn)象命名為「鋸齒前沿」(jagged frontier)。AI 能力的分布是凹凸不平的,能拿數(shù)學(xué)奧賽金牌,卻沒法穩(wěn)定地告訴你現(xiàn)在幾點。

AI 能在數(shù)學(xué)奧賽拿金牌,但只有一半的概率能看懂模擬時鐘。AI 在加速,但加速的不是同一個方向。

另外,在智能體任務(wù)中,OSWorld 測試中,前沿 AI 實力(66.3%)正逼近人類基線。

然而,在專門評估科研邏輯的 PaperArena 測試中,最強 AI 加持的 Agent,得分僅 39%,只有博士生一半的功力。

但這種凹凸已經(jīng)不影響企業(yè)把 AI 往生產(chǎn)線上塞。AI Index 給出的另一個數(shù)字是,全球企業(yè) AI 采用率達到 88%。九成的公司已經(jīng)把 AI 接進了某個工作流。

代價同步在漲。AI 相關(guān)事故記錄從 2024 年的 233 起漲到 362 起。

錢在加速,5817 億砸進 AI

2025 年全球企業(yè) AI 投資達到 5817 億美元,同比增長 130%。其中私募投資 3447 億美元,同比增長 127.5%。

兩條曲線都幾乎翻倍。

國別上,美國一騎絕塵。2025 年美國私募 AI 投資 2859 億美元。并且一年新增 1953 家 AI 創(chuàng)業(yè)公司,也是排名第二的 10 倍以上。

錢在加速涌向美國。但美國的另一項核心資源,正在反向流動。

人在流走,進美國的 AI 研究者跌了 89%

里面有一組數(shù)字讓人愣了一下。2017 年到現(xiàn)在,進入美國的 AI 研究人員和開發(fā)者數(shù)量下降了 89%。

更關(guān)鍵的是,這個下降在加速。僅僅過去一年,下降幅度就達到 80%。

美國仍然是全球 AI 研究人員密度最高的國家,但流入的水龍頭正在擰緊。錢和人這兩條曲線開始反向。這是過去十年沒出現(xiàn)過的局面。

算力三年漲 30 倍,命門都在一家公司手里

AI 能力曲線在加速,背后那條算力曲線跑得更猛。從 2021 年到現(xiàn)在,全球 AI 算力總量漲了 30 倍。過去三年里,每年都在翻三倍以上。

撐起這條曲線的是少數(shù)幾家公司。

英偉達一家的 GPU,占據(jù)了全世界 AI 算力的 60% 以上。亞馬遜和谷歌靠自研芯片排在二三位,但加起來也遠遠追不上英偉達。

而幾乎所有這些芯片,都來自一家代工廠,臺積電。算力曲線越陡,命門就越窄。

與此同時,代價也在加大。

全球 AI 數(shù)據(jù)中心的總功率已經(jīng)達到 29.6 GW,相當(dāng)于紐約州在用電高峰時段的全部用電需求。xAI Grok 4 一次訓(xùn)練的估算碳排放是 72816 噸二氧化碳當(dāng)量,相當(dāng)于 17000 輛汽車開一整年的尾氣。

數(shù)據(jù)中心建在哪里,電從哪里來,芯片從哪里產(chǎn),這三個問題已經(jīng)變成今年所有 AI 公司 CEO 案頭最頭疼的事。

生成式 AI 三年滲透 53%,中國職場使用率破 80%

生成式 AI 在三年內(nèi)達到了 53% 的全球人口滲透率。這個速度比個人電腦快,比互聯(lián)網(wǎng)快。

但滲透速度和國別相關(guān)性極強。新加坡 61%,阿聯(lián)酋 54%,都跑在美國前面。美國在調(diào)查覆蓋國家中只排第 24 位,滲透率 28.3%。

如果把維度從消費者換成職場,反差更大。

報告里另一組數(shù)據(jù)顯示,2025 年全球 58% 的員工在工作中已經(jīng)開始經(jīng)常性使用 AI。但在中國、印度、尼日利亞、阿聯(lián)酋、沙特這 5 個國家,這個比例超過了 80%。

中國的職場 AI 滲透率,已經(jīng)比全球平均高出 20 個百分點以上。

更有意思的是消費者價值。AI Index 估算,到 2026 年初,生成式 AI 工具每年給美國消費者創(chuàng)造 1720 億美元的價值。從 2025 年到 2026 年,每個用戶的中位數(shù)價值翻了三倍。

絕大多數(shù)用戶用的還是免費版。普通人愿意為 AI 付的錢,遠低于 AI 給他們創(chuàng)造的價值。這中間的剪刀差是現(xiàn)在所有 AI 公司都在試圖彌合的東西。

入門崗位銳減,22-25 歲開發(fā)崗狂砍 20%

整份 AI Index 里最讓中文讀者沉默的,可能是關(guān)于年輕就業(yè)的部分。22 到 25 歲的軟件開發(fā)者群體,從 2024 年至今,就業(yè)人數(shù)下降了大約 20%。同期,年紀更大的同行群體反而在增長。

不止開發(fā)崗??头绕渌?AI 暴露行業(yè),也在出現(xiàn)同樣的模式。更讓人擔(dān)心的是企業(yè)問卷的結(jié)果。受訪高管普遍預(yù)期,未來的裁員幅度會比過去幾個月還要大。

這不是宏觀失業(yè)率的事,是入口崗位被精準切掉的事。第一份工作沒了,整個職業(yè)階梯就斷了一格。這件事的長期影響,現(xiàn)在沒人能算清。

AI 正在改寫科學(xué)發(fā)現(xiàn)的方式

如果說就業(yè)那一段是冷的,科學(xué)這段就是熱的。

自然科學(xué)、物理科學(xué)、生命科學(xué)領(lǐng)域的 AI 相關(guān)論文,2025 年同比增長了 26% 到 28%。

具體到應(yīng)用,今年第一次有 AI 完整跑通了端到端的天氣預(yù)報流程。從原始氣象觀測數(shù)據(jù)直接吐出溫度、風(fēng)速、濕度的最終預(yù)報,中間沒有任何傳統(tǒng)數(shù)值模型介入。

AI 從「幫你寫論文」「幫你算數(shù)字」,正在變成「自己做發(fā)現(xiàn)」。

醫(yī)院里也是一樣。2025 年大量醫(yī)院開始部署能從就診對話自動生成臨床記錄的 AI 工具。多個醫(yī)院系統(tǒng)的醫(yī)生反饋,寫病歷的時間減少了多達 83%,工作倦怠顯著下降。

但同一份指數(shù)給醫(yī)療 AI 潑了一盆冷水。一份針對 500 多個臨床 AI 研究的綜述發(fā)現(xiàn),將近一半的研究依賴考試題式的數(shù)據(jù)集,只有 5% 用了真實臨床數(shù)據(jù)。

AI 能減少醫(yī)生敲鍵盤的時間,這件事是確定的。AI 在真實病人身上的臨床價值,目前還有大量問號。

自學(xué)浪潮全球開炸,正規(guī)教育已經(jīng)掉隊

正規(guī)教育跟不上 AI 了。美國有 4/5 的高中生和大學(xué)生現(xiàn)在用 AI 完成學(xué)校作業(yè)。但只有一半的中學(xué)有 AI 使用政策,只有 6% 的老師認為這些政策寫得清楚。

學(xué)生跑在前面,老師還在原地,規(guī)則還沒出現(xiàn)。

正規(guī)教育跟不上的同時,自學(xué)浪潮在全球開炸。里面寫,學(xué) AI 工程技能增長最快的三個國家分別是阿聯(lián)酋、智利和南非。

不是美國,不是歐洲。

技能曲線的最陡峭的那一段,長在所有人都沒在看的地方。

最強模型變成最不透明的,專家和公眾撕裂

最強的模型,正在變成最不透明的模型。

Foundation Model Transparency Index 今年的平均分從去年的 58 分跌到了 40 分。AI Index 直接點名,谷歌、Anthropic、OpenAI 都已經(jīng)放棄公開最新模型的訓(xùn)練數(shù)據(jù)規(guī)模和訓(xùn)練時長。

去年發(fā)布的 95 個最具代表性的模型里,80 個沒有公開訓(xùn)練代碼。公眾的情緒也變得更復(fù)雜。

全球范圍內(nèi),認為 AI 利大于弊的比例從 52% 上升到 59%。但同期,對 AI 感到緊張的比例從 50% 上升到 52%。

兩個方向在同時增長。最分裂的是美國。只有 33% 的美國人認為 AI 會讓自己的工作變得更好,全球平均是 40%。美國人對本國政府監(jiān)管 AI 的信任度,是受訪國家里最低的,31%。

新加坡人對自己政府監(jiān)管 AI 的信任度,是 81%。

最近 Sam Altman 家被襲擊的事件之后,硅谷圈內(nèi)人「驚訝地發(fā)現(xiàn)」Instagram 評論區(qū)里的普通人對此并不同情,甚至有人覺得「應(yīng)該更激烈一點」。

他們沒意識到事情已經(jīng)糟到這個程度。

研報引用的 Pew 和 Ipsos 數(shù)據(jù),專家和公眾在 AI 影響就業(yè)、醫(yī)療、經(jīng)濟這些維度上的觀感差距,普遍超過 30 個百分點,最大的一項達到 50 個百分點。

一邊是實驗室里的曲線在飛漲,一邊是普通人心里的不安在累積。中間沒有橋。

寫在最后

423 頁的報告里有幾百張圖表,但其實只畫了一張圖。橫軸是時間,縱軸是能力。模型能力的曲線在飛,算力曲線在飛,投資曲線在飛,采用率曲線在飛。其他全都在原地踏步或者向下。

這就是 2026 年 AI Index 的全部內(nèi)容。AI 在加速。其他所有東西都在脫節(jié)。

如果你是這個行業(yè)里的人,現(xiàn)在該問的問題不是「未來會怎樣」,而是「自己站在哪一條曲線上」。

參考資料:

  • https://hai.stanford.edu/ai-index/2026-ai-index-report

  • https://hai.stanford.edu/news/inside-the-ai-index-12-takeaways-from-the-2026-report

  • https://www.nature.com/articles/d41586-026-01199-z

  • https://hai.stanford.edu/assets/files/ai_index_report_2026.pdf

本文來自微信公眾號:新智元(ID:AI_era),作者:新智元

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI,人工智能DeepSeek

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知

马关县| 宁波市| 隆尧县| 蕲春县| 安义县| 临清市| 郎溪县| 封开县| 淮安市| 沁水县| 乌海市| 平湖市| 松滋市| 航空| 汉沽区| 普兰县| 名山县| 安宁市| 乐东| 高淳县| 平罗县| 宁都县| 江孜县| 斗六市| 青浦区| 胶南市| 西乡县| 嘉义县| 台山市| 济宁市| 墨江| 丰镇市| 正宁县| 武川县| 浦江县| 察隅县| 宁安市| 宜城市| 孟村| 轮台县| 贵德县|