前言#
2024 年是大型語言模型(LLM)進化與應用的一個關鍵轉折點。OpenRouter 通過分析其平台上超過 100 萬億(100 Trillion)Token 的真實交互數據,發佈了《State of AI》報告。這份報告不僅僅是橫向的評測,更是對開發者與終端用戶「在真實世界中如何使用 AI」的深度洞察。
關鍵發現摘要#
- 推理模型(Reasoning Models)的崛起:自 2024 年 12 月 o1 正式發佈以來,AI 正從單次預測轉向多步審核推理。
- 開源格局重塑:開源權重模型(OSS)已佔據總使用量的 1/3,其中中國大陸模型(DeepSeek、Qwen)表現亮眼。
- 智能體推理(Agentic Inference):AI 不再僅是對話框,而是作為「智能體」執行任務、調用工具,Agent 模式已成為生產環境的默認設置。
- Cinderella 效應:早期用戶群體展現出極高的留存率與忠誠度。
第一章:從預測到推理——o1 引發的技術拐點#
在 2024 年底之前,SOTA 模型大多是單次、自回歸預測器。o1(Strawberry)的出現打破了這一限制:
- 內部運算:推理模型通過擴展推理時間的計算量(Internal Multi-step Deliberation),在生成結果前進行潛在規劃與反覆迭代。
- 能力躍遷:這使得模型在數學推理、邏輯一致性及多步決策中展現出系統性的提升。
- 範式轉換:推理不再僅僅是被「描述」出來的過程,而是架構層面的核心邏輯。
第二章:開源 vs 閉源——多元共存的新常態#
報告指出,開源與閉源模型目前已達到約 30% vs 70% 的動態平衡:
- OSS 的穩定增長:開源模型在成本效率、透明度與自定義方面優勢明顯,已成為多模型棧(Multi-model stack)的重要組成部分。
- 中國大陸模型的強勢崛起:DeepSeek V3、Qwen 等模型的密集發佈,使得中國大陸模型在某些週的使用份額一度接近 30%。平均週份額約 13.0%,顯示出極強的技術競爭力與市場適配速度。
第三章:智能體推理(Agentic Inference)的興起#
AI 使用正在從「單次文本補完」轉向「多步工具調用」:
- Reasoning-intensive 內容:推理密集型任務已佔到所有使用的近一半。
- 工具調用(Tool-calling):開發者越來越多地將模型作為自動化系統中的核心組件。
- 交互形態變遷:數據顯示提示詞(Prompt)與完成詞(Completion)的形狀正在改變,序列更長、交互更複雜。報告大膽預測:智能體推理的規模可能已經或即將超過人類推理量。
第四章:用戶行為與地理分析#
1. 意想不到的熱門類別#
- 創意角色扮演(Creative Roleplay):出人意料地領先於許多假設會佔主導的生產力任務。
- 編碼輔助(Coding Assistance):仍然是 AI 高價值應用的核心。
- 分類分佈:用戶使用 AI 展示出極大的多樣性,而非單一的「助手」功能。
2. Cinderella “Glass Slipper” 留存效應#
研究發現存在一群「基礎用戶(Foundational Cohorts)」,他們從早期就開始使用並保持極長期的參與度。這種「灰姑娘的水晶鞋」效應說明 AI 對特定群體產生了不可替代的深度粘性。
3. 地理趨勢#
- 全球 LLM 使用展現出強烈的地域差異。
- 亞洲地區的份額持續擴張,反映出全球計算資源與需求的去中心化。
結論與展望#
o1 的出現並沒有結束競爭,反而拓寬了設計空間。AI 的發展正從「追求排行榜分數(Leaderboard Deltas)」轉向「追求真實任務完成度(Real Task Completion)」。
- 系統思維取代單體模型:未來將更專注於運營卓越性與跨模型編排。
- 全球資源化:LLM 已成為真正的全球計算資源,多極化趨勢明顯。
[!IMPORTANT] 報告原文地址: OpenRouter State of AI PDF 下載: State-of-AI.pdf

