前言#
2024 年是大型语言模型(LLM)进化与应用的一个关键转折点。OpenRouter 通过分析其平台上超过 100 万亿(100 Trillion)Token 的真实交互数据,发布了《State of AI》报告。这份报告不仅仅是横向的评测,更是对开发者与终端用户“在真实世界中如何使用 AI”的深度洞察。
关键发现摘要#
- 推理模型(Reasoning Models)的崛起:自 2024 年 12 月 o1 正式发布以来,AI 正从单次预测转向多步审核推理。
- 开源格局重塑:开源权重模型(OSS)已占据总使用量的 1/3,其中中国大陆模型(DeepSeek、Qwen)表现亮眼。
- 智能体推理(Agentic Inference):AI 不再仅是对话框,而是作为“智能体”执行任务、调用工具,Agent 模式已成为生产环境的默认设置。
- Cinderella 效应:早期用户群体展现出极高的留存率与忠诚度。
第一章:从预测到推理——o1 引发的技术拐点#
在 2024 年底之前,SOTA 模型大多是单次、自回归预测器。o1(Strawberry)的出现打破了这一限制:
- 内部运算:推理模型通过扩展推理时间的计算量(Internal Multi-step Deliberation),在生成结果前进行潜在规划与反复迭代。
- 能力跃迁:这使得模型在数学推理、逻辑一致性及多步决策中展现出系统性的提升。
- 范式转换:推理不再仅仅是被“描述”出来的过程,而是架构层面的核心逻辑。
第二章:开源 vs 闭源——多元共存的新常态#
报告指出,开源与闭源模型目前已达到约 30% vs 70% 的动态平衡:
- OSS 的稳定增长:开源模型在成本效率、透明度与自定义方面优势明显,已成为多模型栈(Multi-model stack)的重要组成部分。
- 中国大陆模型的强势崛起:DeepSeek V3、Qwen 等模型的密集发布,使得中国大陆模型在某些周的使用份额一度接近 30%。平均周份额约 13.0%,显示出极强的技术竞争力与市场适配速度。
第三章:智能体推理(Agentic Inference)的兴起#
AI 使用正在从“单次文本补完”转向“多步工具调用”:
- Reasoning-intensive 内容:推理密集型任务已占到所有使用的近一半。
- 工具调用(Tool-calling):开发者越来越多地将模型作为自动化系统中的核心组件。
- 交互形态变迁:数据内容(Prompt)与完成词(Completion)的形状正在改变,序列更长、交互更复杂。报告大胆预测:智能体推理的规模可能已经或即将超过人类推理量。
第四章:用户行为与地理分析#
1. 意想不到的热门类别#
- 创意角色扮演(Creative Roleplay):出人意料地领先于许多假设会占据主导的生产力任务。
- 编码辅助(Coding Assistance):仍然是 AI 高价值应用的核心。
- 分类分布:用户使用 AI 展示出极大的多样性,而非单一的“助手”功能。
2. Cinderella “Glass Slipper” 留存效应#
研究发现存在一群“基础用户(Foundational Cohorts)”,他们从早期就开始使用并保持极长期的参与度。这种“灰姑娘的水晶鞋”效应说明 AI 对特定群体产生了不可替代的深度粘性。
3. 地理趋势#
- 全球 LLM 使用展现出强烈的地域差异。
- 亚洲地区的份额持续扩张,反映出全球计算资源与需求的去中心化。
结论与展望#
o1 的出现并没有结束竞争,反而拓宽了设计空间。AI 的发展正从“追求排行榜分数(Leaderboard Deltas)”转向“追求真实任务完成度(Real Task Completion)”。
- 系统思维取代单体模型:未来将更专注于运营卓越性与跨模型编排。
- 全球资源化:LLM 已成为真正的全球计算资源,多极化趋势明显。
[!IMPORTANT] 报告原文地址: OpenRouter State of AI PDF 下载: State-of-AI.pdf

