Panda Leaderboard · 大模型榜单中心

报告数据周期:本周 2026-06-19 → 2026-06-25,上周 2026-06-12 → 2026-06-18

榜单变化总览

1.1本周榜单变化总览

榜单名称本周主要变动
OpenRouter 模型调用量Z.ai GLM 5.2 新上榜并激增 154%,小米 MiMo-V2.5 升至第二
OpenRouter 厂商调用量厂商排名整体稳定,Z.ai 内部发生 GLM 5.2 替代 GLM 5.1 的剧烈切换
OpenRouter 编程调用量Nemotron 3 Ultra 免费版与 Owl Alpha 新上榜,Claude Opus 4.7 反弹
OpenRouter 模型吞吐量Qwen3.5-35B-A3B、Nano Banana、Laguna XS.2 三位新上榜
LMArena 文本竞技场无重大变化,前十全部为持平
LMArena 代码竞技场ByteDance Seed 2.1 Pro Preview 新上榜位列第八
LMArena 图像编辑竞技场无重大变化,仅相邻位次微调
LMArena 文生图竞技场阿里 Qwen Image 2.0 Pro 新上榜,Luma UNI 1.1 Max 跌出
LMArena Agent Arena无重大变化,Claude 与 GPT 内部小幅换位
Artificial Analysis 图像编辑微软 MAI-Image-2.5 与 Flash 双双新上榜
Artificial Analysis 文生图微软 MAI-Image-2.5 新上榜即升至第二
GPQA无重大变化,所有前十模型持平
MedBench无重大变化,所有前十模型持平
OpenCompass LLM四款 High 推理档位模型新上榜
OpenCompass 多模态GPT-5.5 High、Doubao、Step、Gemma 4 等四款新上榜
LiveCodeBench GSO无重大变化,所有前十模型持平
HuggingFace GAIACustomGPT.ai v44 新上榜登顶,Cobra Agent 两款新上榜
Scale HLE无重大变化,所有前十模型持平
Epoch FrontierMath无重大变化,所有前十模型持平
SWE-bench无重大变化,所有前十模型持平

1.2本周大模型行业重要动态

时间窗口 · 2026-06-19 至 2026-06-25总追踪厂商 · 20 家确认入池并保留的核心技术进展 · 11 条(来自 6 家公司)

OpenAI

  • 2026-06-24 OpenAI 更新 GPT-5.5 Instant,提升对话质量、意图理解与复杂约束遵循能力。(来源:openai.com

Google

  • 2026-06-24 Google 将 Computer Use 内建于 Gemini 3.5 Flash,支持跨浏览器、移动端与桌面端代理操作。(来源:blog.google

Alibaba

  • 2026-06-23 阿里开源首个语言世界模型 Qwen-AgentWorld(35B-A3B/397B-A17B),覆盖 7 大领域。(来源:github.com
  • 2026-06-22 阿里发布视频生成模型 HappyHorse 1.1,在动态表现、一致性、质感与音频等维度升级。(来源:qbitai.com

ByteDance

  • 2026-06-25 字节上线豆包专业版,68 元/月起订阅,支持在授权后操作本地电脑与浏览器。(来源:qbitai.com
  • 2026-06-23 字节发布豆包 Seed 2.1 系列(Pro/Turbo/Evolving),支持 256K 上下文,API 已上线火山方舟。(来源:qbitai.com
  • 2026-06-23 字节公布 Seedance 2.5 视频模型,单段直出 30 秒并支持局部编辑,目前处于企业内测。(来源:oschina.net
  • 2026-06-23 字节发布 Seed-Audio 1.0 音频模型,单条 Prompt 同步生成多角色对白、背景音乐与音效。(来源:chooseai.net
  • 2026-06-23 字节展示 Seedream 5.0 Pro 图像模型,支持交互式精准编辑、多图层分离与多语种文字生成。(来源:oschina.net

Mistral AI

  • 2026-06-23 Mistral AI 发布 OCR 4,输出结构化文档表示,支持 170 语言、边界框与置信度,可自托管。(来源:venturebeat.com

Baidu

  • 2026-06-23 百度开源 Unlimited-OCR(3B),可单次前向传播完成长程多页文档解析,代码与权重已开放。(来源:github.com
OpenRouter 分析

2.1本周 OpenRouter 重点关注

  • Z.ai GLM 5.2 爆发式入榜:本周新上榜即冲到模型调用量第 9,环比增长 154%,带动 Z.ai 内部从 GLM 5.1 向 GLM 5.2 剧烈切换。
  • 小米 MiMo-V2.5 继续冲量:凭借低价策略升至模型调用量第 2,编程榜稳居第 1,成为本周 OpenRouter 最大赢家之一。
  • Anthropic 高端模型承压:Claude Opus 4.7 和 Sonnet 4.6 双双大跌,厂商总量环比下滑 19%,开源低价模型冲击明显。
  • Owl Alpha 与 Nemotron 3 Ultra 免费版搅动编程榜:免费/开源策略使二者新上榜,进一步压低编程场景付费意愿。

2.2模型调用量榜单分析

来源:openrouter.ai

排名说明 · 平台 token 调用量本周 Top 10数据采集周期 · 本周 2026-06-19 → 2026-06-25,上周 2026-06-12 → 2026-06-18
排名模型厂商Tokens(T)WoW排名变化P/CR/Ctop5 App 集中度IntelligenceCodingAgenticProgramming %input price(USD)output price(USD)健康度风险提示
1DeepSeek: DeepSeek V4 FlashDeepSeek4.948%持平501.108126%40563121%0.0900.254无显著风险
2Xiaomi: MiMo-V2.5Xiaomi4.4216%上升1位1750.55885%283751数据缺失0.0820.303无显著风险
3MiniMax: MiniMax M3MiniMax3.26-26%下降1位数据缺失数据缺失32%44593558%0.2271.371无显著风险
4Tencent: Hy3 previewTencent3.26-10%持平950.5924数据缺失34365644%0.0330.234无显著风险
5Owl AlphaOpenRouter3.1532%上升1位1230.000080%数据缺失数据缺失数据缺失22%0.0000.000头部应用集中风险,top5 集中度=80%
6DeepSeek: DeepSeek V4 ProDeepSeek2.09-11%上升1位772.567529%44593646%0.9412.833无显著风险
7Anthropic: Claude Opus 4.7Anthropic2.06-31%下降2位1180.05123%54744445%2.41225.000无显著风险
8Anthropic: Claude Opus 4.8Anthropic1.6622%上升1位900.056422%56744734%2.20725.000无显著风险
9Z.ai: GLM 5.2Z.ai1.50154%上升9位数据缺失数据缺失数据缺失516943数据缺失数据缺失数据缺失无显著风险
10Anthropic: Claude Sonnet 4.6Anthropic1.23-25%下降2位720.063744%36466226%1.48615.000无显著风险

本周关键模型分析:

[DeepSeek V4 Flash]:- #1 -> #1(变化 0 位)| WoW 8% |

  • 模型质量数据:| P/C=50 | R/C=1.1081 | top5 App 集中度=26% | Intelligence=40 | Coding=56 | Agentic=31 | Input Price=0.090 | Output Price=0.254
  • 本周变化分析:V4 Flash 本周稳守榜首并继续放量 8%,核心支撑来自全榜最低的输出定价之一与持续温和降价——近一个月输入价由约 0.102 降至 0.090、输出价由约 0.283 降至 0.254,性价比护城河进一步加深;同时 Coding=56 与 26% 的极低头部集中度说明需求来自广泛真实编程场景。短期内需关注 Z.ai GLM 5.2 与小米 MiMo-V2.5 等新锐的追击,以及 V3.2 跌出前十后产品线内部的替代节奏。

[Xiaomi MiMo-V2.5]:- #3 -> #2(变化 1 位)| WoW 16% |

  • 模型质量数据:| P/C=175 | R/C=0.5588 | top5 App 集中度=5% | Intelligence=28 | Coding=37 | Agentic=51 | Input Price=0.082 | Output Price=0.303
  • 本周变化分析:MiMo-V2.5 本周上升 1 位至第二,增长 16%,主要依靠全榜最低的输入定价 0.082 美元及 6 月初以来激进的促销降价——输入价在 6 月上旬一度降至约 0.012 美元后回调至 0.082,输出价则稳定在 0.28-0.30 美元区间。不过其 Intelligence=28、Coding=37 在前十中偏弱,Agentic=51 虽具竞争力,但整体属于典型的低价走量型模型;5% 的 top5 集中度显示需求结构极为健康。后续关键在于促销价能否稳住,以及性能短板是否会限制其上探空间。

[Z.ai GLM 5.2]:- 新上榜 -> #9(变化 9 位)| WoW 154% |

  • 模型质量数据:| P/C=数据缺失 | R/C=数据缺失 | top5 App 集中度=数据缺失 | Intelligence=51 | Coding=69 | Agentic=43 | Input Price=数据缺失 | Output Price=数据缺失
  • 本周变化分析:GLM 5.2 是本周最大黑马,新上榜即跃居第九,调用量暴增 154%。该模型于 6 月中旬发布,为 744B/40B MoE 架构、1M 上下文、MIT 开源权重,定位 coding-first 旗舰,公开信息显示其 SWE-bench Pro 达 62.1%、GPQA Diamond 达 80.3%,Coding=69 与 Intelligence=51 均位列前十上游。作为性能导向而非价格导向的新晋模型,它直接威胁到同处开源阵营的 DeepSeek V4 Pro 与高端闭源的 Claude Opus 系列;短期内需观察其 OpenRouter 定价落地与发布热度退去后的留存能力。

2.3厂商调用量榜单分析

来源:openrouter.ai

排名说明 · 厂商按 token 调用量数据采集周期 · 本周 2026-06-19 → 2026-06-25,上周 2026-06-12 → 2026-06-18
排名厂商排名变化最近两周上榜模型数本周总量(T)总量 WoW关键观察内部模型变动简述
1DeepSeek持平38.09-1%总量下滑跌出模型:DeepSeek: DeepSeek V3.2
2Anthropic持平35.56-19%总量下滑内部模型阵容稳定
3Xiaomi上升1位14.9011%总量稳定增长内部模型阵容稳定
4MiniMax下降1位13.51-25%总量下滑内部模型阵容稳定
5Tencent上升1位13.26-10%总量下滑内部模型阵容稳定
6Google下降1位03.23-21%总量下滑内部模型无变动
7OpenRouter上升1位13.1532%总量稳定增长内部模型阵容稳定
8OpenAI下降1位03.032%总量稳定增长内部模型无变动
9Z.ai持平12.032%总量稳定增长本周新上榜,入榜模型:Z.ai: GLM 5.2

本周关键厂商分析

[DeepSeek]:本周以 8.09T 总量继续稳居榜首,但环比小幅下滑 1%,主要由 V4 Flash 的 8% 增长被 V4 Pro 的 11% 下滑与 V3.2 跌出前十所抵消。内部格局显示用户正从旧款 V3.2 向 V4 系列迁移,但 V4 Pro 也面临 Z.ai GLM 5.2 等新锐的挤压;整体而言,DeepSeek 凭借从 Flash 到 Pro 的完整价位矩阵仍具最强韧性。

[Anthropic]:本周总量 5.56T,环比大幅下滑 19%,是头部厂商中下滑最明显的。旗下 Opus 4.7 暴跌 31%、Sonnet 4.6 下跌 25%,虽然 Opus 4.8 增长 22% 显示出代际切换迹象,但增量远不足以弥补旧款的流失。这表明高端闭源模型正面临中国开源低价模型与 NVIDIA 免费开源模型的双重挤压,高端市场的付费意愿正在被重新定价。

[Z.ai]:本周总量 2.03T,环比仅增 2%,厂商排名持平于第九,但内部发生剧烈的产品线替代。GLM 5.2 本周调用量从上周的 0.59T 暴增 154% 至 1.50T,占厂商总量比例从不足三成跃升至约四分之三;而同厂上一代主力 GLM 5.1 则从 1.06T 暴跌 78% 至 0.23T。这属于典型的新品发布驱动型内部替代,Z.ai 整体规模虽无显著扩张,但已成功将流量从 GLM 5.1 迁移到性能更强的 GLM 5.2。

2.4编程调用量榜单

来源:openrouter.ai

排名说明 · 编程任务 token 累计 · 本周 vs 上周 Top 9数据采集周期 · 本周 2026-06-19 → 2026-06-25,上周 2026-06-12 → 2026-06-18
本周排名本周模型所属公司本周总量(B)排名变化上周排名上周模型所属公司上周总量(B)
1mimo-v2.5Xiaomi4170持平1mimo-v2.5Xiaomi2307
2MiniMax-m3MiniMax2497持平2MiniMax-m3MiniMax1559
3hy3-previewTencent1832上升2位3DeepSeek-v4-flashDeepSeek885
4claude-4.7-opusAnthropic1057上升3位4DeepSeek-v4-proDeepSeek785
5nemotron-3-ultra-550b-a55b:freeNVIDIA981新上榜5hy3-previewTencent772
6DeepSeek-v4-flashDeepSeek908下降3位6step-3.7-flashStepFun543
7DeepSeek-v4-proDeepSeek908下降3位7claude-4.7-opusAnthropic530
8owl-alphaOpenRouter555新上榜8mimo-v2.5-proXiaomi467
9step-3.7-flashStepFun499下降3位9claude-4.8-opusAnthropic422

本周榜单主要变化

  • NVIDIA Nemotron 3 Ultra 免费版与 OpenRouter Owl Alpha 双双新上榜,挤出了上周的 mimo-v2.5-pro 与 claude-4.8-opus,编程榜单迎来两位免费开源新面孔。
  • Claude Opus 4.7 编程调用量近乎翻倍,上升 3 位至第四;DeepSeek V4 Flash、V4 Pro 与 Step-3.7-Flash 则同步下滑 3 位,中腰部编程流量向免费与高端模型两端迁移。

可能原因

  • NVIDIA Nemotron 3 Ultra 于 6 月 4 日发布,为 550B/55B MoE 开源模型,主打长程 Agentic 编程并提供免费版本,新品发布与免费策略共同推动其快速冲入编程榜。
  • Claude Opus 4.7 凭借 Coding=74 的顶尖编程能力与在最难软件工程任务上的口碑,重新获得专业开发者青睐,带动编程调用量大幅反弹。
  • 免费模型的涌入分流了价格敏感型编程用户,使付费定位的 DeepSeek V4 系列与 Step-3.7-Flash 排名同步承压。

2.5模型吞吐量榜单

来源:openrouter.ai

排名说明 · 吞吐量指标 · 本周 vs 上周 Top 9数据采集周期 · 本周 2026-06-19 → 2026-06-25,上周 2026-06-12 → 2026-06-18
本周排名本周模型所属公司本周吞吐速度(toks/s)排名变化上周排名上周模型所属公司上周吞吐速度(toks/s)
1gpt-oss-safeguard-20bOpenAI540上升1位1gpt-oss-120bOpenAI564
2gpt-oss-120bOpenAI535下降1位2gpt-oss-safeguard-20bOpenAI529
3Mercury 2Inception490上升1位3GLM 4.7Z.ai511
4GLM 4.7Z.ai390下降1位4Mercury 2Inception434
5Qwen3 32BQwen366持平5Qwen3 32BQwen390
6gpt-oss-20bOpenAI313持平6gpt-oss-20bOpenAI312
7Qwen3.5-35B-A3BQwen212新上榜7MiniMax M2.5MiniMax214
8Nano Banana (Gemini 2.5 Flash Image)Google183新上榜8MiniMax M2.7MiniMax181
9Laguna XS.2Poolside166新上榜9Nemotron 3 Nano Omni (free)NVIDIA166

本周榜单主要变化

  • 榜单尾部出现三位新上榜者:Qwen3.5-35B-A3B、Google Nano Banana 与 Poolside Laguna XS.2,替代了上周的 MiniMax M2.5、MiniMax M2.7 与 NVIDIA Nemotron 3 Nano Omni。
  • 榜单头部格局保持稳定,OpenAI gpt-oss 系列继续占据前二,仅发生 gpt-oss-safeguard-20b 与 gpt-oss-120b 的榜首互换等相邻位次微调。
其他模型性能榜单

1Text Arena

来源:lmarena.ai

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1claude-fable-5Anthropic1508持平1claude-fable-5Anthropic1508
2claude-opus-4-6-thinkingAnthropic1503持平2claude-opus-4-6-thinkingAnthropic1504
3claude-opus-4-7-thinkingAnthropic1502持平3claude-opus-4-7-thinkingAnthropic1502
4claude-opus-4-6Anthropic1499持平4claude-opus-4-6Anthropic1499
5claude-opus-4-7Anthropic1494持平5claude-opus-4-7Anthropic1493
6muse-sparkMeta1487持平6muse-sparkMeta1487
7gemini-3.1-pro-previewGoogle1486持平7gemini-3.1-pro-previewGoogle1486
8gemini-3-proGoogle1486持平8gemini-3-proGoogle1486
9claude-opus-4-8-thinkingAnthropic1484持平9claude-opus-4-8-thinkingAnthropic1483
10gpt-5.5-highOpenAI1481持平10gpt-5.5-highOpenAI1481

本周榜单主要变化

  • 无重大变化

2Code Arena

来源:arena.ai

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1claude-fable-5Anthropic1654持平1claude-fable-5Anthropic1654
2glm-5.2 (max)Z.ai1593持平2glm-5.2 (max)Z.ai1595
3claude-opus-4-8-thinkingAnthropic1565上升1位3claude-opus-4-7-thinkingAnthropic1566
4claude-opus-4-7-thinkingAnthropic1563下降1位4claude-opus-4-8-thinkingAnthropic1561
5claude-opus-4-7Anthropic1557持平5claude-opus-4-7Anthropic1556
6claude-opus-4-8Anthropic1542上升1位6claude-opus-4-6-thinkingAnthropic1541
7claude-opus-4-6-thinkingAnthropic1542下降1位7claude-opus-4-8Anthropic1541
8seed-2.1-pro-previewByteDance1539新上榜8claude-opus-4-6Anthropic1538
9claude-opus-4-6Anthropic1538下降1位9glm-5.1Z.ai1531
10qwen3.7-maxAlibaba1530持平10qwen3.7-maxAlibaba1531

本周榜单主要变化

  • ByteDance Seed 2.1 Pro Preview 新上榜位列第八,代码竞技场迎来新玩家。
  • Claude 模型内部小幅换位,整体头部仍由 Anthropic 主导。

可能原因

  • Seed 2.1 Pro 为 ByteDance 面向前端代码场景的新模型,预览版已在 React 与设计类目进入前七。
  • Anthropic 各版本 Claude 在代码竞技场占据绝对多数席位,内部位次微调反映用户评价波动。

3Agent Arena

来源:lmarena.ai

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1Claude Fable 5 (High)Anthropic14.0%持平1Claude Fable 5 (High)Anthropic14.2%
2Claude Opus 4.8 (Thinking)Anthropic8.9%持平2Claude Opus 4.8 (Thinking)Anthropic9.0%
3GPT 5.5 (xHigh)OpenAI8.0%持平3GPT 5.5 (xHigh)OpenAI8.3%
4Claude Opus 4.7 (Thinking)Anthropic8.0%上升1位4Claude Opus 4.7Anthropic8.1%
5GPT 5.5 (High)OpenAI8.0%上升1位5Claude Opus 4.7 (Thinking)Anthropic8.1%
6Claude Opus 4.7Anthropic7.8%下降2位6GPT 5.5 (High)OpenAI7.8%
7Claude Opus 4.6Anthropic7.0%上升1位7GPT 5.5OpenAI6.7%
8GPT 5.5OpenAI6.8%下降1位8Claude Opus 4.6Anthropic6.7%
9GPT 5.4 (High)OpenAI6.6%持平9GPT 5.4 (High)OpenAI6.5%
10GLM 5.2 (Max)Z.ai4.4%持平10GLM 5.2 (Max)Z.ai4.4%

本周榜单主要变化

  • 无重大变化

4LiveCodeBench

来源:livecodebench.github.io

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1Claude Opus 4.7Anthropic44.1持平1Claude Opus 4.7Anthropic44.1
2Claude Opus 4.6Anthropic41.2持平2Claude Opus 4.6Anthropic41.2
3GPT 5.5OpenAI40.2持平3GPT 5.5OpenAI40.2
4Claude Opus 4.6Anthropic33.3持平4Claude Opus 4.6Anthropic33.3
5GPT 5.4OpenAI31.4持平5GPT 5.4OpenAI31.4
6GPT 5.2OpenAI27.4持平6GPT 5.2OpenAI27.4
7Claude Opus 4.5Anthropic26.5持平7Claude Opus 4.5Anthropic26.5
8GPT 5.4OpenAI25.5持平8GPT 5.4OpenAI25.5
9Gemini 3.1 ProGoogle22.6持平9Gemini 3.1 ProGoogle22.6
10Gemini 3 ProGoogle18.6持平10Gemini 3 ProGoogle18.6

本周榜单主要变化

  • 无重大变化

5SWE-bench

来源:swebench.com

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1Claude 4.5 Opus (high reasoning)76.8%持平1Claude 4.5 Opus (high reasoning)76.8%
2Gemini 3 Flash (high reasoning)75.8%持平2Gemini 3 Flash (high reasoning)75.8%
3MiniMax M2.5 (high reasoning)75.8%持平3MiniMax M2.5 (high reasoning)75.8%
4Claude Opus 4.675.6%持平4Claude Opus 4.675.6%
5GPT-5-2 Codex72.8%持平5GPT-5-2 Codex72.8%
6GLM-5 (high reasoning)72.8%持平6GLM-5 (high reasoning)72.8%
7GPT-5-2 (high reasoning)72.8%持平7GPT-5-2 (high reasoning)72.8%
8GPT 5.2 Codex72.8%持平8GPT 5.2 Codex72.8%
9Claude 4.5 Sonnet (high reasoning)71.4%持平9Claude 4.5 Sonnet (high reasoning)71.4%
10Kimi K2.5 (high reasoning)70.8%持平10Kimi K2.5 (high reasoning)70.8%

本周榜单主要变化

  • 无重大变化

6Image Edit Arena

来源:lmarena.ai

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1gpt-image-2 (medium)OpenAI1465持平1gpt-image-2 (medium)OpenAI1465
2mai-image-2.5Microsoft1402持平2mai-image-2.5Microsoft1401
3grok-imagine-image-qualityxAI1389上升1位3chatgpt-image-latest-high-fidelityOpenAI1390
4chatgpt-image-latest-high-fidelityOpenAI1389下降1位4grok-imagine-image-qualityxAI1388
5gemini-3-pro-image-preview-2k (nano-banana-pro)Google1389持平5gemini-3-pro-image-preview-2k (nano-banana-pro)Google1388
6gemini-3.1-flash-image-preview (nano-banana-2) [web-search]Google1387持平6gemini-3.1-flash-image-preview (nano-banana-2) [web-search]Google1387
7gemini-3-pro-image-preview (nano-banana-pro)Google1385持平7gemini-3-pro-image-preview (nano-banana-pro)Google1385
8gpt-image-1.5-high-fidelityOpenAI1373持平8gpt-image-1.5-high-fidelityOpenAI1373
9reve-2.0Reve1359持平9reve-2.0Reve1356
10grok-imagine-image-qualityxAI1358持平10grok-imagine-image-qualityxAI1355

本周榜单主要变化

  • 无重大变化

7Text-to-Image Arena

来源:lmarena.ai

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1gpt-image-2 (medium)OpenAI1386持平1gpt-image-2 (medium)OpenAI1385
2reve-2.0Reve1275持平2reve-2.0Reve1273
3gemini-3.1-flash-image-preview (nano-banana-2) [web-search]Google1269持平3gemini-3.1-flash-image-preview (nano-banana-2) [web-search]Google1269
4mai-image-2.5Microsoft1256持平4mai-image-2.5Microsoft1253
5gemini-3-pro-image-preview-2k (nano-banana-pro)Google1245持平5gemini-3-pro-image-preview-2k (nano-banana-pro)Google1245
6gpt-image-1.5-high-fidelityOpenAI1241持平6gpt-image-1.5-high-fidelityOpenAI1241
7gemini-3-pro-image-preview (nano-banana-pro)Google1232上升1位7grok-imagine-image-qualityxAI1234
8grok-imagine-image-qualityxAI1232下降1位8gemini-3-pro-image-preview (nano-banana-pro)Google1232
9ideogram-4.0-qualityIdeogram1209持平9ideogram-4.0-qualityIdeogram1204
10qwen-image-2.0-pro-2026-06-22Alibaba1193新上榜10uni-1.1-maxLuma1191

本周榜单主要变化

  • 阿里 Qwen Image 2.0 Pro 新上榜位列第十,Luma UNI 1.1 Max 跌出榜单。
  • 头部 OpenAI 与 Google 模型保持稳定,仅第七、八名发生相邻互换。

可能原因

  • Qwen Image 2.0 Pro 为阿里统一生图与编辑的 7B 模型,支持原生 2K 与专业级文字渲染。
  • 文生图榜单头部格局固化,新模型主要依靠文字渲染和编辑统一能力切入前十。

8AA Image Editing

来源:artificialanalysis.ai

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1GPT Image 1.5 (high)OpenAI1261持平1GPT Image 1.5 (high)OpenAI1263
2GPT Image 2 (high)OpenAI1260持平2GPT Image 2 (high)OpenAI1259
3MAI-Image-2.5Microsoft1251新上榜3Nano Banana Pro (Gemini 3 Pro Image)Google1249
4Nano Banana 2 (Gemini 3.1 Flash Image Preview)Google1248持平4Nano Banana 2 (Gemini 3.1 Flash Image Preview)Google1247
5Nano Banana Pro (Gemini 3 Pro Image)Google1247下降2位5MAI-Image-2.5 (Foundry)Microsoft1246
6MAI-Image-2.5-FlashMicrosoft1239新上榜6grok-imagine-image-qualityxAI1236
7grok-imagine-image-qualityxAI1235下降1位7MAI-Image-2.5-Flash (Foundry)Microsoft1234
8HunyuanImage 3.0 Instruct (Fal)Open WeightsTencent1229持平8HunyuanImage 3.0 Instruct (Fal)Open WeightsTencent1230
9Luma UNI 1 MaxLuma1225持平9Luma UNI 1 MaxLuma1224
10Kling Image 3.0 OmniKlingAI1220持平10Kling Image 3.0 OmniKlingAI1219

本周榜单主要变化

  • 微软 MAI-Image-2.5 与 MAI-Image-2.5-Flash 双双新上榜,分列第三与第六。
  • Nano Banana Pro 下降 2 位,Grok 图像质量模型下降 1 位。

可能原因

  • MAI-Image-2.5 于 5 月底发布,主打图像编辑与文本渲染,Arena 图像编辑榜排名第二。
  • 微软 MAI 系列快速迭代,2.5 版本在文字渲染和局部编辑上有明显提升。

9AA Text-to-Image

来源:artificialanalysis.ai

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1GPT Image 2 (high)OpenAI1339持平1GPT Image 2 (high)OpenAI1339
2MAI-Image-2.5Microsoft1275新上榜2GPT Image 1.5 (high)OpenAI1266
3HiDream-O1-Image-1.5HiDream1264持平3HiDream-O1-Image-1.5HiDream1263
4GPT Image 1.5 (high)OpenAI1264下降2位4Nano Banana 2 (Gemini 3.1 Flash Image Preview)Google1255
5Nano Banana 2 (Gemini 3.1 Flash Image Preview)Google1254下降1位5Cosmos3-Super-Text2Image (agentic)Open WeightsNVIDIA1233
6Cosmos3-Super-Text2Image (agentic)Open WeightsNVIDIA1227下降1位6Nano Banana Pro (Gemini 3 Pro Image)Google1219
7Nano Banana Pro (Gemini 3 Pro Image)Google1219下降1位7MAI-Image-2.5-Flash (Foundry)Microsoft1216
8MAI-Image-2.5-FlashMicrosoft1213新上榜8Krea 2 MediumKrea1209
9Krea 2 MediumKrea1206下降1位9Recraft V4.1 Utility ProRecraft1204
10Recraft V4.1 Utility ProRecraft1206下降1位10MAI-Image-2.5 (Foundry)Microsoft1202

本周榜单主要变化

  • 微软 MAI-Image-2.5 新上榜即空降第二,MAI-Image-2.5-Flash 也进入第八。
  • GPT Image 1.5 下降 2 位,Google 与 NVIDIA 图像模型集体下滑 1 位。

可能原因

  • MAI-Image-2.5 在 Arena 文生图榜排名第三,较 MAI-Image-2 提升约 75 分,文本渲染提升 107 分。
  • 微软凭借编辑能力与生图质量的统一,直接冲击 OpenAI 与 Google 的头部地位。

10前沿数学 (FrontierMath)

来源:epoch.ai

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1Claude Fable 5 (max)Anthropic87.8%持平1Claude Fable 5 (max)Anthropic87.8%
2GPT-5.5 Pro (xhigh)OpenAI78.0%持平2GPT-5.5 Pro (xhigh)OpenAI78.0%
3AI co-mathematicianGoogle DeepMind75.6%持平3AI co-mathematicianGoogle DeepMind75.6%
4GPT-5.5 (xhigh)OpenAI72.5%持平4GPT-5.5 (xhigh)OpenAI72.5%
5GPT-5.4 Pro (xhigh)OpenAI58.5%持平5GPT-5.4 Pro (xhigh)OpenAI58.5%
6Claude Opus 4.8 (max)Anthropic56.1%持平6Claude Opus 4.8 (max)Anthropic56.1%
7GPT-5.4 (xhigh)OpenAI49.0%持平7GPT-5.4 (xhigh)OpenAI49.0%
8GPT-5.2 Pro (xhigh)OpenAI46.0%持平8GPT-5.2 Pro (xhigh)OpenAI46.0%
9Qwen3.7-MaxAlibaba34.1%持平9Qwen3.7-MaxAlibaba34.1%
10Claude Opus 4.7 (max)Anthropic31.7%持平10Claude Opus 4.7 (max)Anthropic31.7%

本周榜单主要变化

  • 无重大变化

11HLE

来源:scale.com

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1gemini-3.1-pro-preview (thinking high)46.4持平1gemini-3.1-pro-preview (thinking high)46.4
2gpt-5.4-pro-2026-03-0544.3持平2gpt-5.4-pro-2026-03-0544.3
3Muse Spark40.6持平3Muse Spark40.6
4gemini-3-pro-preview37.5持平4gemini-3-pro-preview37.5
5gpt-5.4-2026-03-05 (xhigh thinking)36.2持平5gpt-5.4-2026-03-05 (xhigh thinking)36.2
6claude-opus-4-736.2持平6claude-opus-4-736.2
7claude-opus-4-6-thinking-max34.4持平7claude-opus-4-6-thinking-max34.4
8gpt-5-pro-2025-10-0631.6持平8gpt-5-pro-2025-10-0631.6
9gpt-5.2-2025-12-1127.8持平9gpt-5.2-2025-12-1127.8
10gpt-5-2025-08-0725.3持平10gpt-5-2025-08-0725.3

本周榜单主要变化

  • 无重大变化

12Agent (GAIA)

来源:huggingface.co

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1CustomGPT.ai Research Lab v44CustomGPT.ai93.4新上榜1Co-Sight Pro v1.0.1ZTE-AICloud93.0
2Co-Sight Pro v1.0.1ZTE-AICloud93.0下降1位2OPS-Agentic-SearchAlibaba Cloud92.4
3OPS-Agentic-SearchAlibaba Cloud92.4下降1位3CustomGPT.ai Research Lab v41CustomGPT.ai92.0
4CustomGPT.ai Research Lab V42CustomGPT.ai92.0上升3位4Co-Sight Pro v1.0.0ZTE-AICloud92.0
5CustomGPT.ai Research Lab v43CustomGPT.ai92.0持平5CustomGPT.ai Research Lab v43CustomGPT.ai92.0
6AuraAiAI92.0持平6AuraAiAI92.0
7Cobra Agent OrchDalpha Inc92.0新上榜7CustomGPT.ai Research Lab V42CustomGPT.ai92.0
8Co-Sight Pro v1.0.0ZTE-AICloud92.0下降4位8openJiuwen-deepagentOpenJiuwen91.7
9CustomGPT.ai Research Lab v41CustomGPT.ai92.0下降6位9CustomGPT.ai Research Lab v39CustomGPT.ai91.7
10Cobra Agent_v3.1Dalpha Inc91.7新上榜10CustomGPT.ai Research Lab v35CustomGPT.ai91.4

本周榜单主要变化

  • CustomGPT.ai Research Lab v44 新上榜即登顶,V42 上升 3 位,v41 暴跌 6 位。
  • Cobra Agent 两款版本新上榜,ZTE Co-Sight Pro v1.0.0 下降 4 位。

可能原因

  • CustomGPT.ai 持续迭代其 Research Lab 代理版本,v44 在 GAIA 通用助理任务上表现最优。
  • 代理榜单高度依赖脚手架与工具链,版本迭代导致排名剧烈波动。

13GPQA

来源:llm-stats.com

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1Claude Mythos PreviewAnthropic94.6持平1Claude Mythos PreviewAnthropic94.6
2Gemini 3.1 ProGoogle94.3持平2Gemini 3.1 ProGoogle94.3
3Claude Opus 4.7Anthropic94.2持平3Claude Opus 4.7Anthropic94.2
4Claude Opus 4.8Anthropic93.6持平4Claude Opus 4.8Anthropic93.6
5GPT-5.5OpenAI93.6持平5GPT-5.5OpenAI93.6
6GPT-5.2 ProOpenAI93.2持平6GPT-5.2 ProOpenAI93.2
7GPT-5.4OpenAI92.8持平7GPT-5.4OpenAI92.8
8Qwen3.7 MaxAlibaba Cloud / Qwen Team92.4持平8Qwen3.7 MaxAlibaba Cloud / Qwen Team92.4
9GPT-5.2OpenAI92.4持平9GPT-5.2OpenAI92.4
10Gemini 3 ProGoogle91.9持平10Gemini 3 ProGoogle91.9

本周榜单主要变化

  • 无重大变化

14国内 - 大语言模型 (OpenCompass)

来源:rank.opencompass.org.cn

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1GPT-5.4-2026-03-05 (High)OpenAI67.3新上榜1GPT-5.4-2026-03-05 (high)OpenAI67.3
2DeepSeek-V4-ProDeepSeek65.1持平2DeepSeek-V4-ProDeepSeek65.1
3Claude Opus 4.7 (High)Anthropic64.0新上榜3Claude Opus 4.7 (high)Anthropic64.0
4Doubao-Seed-2-0-Pro-260215 (High)ByteDance63.5新上榜4Doubao-Seed-2-0-Pro-260215 (high)ByteDance63.5
5Kimi-K2.6Moonshot63.4持平5Kimi-K2.6Moonshot63.4
6Gemini-3.1-Pro-PreviewGoogle63.2持平6Gemini-3.1-Pro-PreviewGoogle63.2
7Qwen3.6-Max-PreviewAlibaba60.8持平7Qwen3.6-Max-PreviewAlibaba60.8
8DeepSeek-V4-FlashDeepSeek60.4持平8DeepSeek-V4-FlashDeepSeek60.4
9Doubao-Seed-2-0-Lite-260215 (High)ByteDance60.4新上榜9Doubao-Seed-2-0-Lite-260215 (high)ByteDance60.4
10GLM-5.1Z.ai59.0持平10GLM-5.1Z.ai59.0

本周榜单主要变化

  • 四款带 High 推理档位的模型新上榜,包括 GPT-5.4、Claude Opus 4.7 与两款 Doubao Seed 2.0。
  • 榜单头部被推理模式变体占据,同一模型不同档位开始分列。

可能原因

  • OpenCompass 榜单可能新增了 High/xHigh 推理模式独立条目,导致同一模型不同档位分列。
  • Doubao Seed 2.0 Pro/Lite 推理版本进入前十,显示字节模型在综合评测中竞争力提升。

15国内 - 多模态 (OpenCompass)

来源:rank.opencompass.org.cn

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1Qwen3.7-PlusAlibaba73.0持平1Qwen3.7-PlusAlibaba73.0
2Gemini-3.1-Pro-PreviewGoogle72.6持平2Gemini-3.1-Pro-PreviewGoogle72.6
3Qwen3.5-397B-A17BAlibaba72.3持平3Qwen3.5-397B-A17BAlibaba72.3
4GPT-5.5 (High)OpenAI71.1新上榜4GPT-5.5 (high)OpenAI71.1
5Kimi-K2.6Moonshot AI70.6持平5Kimi-K2.6Moonshot AI70.6
6Doubao-Seed-2.0-Pro (High)ByteDance69.4新上榜6Doubao-Seed-2.0-Pro (high)ByteDance69.4
7SenseNova-6-7-Flash-AlphaSenseTime69.0持平7SenseNova-6-7-Flash-AlphaSenseTime69.0
8GLM-5V-TurboZ.ai62.8持平8GLM-5V-TurboZ.ai62.8
9Step-3.7-Flash (High)StepFun61.5新上榜9Step-3.7-Flash (high)StepFun61.5
10Gemma-4-31B-ItGoogle56.3新上榜10Gemma-4-31B-itGoogle56.3

本周榜单主要变化

  • GPT-5.5 High、Doubao Seed 2.0 Pro High、Step-3.7-Flash High 与 Gemma-4-31B-It 四款模型新上榜。
  • 多模态榜同样出现推理档位变体独立上榜现象。

可能原因

  • Gemma 4 31B 为 Google 4 月发布的开源多模态模型,Apache 2.0 许可,支持 256K 上下文。
  • 推理档位模型与开源多模态模型共同进入,显示榜单对 High 模式与开源权重认可度提升。

16国内 - 医疗 (MedBench)

来源:medbench.opencompass.org.cn

数据周期 · 2026-06-18(上周) → 2026-06-26(本周)

本周 vs. 上周 top 模型对比

本周排名本周模型所属公司本周参数排名变化上周排名上周模型所属公司上周参数
1U2-Med云知声智能科技股份有限公司72.9持平1U2-Med云知声智能科技股份有限公司72.9
2京医千询京东健康72.6持平2京医千询京东健康72.6
3卓睦鸟医疗大模型广州中康数字科技有限公司72.1持平3卓睦鸟医疗大模型广州中康数字科技有限公司72.1
4千问健康大模型千问C端71.2持平4千问健康大模型千问C端71.2
5华为云健康管理大模型Huawei71.0持平5华为云健康管理大模型Huawei71.0
6ME-baseMeta Emergence Laboratory70.4持平6ME-baseMeta Emergence Laboratory70.4
7WiseDiag v2杭州智诊科技有限公司69.8持平7WiseDiag v2杭州智诊科技有限公司69.8
8微医医疗大模型微医68.2持平8微医医疗大模型微医68.2
9AntAngelMedMedAIBase68.0持平9AntAngelMedMedAIBase68.0
10UniGPT-Med-U1云知声智能科技股份有限公司65.7持平10UniGPT-Med-U1云知声智能科技股份有限公司65.7

本周榜单主要变化

  • 无重大变化
AGENT-NATIVE DATABASE

Agent 原生数据库

01 · 这是什么

TL;DR · pandadataskill.md

本站底层是一个面向 AI Agent 开放的实时榜单数据库,涵盖两类数据:OpenRouter 的周度模型调用量、厂商份额与细分统计数据(编程 / 工具调用 / 图像 / 音频),以及与周报同源的 15 张外部基准榜单的多期快照(LMArena 文本 / 代码 / 图像编辑 / 文生图、Artificial Analysis、SWE-bench、LiveCodeBench、GPQA、HLE、FrontierMath、GAIA、OpenCompass、MedBench)。全部以只读 SQL + MCP 的形式开放,任何支持 MCP 的 Agent 都能直接查询。下面的两张演示图,就是用这个库画出来的。

数据库每天 08:00(北京时间)自动更新一次;但各数据源有自己的发布节奏,因此各表可用数据的新鲜度以数据源自身的更新时间为准。

如果不想往下读的话,直接甩给你的 agents:

⬇  下载 pandadataskill.md

02 · 用同一个库,你可以——

两个演示 · 数据均来自本库
演示 A · 还原

Top Models 周度调用量

你可以还原一个 OpenRouter 上的视图。

演示 B · 跨库自创

基准排名 × 真实使用量

你也可以把能力榜单表OpenRouter 调用量表跨库 JOIN——横轴 = 基准得分,纵轴 = 近 30 天调用量(对数)。跑分高的模型,真的有人用吗?

💡 同一个库,你还可以画——

model_activity 算推理 token ÷ 回答 token,看哪些模型真的在"思考"(有的推理量是答案的 3 倍,有的几乎为零);用输入:输出比例给负载画像——50:1 是文档抽取型,5:1 更像对话;用 rankings_market_share 画 52 周中外厂商份额拉锯;用 model_apps_daily 看一个模型的流量是被少数大应用"承包"还是长尾开发者撑起;或用 models 按发布时间画上下文军备竞赛——1M+ token 的模型已超过 70 个。

03 · 让你的 Agent 直接访问数据库(MCP)

Agent-native · Model Context Protocol

本站运行一个 MCP 服务器。任何支持 MCP 的客户端(Claude Code / Claude Desktop / Cursor 等)都能一键连接,直接对自动刷新的实时数据库执行只读查询——无需复制粘贴、无需手动下载。

两个库均每天 08:00(北京时间)自动刷新:OpenRouter 调用量库(周榜 / 厂商份额 / 编程榜 + 每日 token 量 + 每个模型的供应商、定价、吞吐与延迟、可用率、Top 应用),以及能力榜单库(LMArena / GPQA / SWE-bench / OpenCompass 等 15 张外部基准)。完整表结构随时调用 openrouter_schema() / leaderboards_schema() 获取。

① 一行接入(Claude Code)

claude mcp add --transport http panda https://pandaleaderboard.com/mcp/

② 或写入 MCP 配置(Claude Desktop / Cursor)

{
  "mcpServers": {
    "panda": { "url": "https://pandaleaderboard.com/mcp/" }
  }
}

③ 可用工具

  • query_openrouter(sql) — 对实时数据库执行只读 SQL(仅 SELECT / WITH,最多 500 行)。
  • openrouter_schema() — 列出所有表与字段(先调用它了解结构)。
  • openrouter_freshness() — 查看最新数据周与各表行数。
  • query_leaderboards(sql) — 对能力榜单库(LMArena / GPQA / SWE-bench / OpenCompass 等 15 张外部基准表的多期快照)执行只读 SQL。上面的「演示 B」就是这个库和调用量库跨库 JOIN 画出来的。
  • leaderboards_schema() — 列出能力榜单库的表与字段。
  • leaderboards_freshness() — 查看各基准表的最新快照日期。
  • report_top_models() / report_market_share() — 复现本站「周报」页所用的近 7 天滚动口径(与官方 Mon–Sun 完整周不同)。

④ 示例:让 Agent 查询本周调用量榜首

SELECT model_slug, tokens, rank
FROM rankings_top_models
WHERE week_start = (SELECT MAX(week_start) FROM rankings_top_models)
ORDER BY rank LIMIT 10;

完整字段、新鲜度语义与更多 SQL 配方见 pandadataskill.md(即上方可下载的手册)。接口开放、无需鉴权;所有工具调用(工具名 + SQL + 调用方)会被记录用于使用分析。

Research

Research · 数据研究专题

基于 OpenRouter 自有数据的研究专题集合。每个区块是一个可独立展开 / 收起的分析模块;更多专题将陆续加入。

Token 经济学 · OpenRouter
DeepSeek 斩杀线 · 价格 × 真实用量
把价格压平后,看开发者真正把 token 投给了谁。含 Value Map · 四象限、斩杀线挑战、平台概览与用量 / 排行 / 份额。
数据加载中…
Token 经济学 · 后验主义

把价格这层外衣拿掉,开发者到底会选哪个模型?
DeepSeek 斩杀线:低价 + 可用 + 稳定,正在把全市场价格参照系往下拉。

我们不先争论谁更强,而是把复杂变量收敛到两个可观测量:价格(一次标准调用要花多少钱)与用量(开发者实际把多少 token 投在它身上)。下方分析方法借鉴 ZenMux 的「斩杀线」框架,但数据全部来自 OpenRouter 自有表,并在末尾与 ZenMux 的结论作对照。

① 归一化用量 Um
median近14日(日 token)
近 14 个完整日里,model_activity 的中位日真实用量(B tokens/日)。规避单日尖峰。
② 归一化价格 Pm
100K·pin + 1K·pout
标准价格篮 = 100K 输入 + 1K 输出(贴合 Coding/Agent 输入重场景),价格取自 model_pricing_history 最新快照($/篮)。
③ 价值 Value
Um / Pm
每花掉 $1 标准调用成本,模型承载多少真实日用量。

Value Map · 四象限日度 · 近14日 · 截至

横轴 = 归一化价格 Pm(对数轴,$/标准篮),纵轴 = 中位日真实用量 Um。虚线为价格中位数与用量中位数,把模型分成四个象限。

低价 + 高用量 · 真正的 value play不是单纯便宜,而是在低价下吃到了非常大的真实用量。
高价 + 高用量 · premium demand贵,但凭能力、稳定性与开发者信任,关键任务里用户依然买单。
低价 + 低用量 · 便宜但暂未被选择价格打下来了,但还没把用户真正打动。
高价 + 低用量 · 最危险区贵,却没有足够真实需求支撑;定价必须回答「贵在哪里」。

数据:OpenRouter model_pricing_history(最新快照)× model_activity(近 14 个完整日)。方法借鉴 ZenMux 斩杀线框架,数据为 OpenRouter 自有;价格按 100K:1K 标准篮归一化,已剔除异常报价。

斩杀线挑战 · 把价格对齐到 DeepSeek日度 · 近14日 · 截至

规则:归一化价格高于 V4 Pro → 打折到 V4 Pro;介于 V4 Pro 与 V4 Flash 之间 → 打折到 V4 Flash;本就更便宜 → 保持原价。价格压平后,只看谁真正留得住 token。锚点价格由 OpenRouter 实测定价得出。

模型对齐锚点归一化价格变化降价幅度

数据:OpenRouter model_pricing_history。锚点 DeepSeek V4 Flash / V4 Pro 价格为 OpenRouter 实测,非外部研究值。

平台概览

OpenRouter 上的 token 处理总量与活跃度,分别给出周度(完整周)与日度(最近完整日 / 近 7 日)口径。

周度 完整周 · 截至
日度 截至

模型用量趋势周度 · 截至 本周至今 ·

头部模型的周 token 消耗(B tokens)随时间堆叠;最右一列为「本周至今」的日度增量(半透明)。颜色源自 Panda 厂商色板。

模型排行周度 · 截至

按 token 消耗排序的头部模型。

厂商份额周度 · 截至

按模型厂商(maker)划分的 token 消耗占比,100% 堆叠随时间。

数据源:OpenRouter explorer JSON(服务端每日构建,周度)+ analytics-live.json(直读 OpenRouter 数据表,日度)。「斩杀线」分析方法借鉴 ZenMux 研究,数据全部为 OpenRouter 自有。

04 REPORT ARCHIVE

历史周报

过往周报归档,可按发布日期、模型或主题搜索。