模型性能对比

驱动 Sight AI 的性能领军者
可视化速览

基于社区投票和性能测试的综合评分,发现最适合你需求的 AI 模型。

查看各大型语言模型在文本处理、语言精确度和文化语境理解方面的综合排名。

最后更新2025年11月17日
总投票数335,762
排名模型评分95% CI (±)投票数组织许可
1
Google
gemini-2.5-pro
1452±462,764GoogleProprietary
2
Anthropic
claude-sonnet-4-5-20250929-thinking-32k
1449±613,853AnthropicProprietary
3
Anthropic
claude-opus-4-1-20250805-thinking-16k
1448±529,426AnthropicProprietary
4
Anthropic
claude-sonnet-4-5-20250929
1444±78,318AnthropicProprietary
5
OpenAI
gpt-4.5-preview-2025-02-27
1442±614,644OpenAIProprietary
6
Anthropic
claude-opus-4-1-20250805
1439±441,950AnthropicProprietary
7
OpenAI
chatgpt-4o-latest-20250326
1438±448,510OpenAIProprietary
8
OpenAI
gpt-5-high
1436±530,974OpenAIProprietary
9
OpenAI
o3-2025-04-16
1434±459,391OpenAIProprietary
10
Alibaba
qwen3-max-preview
1432±525,932AlibabaProprietary