INFO 20250513/README.md · BlueSkyXN/AI-DeepResearch-BenchReport at main
REPO BlueSkyXN/AI-DeepResearch-BenchReport at main
本数据集(20250513版本)收集了以下AI大模型的评测结果:
- ChatGPT:
- GPT-4.5-Team
- GPT4o-Team
- o3-Team
- O3-DeepResearch-Pro
- o4mini-Team
- o4minihigh-Team
- O4-mini-DeepResearch-Free
- Claude:
- MAX-Research
- Pro-Claude3.7ST
- 阿里巴巴:
- Qwen-2.5-MAX (深入研究模式)
- Qwen-3-235B-A22B (深入研究模式)
- Qwen-3 (分析研究模式)
- Google:
- Gemini-2.5-Pro-DeepResearch-企业版
- Gemini-2.5-Pro-联网搜索-企业版
- Gemini-DeepResearch-个人免费版
- Grok:
- Grok-3-Think
- Grok-3-DeepResearch
- Grok-3-DeeperResearch
- Grok-3-Nothink
- 字节:
- COZE-SPACE (探索模式/规划模式)
- 豆包-AI搜索
- Feishu-Aily-DeepSeek-R1
- 月之暗面:
- Kimi-K1.5长思考
- Kimi-探索
- 其他:
- 秘塔 AI搜索-深度思考
- Perplexity-Free
- Manu爱死-标准版