Share一个深度搜索结果数据集

INFO 20250513/README.md · BlueSkyXN/AI-DeepResearch-BenchReport at main
REPO BlueSkyXN/AI-DeepResearch-BenchReport at main

本数据集(20250513版本)收集了以下AI大模型的评测结果:

  • ChatGPT:
    • GPT-4.5-Team
    • GPT4o-Team
    • o3-Team
    • O3-DeepResearch-Pro
    • o4mini-Team
    • o4minihigh-Team
    • O4-mini-DeepResearch-Free
  • Claude:
    • MAX-Research
    • Pro-Claude3.7ST
  • 阿里巴巴:
    • Qwen-2.5-MAX (深入研究模式)
    • Qwen-3-235B-A22B (深入研究模式)
    • Qwen-3 (分析研究模式)
  • Google:
    • Gemini-2.5-Pro-DeepResearch-企业版
    • Gemini-2.5-Pro-联网搜索-企业版
    • Gemini-DeepResearch-个人免费版
  • Grok:
    • Grok-3-Think
    • Grok-3-DeepResearch
    • Grok-3-DeeperResearch
    • Grok-3-Nothink
  • 字节:
    • COZE-SPACE (探索模式/规划模式)
    • 豆包-AI搜索
    • Feishu-Aily-DeepSeek-R1
  • 月之暗面:
    • Kimi-K1.5长思考
    • Kimi-探索
  • 其他:
    • 秘塔 AI搜索-深度思考
    • Perplexity-Free
    • Manu爱死-标准版
11 个赞

感谢分享!

感谢大佬

感谢佬友分享

感谢分享

非常感谢大佬的热心分享

谢谢分享

用心了 佬 感谢

感谢分享!

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。