使用Genspark Agent生成的研究報告「不是深度研究功能」

我用的是某位佬友的提示詞(加了使用各種數據圖表):

问题是:
问题:结合经济学、统计学、历史学的角度
用【英语】搜寻。分析,推理和计算,以下九个阶段,每个阶段GDP的年均增长率。 进行深度推理和思考。生成【中文】20000字以上的深度报告(結合各種數據圖表)。
01:公元前1万年到公元1年
02:公元1年-公元1000年
03:公元1000年-公元1600年
04:公元1600年-公元1800年
05:公元1800年-公元1900年
06:公元1900年-公元1950年
07:公元1950年-公元1980年
08:公元1980年-公元2000年
09:公元2000年-公元2020年

過程:https://www.genspark.ai/autopilotagent_viewer?id=bea471d9-731a-4414-8b6e-1210b129db13

完成後的報告,我用Notion發出來:

各位覺得質量如何?

23 个赞

问一下,消耗了多少积分?

耗时是多久?

2 个赞

这个质量完全可以匹敌openai啊 :+1:

3 个赞

我是这个问题(提示詞)的作者。

我刚才自己也试了一下,我备用的其他问题。结合我基本已经问过的所有的智能体和AI了。genspark的效果,可能暂时强于openai之外,我实际用过的大部分agent和AI了。

我仔细研究了一下, Genspark的背后,应该套用的是Claude 3.7 sonnet thinking(这个文风和格式一看就知道了,Claude 3.7 sonnet比起o3、Gemini 2.5 Pro还是较为套路和单薄感)。(可惜Gemini 2.5 Pro官方没有这么强的agent,也没有第三方AI公司做。目前,只有某佬友出于爱好在github上做了一个类似功能,已经非常强大了。)

不过初级agent。就是思考大模型+调用各种插件的工作流?(针对深度研究功能,只需要搜索和多步推理。)

再聊一个好玩的现象。Genspark的超级智能体,可能引用源的数量似乎不足100个左右?。我目前调用源数量最多的是Genspark的深度研究一次搜索800个源(如果不是设计过的优化,只是粗暴搜索被污染过的源,是会出现过拟合的幻觉的。原来Genspark的深度研究。一次搜索整合了800个源,结果生产出来报告就是无用的辣鸡。(背后不知道是什么模型,可能是4o?)

这次这个确实进步非常大。【最后补一句,Claude 3.7 sonnet对这类问题的幻觉,多于o3、Gemini 2.5 Pro。有点期待谷歌官方的Gemini 2.5 Pro with Deep Research 】

8 个赞

佬友牛的

2 个赞

感谢你告诉我,我今天晚上花了一晚上,薅的genspark的20个月的羊毛是值得的。 :tieba_088:

2 个赞

用的那个没出的超级智能体吗

1 个赞


佬,查了半天也没找到,超级智能体在哪里呢?

1 个赞

去下载app 已经上线google play了

1 个赞

另外,我会被截断,不清楚是不是节点的关系。

https://www.genspark.ai/agents?type=super_agent
网页用这个可以打开,官网还没上

可以加go on 继续。可能是上下文长度没做好

我下载的是ios的genspark,ios没有其它的。意思是将会有另外一个新的app?

好的谢谢佬

可能要等更新 不过上面那个佬友给的链接也能直接进去

好的谢谢

真好,去看看这个

质量感觉很棒啊

1 个赞

我沒顯示出消耗了多少積分,時長大概是30分鐘

这个好强