本来高考前就和同学密谋弄个DAG来(最开始是树形的打算,发现其实父节点可以不只一个,于是允许子节点链接其他子树上的节点,相当于DAG了)跑网页搜索。但是因为之前都没有做开发的经历,很多东西需要现学,比如如何从网页上扒到正文,如何从链接里面加载到正确的网页(有些会反爬)等等。所以填志愿一结束,就开始和同学紧锣密鼓地学和试,最近进展是稍微能做到线性的追问和追查最后总结所有查询给出答案。
这些天要给学弟上信竞(学校特色),备课出讲题之类的很费时间,这个想法也就暂时搁置了。结果正为考试断网连不了学校的OJ发愁的时候,尝试了一下用AI工具找合适的部署起来比较便利的OJ,打算放到机房教师机上跑。其中就有秘塔,毕竟是中文互联网AI搜索引擎中做的很出色的。
我知道秘塔的研究很费时间(其实最后边那格已经叫深度搜索了),发完问题请求之后就调到后台,继续看博客去了。结果过了十分钟翻回去看,意外的发现秘塔更新得了,这个新深度搜索的功能还和自己想法很相像!肯定有不同的地方,比如我就没想过要在新开节点的时候解释新节点和旧节点的关系(具体表现为在箭头上写注释),完全去掉了树的想法纯纯用DAG,还有不太清楚秘塔的开点逻辑和我的是否相似(用优先队列丢todo,按照大模型觉得的优先度即对后续搜索的帮助和链接旧节点个数排序,最大堆,每次一个节点算完都会思考信息够不够,不够的话会出一个小todo,并且对每个小todo在大todo里面找相似条目合并并链接,找不到就新开)。
既然是秘塔这个我挺喜欢的公司做的,那就不重复造轮子了,毕竟别人是有满血模型(希望是),能拿到的互联网内容也绝对比我和同学瞎捣鼓多(但是在读知乎这方面我们还是想了办法的,算是精神胜利法安慰下自己),况且动画还那么好看。最重要的一点是他就是个互联网Digger,不会像大多数深度研究一样给你甩长篇大论,有些检索能力弱的真的读起来符合“懒婆娘的裹脚”和“自信胡说”这一标准。秘塔这个深度研究输出的内容直击你的问题,并且非常简短!
虽然标题看起来像个广,文章后半段也像个广,那么其实可以当广看,但是我只是分享个人经历,这确实不是一个广。写的像广是我的问题。
为什么是半个呢,因为本来暑假想在这方面玩两个小项目,秘塔完成了一半,自然是半个暑假喽。
挺惊喜的。
