大家有哪些好用的开源知识库项目推荐,最近在搭内部知识库

目前调研了dify、飞书自带的AI知识库,大家还有其他推荐吗

1 个赞

还有 FastGPT 以及 RAGFlow。

嗯,这两个也大概看了一下,现在比较纠结,觉得飞书这边支持多模态,自己搭的话文档实时性不好保证,维护起来比较麻烦,飞书可以直接拿文档,缺点是相对来说是黑盒,不能自己调优,其他开源的可以自己选模型和自己控制索引方式

嗯,感觉内部使用最好还是选开源项目吧,多模态这块确实很少有支持的,可能还是需要自己在工程上做一些适配才行。

1 个赞

一坨,不建议使用。

为什么老友

用下来感觉有几个地方不太成熟,比如:

  • 主账号建了库授权给子账号,子账号登录居然还要自己重新配模型
    这点很扯,那我主账号配好了,子的只想上去看看,还得配

  • 知识图谱一开,上传文档全卡在80%~90%
    因为生成图谱是单线程的,体验非常差。我根本分不清到底是上传出错了,还是里面生成图谱的LLM卡死了。
    我觉得这两块应该拆开,文档上传是一个业务,开了图谱就到队列里慢慢生成图谱就好了。

  • 没法自定义文档主键
    这意味着我想做外部关联,就必须存下 RAGFlow 返回的 doc_id。
    但结合上面那个问题,doc_id 要么迟迟不返回,要么先返回了,结果后面图谱生成失败,下次重新解析,doc_id 又变了,非常折腾,不好做文档的版本管理。

  • API 支持不完善,返回体有点混乱
    比如我想通过 API 设置 metadata,让 RAGFlow 能存下我业务侧的 doc_id,结果发现好像没有一个接口能顺利设置成功。还有其他一些小坑,一时想不起来了。然后metadata从接口里返回的位置,也是非常的离奇。


当然,上述问题都可以通过一些方式解决。但是我对好产品的定义是开箱即用,尽量不要出现用不去,要人额外想这种办法的事情。

1 个赞

Gitee搜索下,现在开源的有很多。。。