豆包2.0在「APP」里普通长对话中大概只能记住14轮对话且经过统计约为10k tokens

豆包2.0专家 打破输出短的历史|《假如给世界三天黑暗》|豆包自我介绍网页(输出上限写不完)继续讨论:

新模型上线先吐槽两个话题 :tieba_087:
除了上一个话题涉及到的输出上限问题:

输出上限大概在50万字符以内
(不包括思考)

上下文上限问题:
注意看中央的蓝色句子 以及右边的进度条


注意看他回复的我的第一个要求…

可以看到几乎就是1/4个本对话
他如果真的能有全局记忆,也就是把我的第一句话还能记住的话 那他一定明白我说的要求是指我们的英语大学习该怎么学,我设定的一些规则是什么,显然他忘了,所以他把要求当做了请求 ,专家模式过度思考也助长了这一点

具体数据分解下面说

我的所有任务要求基本都在最开头,自然而然现在他什么都不知道
他这个忘却是所有AI中最彻底的,不是记不清,而是根本就没有了记忆 根本不知道你说过什么话了 自己的话也忘掉了 从他的上下文窗口中移除了

(中途又不断重复了好多次 强化了好多次,但没有再说最基础的要求,所以他基本还是一直在忘,全靠着上一条回复当做模板写下一条 结果任务一旦不同,自然而然就忘掉了。然后截图的两段对话经过手动计数,一共14轮 这期间没有任何规则重复了 )

那么一轮对话,除了我的问题忽略不计之外,他的回答大概也就在800字符左右

14轮就是800*14=11200
算他中英文混合token换算比例1:1
所以它的上下文只有1万token???

或者是轮数限制吧,你最好是

所以说
初步结论是不建议和他进行长上下文对话(尤其是轮数 字数都无所谓了)

这是个英语大学习项目,我先提了一堆对于各种各样的英语块 比如单词块,短语块,句子块 分别该如何去讲解解析之类的

为什么这么做,以及之后想怎么做,我微信里说了:

也结合评论区再更新一下结论

不建议在APP高强度/专业使用豆包 受众不是你们w

7 个赞

放在这里面的估计是阉割了上下文的版本 不然禁不住用

1 个赞

简单的东西问问豆包还行

1 个赞

这么重要的点,刚才竟然忘记考虑了,更新了一下结论以及标题
感谢提醒

app就是阉割过的,问他几个问题他就忘记了前面的,而且很蠢

1 个赞

三轮对话之内,智商勉强在线,超越gpt3.5还是不是问题的…
如今不依赖上下文的话,专家模式也还不错,至少输出内容很丰满
而且受记忆的影响更小一点,他会在最后考虑一下记忆相关内容
因此呢回答更稳定,不会盲从记忆,胡乱发挥

上下文阉割得这么厉害,竟然还有这么多人喜欢用,恐怕大部分人的AI需求8B就可以解决吧!

4 个赞

智商在线解决大部分人的问题,是没有问题的 况且搜索体验也很不错

以及我最喜欢最强大的视觉识别能力
虽然如今也明白,并不是100%成功。但我又找不到替代品 不狠狠信任豆包还有谁呢?
能处理大概1万像素的长图片,其实已经是无敌的了

1 个赞

搜索能力和识图能力是国内最好的用的人多也不奇怪,很多gemini3都认不出的图我在豆包那有不少都能认出来尤其是二次元形象

2 个赞

更新:图片我的标注不太行,然后我又多补充了两段文字说明 :melting_face:

app肯定阉割的

不专业的测试

比如我随便传了一本epub上去,大概118k token(用的deepseek的tokenizer可能不是很准 :distorted_face:
image
显示只阅读了63%,也就是差不多75k

1 个赞

1/4挺不错的,所以它是三大限制
第一个是总上下文限制,第二个是输出单次上限
第三个是上下文轮数限制
(智商限制咱就不说了…)

阅读了又不是真正理解,更多的走的是语义向量从文字中检索,百分之六十三的部分水分也很大

1 个赞

再次优化了一下话题中所涉及的最终结论以及标题~

需求没那么高

很多人就是想看别人说出自己想说的话,或者随便问点什么

我爸妈就爱用,看了下问的问题十有八九都是直接百度都能出来

2 个赞

而且相当一部分需求更主要集中在AI视频和AI图片吧
再怎么说也是抖音做出来的,一有图,二有片(bushi)

豆包我一直的感觉就是应用做的厉害,各种功能确实很全面,至于模型一直都不咋样

1 个赞

还有红果、飞书

1 个赞

当个搜索助手挺好用的,但是专业一点的事干不了一点

  1. APP 是有轮数窗口的,多了最顶上的直接卡擦
  2. 他这个感觉有 Thinking 回传,要把 COT 也给算上
2 个赞