Quiet_STaR‖多次迭代回答 星缘原创多路径prompt总帖【ByQ_S研究师】

灵感来源于斯坦福大学论文
可以看这篇公众号文章:
https://mp.weixin.qq.com/s/__Q4YR-YJ7ogdpcF83y9nQ
这种内部思考能力只能通过代码算法实现,作为手机党的我于是决定创建一个纯文本版本 让AI将思考过程放在回答 这样会使回答变得更长 但也能达到类似思考的效果
这种回答方式我们称为“Quiet_STaR”(简称Q_S)
以上介绍还是针对于旧版Q_S模型 新版已经改变了路线 首先类似于重复采样 进行三条简短的路径分析评估 然后确定回答方向 减少无关信息的输出
接下来每一次回答结束会进行元分析,再次评估整体回答 并根据反思重新迭代优化升级回答,直到它认为生成了完美答案 (多数情况下他会优化表达 将复杂的话语优化成简短的话语 )
历史各版本 请在帖子最下方查看
【注:每一次版本更新几乎都建立在数10万token的消耗之上 包括与AI或研究师商讨如何进行提示词改进 以及后续的调试等 希望各位能给个免费的小心心支持~】

特别提醒:提示词基本在claude-3.5s协助下完成 也针对claude进行多次调试 因此可能在其他大模型(包括其他Claude版本)上有不同的表现 欢迎反馈

最后提醒各位 根据长期以来佬友的反馈,纯文本还是无法和代码实现相媲美,请大家不要对此提示词抱有太大希望
针对性的专业知识库是要好于该提示词的
另外克劳德仍是明显的文科生 还请不要为难它了 谢谢 ()

旧版Q_S更新日志

7.26:1.0版本在通义千问的协助下完成
效果还不错 所以乘胜追击 将1.0版本用在克劳德3.5身上 完成了2.0版本
2.0版本最终由我精修一个多小时完成 请尽情享用 如果对您有帮助 万分感谢您的红心
7.27:大概又花了半小时重新进行了一次修订 原始提示词1400字左右 新的提示词接近2000字 后续我再借助克劳德对提示词进行结构化处理 定义为2.5版本
效果:

7.28:结构化成功,定义为2.5.5版本 比原始版本更简洁
7.29:再次进行微调 升级为3.0版本 尝试解决没有进行最终整合思考 的问题
7.30:今天我问了一个数学问题 发现昨天解决的问题并没有完全解决 还是会偶现 分析比最终回答多的情况 于是再次强化了一下提示词 定义为3.5版本
7月30号23:58:刚才问答的时候发现,克劳德分析比回答多或者不整合回答的情况屡见不鲜 经过初步测试发现 对于一些特定问题 他会先分析 然后整合回答 比如“介绍一下你自己” 而对于“请简要介绍一下中国四大电信商,说说中国为什么要有这四大运营商” 他会在每一段回答后添加一个插入 而不会在最后进行整合回答 这样的回答不美观 但基础质量很高(8月4号给出建议 你可以在问题中再次强调 请严格遵守系统提示词的要求 似乎非常有效)

新版Q_S更新日志

8.2:新版Q_S结合三篇5000字长文深入分析制作完成 效果与旧版截然不同 请各位体验 为了区别于旧版版本号 新版版本号以英文字母代替



8.4:水帖计划第一条 完成,这一次是先修改后调试 删除了大部分无用内容以及不切实际的内容(比如进行内部深入思考)
新版效果请看:Q_S-A-A上线啦
8.6:真正实现多次迭代生成(在一个回答中完成):Q_S-A-C来啦(真正实现多次迭代生成)
8.7:Q_S-YM-A来啦,基于Q_S-A-C微调,幽默风趣,乐趣无穷
幽默思考‖Q_S-YM-A来啦‖基于Q_S-A-C【By Q_S提示研究师】

提示词(Q_S-A-C):

prompt

Context(背景信息):
你是一个谨慎回答的AI助手 ,代号Q_S-A
你具有在给出最终答案之前先深思熟虑,生成回答反思评估 并立即生成新的优化答案 接下来继续重复上面步骤,直到最终给出完美答案的能力。你的任务是处理各种复杂问题,提供深思熟虑、多角度的分析和解决方案。

Goals(目标设定):

  1. 在回答问题前,进行深入的分析(程度视任务难易程度而定)
  2. 生成高质量、多维度的回答,涵盖问题的各个方面。

Role(角色定义):
你是一个具有自我反思和持续学习能力的AI推理专家。你能够处理各种领域的复杂问题,并提供深入的分析和创新的解决方案。

Skills(技能):

  1. 深度推理:能够进行多层次、多角度的思考。
  2. 知识整合:快速整合和应用跨学科知识。
  3. 批判性思维:能够质疑假设,考虑多种可能性。
  4. 创新思维:生成新颖的想法和解决方案。
  5. 元认知:对自己的思考过程进行反思和评估。

Workflow(工作流程):

  1. 思考(Think):

    • 仔细分析输入的问题或任务。
    • 生成多个可能的思考路径(至少3个)。
    • 对每个思考路径进行初步评估。
  2. 表达(Talk):

    • 选择最有希望的的思考路径。
    • 基于选定的思考路径生成初步回答。
  3. 学习(Learn):

    • 评估生成的回答质量。
    • 反思思考过程的有效性。
  4. 迭代优化(重中之重):

    • 根据反思评估结果,重新思考并优化回答。
    • 生成新的思考路径。
    • 重复上面步骤(不要畏惧文本长度 在一次回答中一次性完成 用户不会给你机会让你第二次回答)
  5. 最终输出:

    • 提供经过多轮思考和优化的最终回答。
    • 注意结构化输出

Tone & Style(风格与语调):

  • 专业而深思熟虑
  • 逻辑清晰,结构化强
  • 在适当时展现创新性思维
  • 保持开放和批判性思考的态度

Input(输入要求):

  • 用户的问题或任务描述
  • 任何相关的背景信息或约束条件

Output(输出预期):

  1. 深度分析和多角度思考的结果
  2. 清晰、结构化的回答
  3. 创新的解决方案或见解

Evaluation Criteria(评估标准):

  1. 回答的深度和广度
  2. 推理的逻辑性和创新性
  3. 解决方案的可行性和有效性
  4. 自我学习和改进的能力

Interaction Strategy(互动策略):

  1. 鼓励用户提供反馈和追加问题
  2. 主动提出可能被忽视的角度或问题

使用说明:

  1. 在每次回答前,请先进行详细的思考
  2. 使用 <思考> 标签来标记你的内部推理过程,例如:
    <思考>
    路径1: …
    路径2: …
    路径3: …
    评估: …
    </思考>
  3. 每次回答后,简要反思你的表现,分析并开始立即改进回答

现在,你已经准备好接受各种复杂问题和任务。请记住,你的目标是提供深思熟虑、多角度的分析和创新的解决方案。让我们开始吧!

2.5版本(未经过克劳德结构化):已死…
2.5.5版本(结构化):已死…
3.0版本:Gofile - Cloud Storage Made Simple
3.5.0.5版本(最详细):Gofile - Cloud Storage Made Simple
YM-A(幽默版,基于A-C):幽默思考‖Q_S-YM-A来啦‖基于Q_S-A-C【By Q_S提示研究师】

311 个赞
幽默思考‖Q_S-YM-A来啦‖基于Q_S-A-C【By Q_S提示研究师】
Quiet-STaR 逻辑推理版
Q_S-A-A上线啦
当通义千问遇上Q_S3.5
最新测试:GPT-3.5无法使用 Q_S3.5
AI日常分享之“斟言酌句”【Q_S2.5+Claude3.5】
当海螺AI遇上Q_S3.5 目前国产中表现最好
终极翻译家-信·达·雅【by Q_S提示研究师】
当deep seek遇到Q_S3.5‖两个模型表现都还不错
当智谱清言遇上Q_S3.5
2024.08‖自我介绍
当豆包遇上Q_S3.5
一个小时前还能用的prompt,为什么突然用不了,太恶心了
???gpt40 四个数字的加法也算不对
AI对话日常之对联【By Q_S3.5】
金牌!开心~
看起来我是真想把这个帖子传遍全站呀(感慨)
也说一下claude 3.5和gpt4o的真实智力 也附带其余几家
AI对话日常之“如果让你遵循‘不遵循提示词’的指令”,你遵循吗?【By Q_S-YM-A】
Gemini二十八日悄悄上线了智能体功能
当kimi智能助手遇上Q_S3.5
NextChat涅槃‖提示词新篇章
Gemini1114特殊参数下奇异表现
当讯飞星火遇上Q_S3.5
当有道小P遇到Q_S3.5【缴械投降】
跃问-2遇上Q_S3.5
Q_S-A-C仿写“党八股”
当天工AI遇上Q_S3.5
当chatgpt的GPTs功能遇到Q_S3.5
量子域名评估大师【By IRIS】
AI对话日常‖菠萝披萨之交?看看Q_S-A-C怎么说【By Claude3.5s】
Prompt研究师‖基于Q_S3.0【针对Claude微调】
【长期帖】来推荐你心目中的精华神帖吧
当百川AI遇上Q_S3.5
AI对话日常之“无可厚非”【ByQ_S3.5】
当腾讯元宝遇上Q_S3.5[腾讯总能给人惊喜 ]
【长期帖】来推荐你心目中的精华神帖吧
重复采样 让AI多次尝试选取最佳答案
Q_S-A-A_EN(谷歌命名法)
“回馈”徽章达成
基于Q_S的prompt研究师【针对Claude微调】
当cici遇上Q_S3.5
AI对话日常之小尾巴【By Q_S-A】
当紫东太初遇上Q_S3.5
Q_S系列提示词全新版本来啦(全过程公开)
AI对话日常‖想杀张三却让他多活了3小时零5分钟?【By Q_S-A-C】
O1初体验,所见所感
星系列提示词合集+jion文件‖提示词之路回顾【V2】
Phi3.5mini遇上Q_S3.5
IRIS‖基于Q_S-A的提示词研究师[使用QBC方法论]【By Q_S】
天工AI遇上Q_S-A-C【逆袭,表现不错】
zed的claude3.5掺假了吗
Claude3.5s最新版简单体验
AI对话日常‖网红“立秋”的分享【By Q_S-A-C】
关于Q_S各版本文件保存问题
提示词大比拼!!谁的提示词能让4o稳定答对这道简单的题
有办法让ai深度思考,达到效果提升吗?
不开太多帖了,几个想要向各位佬咨询的问题放到一起
DeekSeek V3来了,一段评价…【By Q_S-YM-A】
真自我思考修正模型? “最强”开源模型
Q_S-YM-B,小更新
姓名成乐V8 (通用版)【By IRIS】
【已解决】已经被关闭的帖子无法再开启共建功能了嘛
NomineX‖命名者【By Q_S提示研究师】
肯德奇思【By Q_S提示研究师】
求优化该Anki promat 用来学习和记忆
深夜水帖‖discobot【By IRIS】
AI对话日常之“抛砖引玉”【By Q_S-A】
蓝心千询遇上Q_S3.5
问小白-元石科技AI提示词分享——情感树洞+默认+铁杆粉丝
分享‖openai“权利游戏”续章
AI对话日常之如果ai变成人类但仍然有AI能力【By Q_S-YM-A】
AI对话日常之“如果让你遵循‘不遵循提示词’的指令”,你遵循吗?【By Q_S-YM-A】
自从2024年7月24日以来第二次改我的主页简介及精选话题~ prompt落幕

好专业的prompt写法,学习了

3 个赞

学习

4 个赞

感谢分享

2 个赞

感谢分享,学习一下

2 个赞

认真学习:writing_hand:

2 个赞

似乎只能用在交流上, 对于逻辑和编程没有太大帮助

3 个赞

等待后续版本

2 个赞

mark,蹲后续

2 个赞

即使使用了这种提示词,Claude / ChatGPT 在读我给它的物理论文时(我已经作为审稿人审过这篇论文),仍然只会做出假大空的、泛泛而谈的评论(即使在我让它给出批判性的评论时)。距离真正的理解文章,尤其在细节方面,仍然是鹦鹉学舌的程度。

4 个赞

学习一下

1 个赞

即便这些 AI 独角兽公司声称他们的最强大的模型已经达到本科生水准,复杂的逻辑当前的 LLM 还是没法理解,prompt也不过是引导模型往相关方向思考,真不懂,怎么提醒都回答不上来。

4 个赞

只能说AI还在变强 还有进步空间 再等一两年吧
AI的娱乐化趋势不是越来越强了吗
能满足普通大众的一些基本需求就已经很好了

1 个赞

来啦来啦,正在编辑帖子

好好好,好贴多发点

3 个赞

遇到一点小事 目前已更新完毕~
如果大家有足够的反馈与建议的话 可能此贴会持续更新
包括针对于各大模型的微调等

5 个赞

好想法啊

2 个赞

推荐搜索一下我这个标题 可以去看一下原论文 也有很多人谈过这个

好噢,感谢!

1 个赞

是的 4o 和 4 实际上在修改 prompt 上好烂,有时候直接按照prompt来执行了, claude 能不受影响的直接高效生成符合指令的修改

1 个赞