論文: ReAct: Synergizing Reasoning and Acting in Language Models 読解の目的 これまでの手法 (CoT, Self-Consistency) プロンプトや推論アルゴリズムを工夫し LLM の内部の推論能力を引き出す技術 ReAct さらに推論アルゴリズムを工夫し、LLM の推論結果に基づき行動を選択し、環境から新しい情報を得ることで推論を改善する これまでが推論単体だったのに対し「推論 + 行動」 を LLM を用いて行う これにより LLM が AI agent として環境を操作できるようになり AI Agent の初期のアイデアを…