思考のすべて: 思考生成のためのペンローズ三角形の法則に反する

タグ

ArchitectTuningPromptTuning

AIBoom

AIDB X

Github

URL

公開日

November 7, 2023

概要

著者リスト

Ruomeng Ding, Chaoyun Zhang, Lu Wang, Yong Xu, Minghua Ma, Wei Zhang, Si Qin, Saravan Rajmohan, Qingwei Lin, Dongmei Zhang

著者所属機関

視点

サマリ

この論文は、「Everything of Thoughts」(XOT)という新しい思考提示アプローチを紹介しています。これは、Large Language Models (LLMs)の問題解決能力を向上させるために、強化学習とモンテカルロ木探索（MCTS）を利用しています。

XOTは、先行する思考生成パラダイム（例えば、Chain-of-Thought、Tree-of-Thoughtなど）が達成できなかった、パフォーマンス、効率、柔軟性の３つの特性を同時に達成します。これらのパラダイムは、せいぜい２つの特性を同時に達成することができるだけでした。

XOTの主な特徴は、MCTSとLLMの協力による思考生成フレームワークです。MCTSは効率的な思考探索を行い、LLMはMCTSから派生した思考の改良と精錬を行います。これにより、複雑な問題の解決において高いパフォーマンス、効率、柔軟性を実現します。

XOTの効果は、複雑な問題解決タスク（「24ゲーム」、「8パズル」、「ポケットキューブ」）での評価によって検証されました。これらのタスクは多段階の解決が必要で、複数の解決策を持つ可能性があります。評価には、GPT-3.5およびGPT-4が使用されました。

XOTの一般化能力とその適用範囲の拡大、トレーニングに必要な追加のポリシーと価値モデルのコストと効率について議論があります。

XOTは、複雑なタスクを解決するためのLLMの思考生成において顕著な進歩を示し、パフォーマンス、効率、柔軟性の面で従来のパラダイムを大きく上回ることが実験結果から示されています。