このサイトはCookieを使用しています。サイトの使用を続けることで、Cookieの使用に同意することになります。

Logo
    生成AI活用ガイド
    生成AI活用ガイド
    /先行研究調査:論文リサーチ
    先行研究調査:論文リサーチ
    /
    AutoPlan: 大規模言語モデルを用いた対話型意思決定タスクの自動計画

    AutoPlan: 大規模言語モデルを用いた対話型意思決定タスクの自動計画

    タグ
    PromptTuning
    AIBoom
    AIDB X
    Github
    https://github.com/owaski/AutoPlan
    URL
    https://arxiv.org/abs/2305.15064
    公開日
    2023/05/24
    概要

    著者リスト

    Siqi Ouyang, Lei Li

    著者所属機関

    University of California, Carnegie Mellon University

    視点

    サマリ

    どういう論文?

    この論文は、複雑な意思決定タスクにおいて、事前に訓練された知識と実際の環境ルールとのミスアラインメントにより失敗することが多い大規模言語モデル(LLM)の問題に取り組んでいます。AutoPlanという新しいアプローチを提案し、タスク解決計画をプロンプトに追加し、反復的な経験収集と反映を通じて最適化します。

    先行研究と比べてどこがすごい?

    AutoPlanは、コストのかかる勾配計算や長いインコンテキストデモンストレーションを必要とせずに、LLMベースのエージェントがインタラクティブな意思決定タスクを達成するためのガイドを提供します。ALFWorldとHotpotQAのベンチマークで、人間によるデモンストレーションを使用するベースラインと同等またはそれ以上の成功率を達成しています。

    技術や方法のポイントはどこ?

    AutoPlanは、自然言語で記述されたタスク計画をプロンプトとして使用し、その計画を反復的に最適化することでタスクを解決します。経験のバッチ処理とSIR(要約、欠陥の特定、計画の改訂)反映という2つの技術を導入しています。

    どうやって有効と検証した?

    AutoPlanは、ALFWorldとHotpotQAという2つの異なるベンチマークで評価されました。バッチサイズを大きくすることで学習が安定し、明示的なSIR反映により計画更新が実用的かつ進歩的になることを確認しました。

    議論の内容は?

    AutoPlanは、テスト時の改良を必要とせず、すべてのタスクインスタンスに適用可能な計画を最適化する唯一の方法であり、意思決定プロセスの効率的な推論に寄与する可能性があります。

    アブスト-GPT要約

    AutoPlan: 大規模言語モデルによるインタラクティブな意思決定タスクの自動計画

    主要機能

    • タスク解決計画をプロンプトに追加
    • 反復的な経験収集と反映による計画の最適化
    • 勾配計算やデモンストレーションを必要としない

    利点

    • 人間によるデモンストレーションを使用するベースラインと同等またはそれ以上の成功率
    • 学習の安定性と計画更新の実用性
    • テスト時の改良を必要としない効率的な推論

    実験結果

    • ALFWorldとHotpotQAでの高い成功率
    • バッチサイズを大きくすることで学習が安定
    • 明示的なSIR反映による計画更新の実用性と進歩性

    評価と結論

    AutoPlanは、大規模言語モデルを用いた意思決定タスクにおいて、勾配計算や人間によるデモンストレーションを必要とせずに、効率的な推論と高い成功率を実現する新しいアプローチを提案しています。実験結果は、このアプローチの有効性を裏付けています。

    TIS株式会社

    サイトのご利用について

    情報セキュリティ方針

    お問い合わせ・フィードバック

    Copyright 2024 TIS Inc.