人工知能は加速度的に進化し続けています。
GPT-3からGPT-4への移行では、高度な推論、入力設定、微調整の振る舞い、そしてより長い文脈の理解に関して、大幅な改善が見られました。
GPT-4とGPT-3について もっと詳しく学ぶ。
ただし、AIとの人間の対話は変わりません。望む結果を得るために、注意深くAIのプロンプトを作成し、その振る舞いを調整する必要があります。
まあ、もしAIに単に目標を述べて、それがすべてをやってくれるとしたらどうでしょうか?テスラの車に目的地を入力するように、アクティブな介入を必要とせずに目的地に連れて行ってくれます。
はい、私たちは自律型AIエージェントについて話しています。そして、なんと?それらはもうここにあるんです!
AutoGPTはGPT-4から生まれた最新のアプリケーションで、インターネット上で大きな話題となっています。世界中の開発者が、様々な業界でAutoGPTを利用した新しいアプリケーションの開発に取り組んでいます。そして、中にはAutoGPTをAGIと呼ぶ人もいます!
このブログでは、ハイプを超えて以下を理解しましょう:
- AutoGPTとは何ですか
- AutoGPTの動作原理はどのようなものですか
- AutoGPTはChatGPTと比較してどのような特徴がありますか
- AutoGPTの使用方法はどのようなものですか
その他もあります!
AutoGPTとは何ですか?
AutoGPTは、オープンソースのAIアプリケーションであり、OpenAIのGPT-4言語モデルを活用して完全に自律し、カスタマイズ可能なAIエージェントを作成します。それは2023年3月30日にトーラン・ブルース・リチャーズによってリリースされました。トーランは職業としてゲーム開発者であり、Significant Gravitasというゲーム会社を設立しました。
AutoGPTは、他のAIツールと比較してユニークです。それは独立して操作されるため、モデルを自分のニーズに合わせる必要がなくなります。代わりに、あなたは目標を書きます。AIが残りの作業を行います。そのため、AutoGPTはAIと人間の間の相互作用を根本的に変えており、人間はアクティブな役割を果たさなくても、ChatGPTなどの他のAIアプリケーションと同じかそれ以上の品質の結果を保ちます。
31のChatGPTの代替となるものをチェックしてください。
AutoGPTの仕組みはどのようにして機能するのですか?
AutoGPTは、AIシステムが特定のタスクに対応するために様々なAIエージェントを作成する自律型のAIメカニズムに基づいています。これには、次のものが含まれます:
- タスク作成エージェント:AutoGPTに目標を入力すると、最初にタスク作成エージェントとやり取りをするAIエージェントです。目標に基づいて、タスクのリストとそれを達成するための手順を作成し、優先化エージェントに送信します。
- タスク優先化エージェント:タスクのリストを受け取った後、優先化AIエージェントはシーケンスが正しく、論理的に意味をなしていることを確認してから、実行エージェントに送信します。
- タスク実行エージェント:優先化が完了したら、実行エージェントは一つずつタスクを完了します。これには、GPT-4、インターネット、およびその他のリソースを利用して結果を得ることが含まれます。
上記のエージェントはお互いに通信も行います。したがって、実行エージェントがすべてのタスクを完了し、結果が不十分な場合、タスクの作成エージェントと通信して新しいタスクリストを作成することができます。これは、ユーザーが定義したすべての目標が完了するまで、3つのエージェント間で反復的に行われるループとなります。
AI エージェントの行動は、ユーザーインターフェース上で 4 つのグループに分類されて表示されます:思考、推論、計画、批判です。まず、AI エージェントはタスク完了後に思考を共有します。次に推論があります。これは、AI エージェントがなぜ行動しているのかを説明します。その後、システムはタスクを完了するための計画を提供します。最後に、システムはエージェントのミスを修正し、制約を克服するために批判も行います。
この計算フローを共有することで、AutoGPTは特定の問題に取り組み、ユーザーの介入なしでそれらを克服する方法についての洞察を提供します。
AutoGPTとChatGPTの比較
LLMモデル自体は同じですが、AutoGPTとChatGPTの間にはいくつかの違いがあります。以下にいくつか挙げます。
リアルタイムの洞察
ChatGPTで使用されている最新のGPT-4モデルは、GPT-3.5と同じデータで訓練されていますが、そのデータは2021年9月までのものに限られています。そのため、Webサイトやオンラインプラットフォームにアクセスして情報を抽出することはできませんので、リアルタイムの情報は得られません。
一方、AutoGPTはインターネットへのアクセスがあります。ウェブを閲覧するだけでなく、ソースの信頼性も検証することができます。さらに、AutoGPTはタスクを実行するためにどのプラットフォームにもアクセスできます。例えば、製品の販売の見通しを調査し、アウトリーチのメールを送信するようAIに依頼した場合、Gmailアカウントを使用してメールを起草・送信します。
メモリ管理
コンテキストウィンドウは、正確な回答を提供するために言語モデルにとって非常に重要です。しかし、GPT-4のようなLLMでは、ウィンドウには4000〜8000トークンの制限があります。したがって、要件が制限を超える場合、モデルはすべての指示に正しく従わない可能性があり、信頼性のない出力を行う場合があります。
対照的に、AutoGPTは短期および長期のメモリ管理に優れています。ベクトルデータベースを使用することで、AutoGPTはコンテキストや過去の経験を保存し、モデルがより良い判断をすることができます。
画像生成
AutoGPTはDALL-Eを使用することで画像生成が可能です。AIエージェントの画像生成機能を有効にするには、DALL-EへのAPIアクセスが必要です。ただし、この機能はChatGPT-4では現在利用できません。これはマルチモーダルな入力にも関わらず利用できない機能です。
テキストを音声に変換する
AutoGPTでテキスト読み上げを有効にするには、コマンドラインでpython -m autogpt --speakと入力します。ただし、AutoGPTと対話するたびにコマンドを入力する必要があります。また、柔軟なAI音声ソフトウェアであるEleven LabsにAutoGPTを接続することで、さまざまな音声を追加することもできます。
AutoGPTの制約事項
自律性は、AIシステムに新たな次元をもたらすことは間違いありません。しかし、AutoGPTの制約とリスクを無視することはできません。以下に、把握しておかなければならない主な制約を示します。
使うには高すぎる
機能性は素晴らしいですが、AutoGPTの実用性はおそらくあなたを失望させるでしょう。AutoGPTは高価なGPT-4モデルを使用しているため、タスクの完了ごとのコストが高くなる場合があります。これは特定のタスクのステップでAutoGPTが何度もGPT-4を使用できるためです。
さらに、同じ入力で異なるシナリオでの出力を再現することができないため、実用的ではありません。例えば、モデルに対してトップのランニングシューズを道路と芝生の両方で見つけるように依頼すると、それは芝生のカテゴリのためのプロセスを複製するための機能を作成するのではなく、ゼロから始めます。
頻繁にループに詰まってしまいます
AutoGPTに関するユーザーの最も一般的な問題は、ループに入ってしまうことです。数分以上続く場合は、プロセスを再起動する必要があります。これは、AutoGPTがタスクを適切に定義し分解するためにGPT-4に依存しているために起こります。その結果、AutoGPTは適切な対処を行うことができません。
データ侵害が起こる可能性があります
AIモデルがシステムとインターネットへのアクセスを持ち、自律的に動作する場合、データが漏洩する可能性があります。セキュリティエージェントが存在しないため、これは懸念事項であり、AutoGPTを使用する際には注意が必要です。適切な指示と安全ガイドラインを与えずにモデルを実行することはできません。
AutoGPTのインストール方法
他のAIツールとは異なり、AutoGPTにアクセスするための簡単なサインアップ手続きはありません。AutoGPTを使用する前に、要件を満たすためにさまざまなソフトウェアをダウンロードする必要があります。したがって、あなたのために、AutoGPTのインストール手順のステップバイステップのプロセスを共有しています。
ステップ1:予備ソフトウェアをダウンロードする
AutoGPTをインストールするためには、Git、Python、およびVisual Code Studioの3つの主要なソフトウェア要件があります。 こちらのquick linksのNotionドキュメントを使用して、すべての3つのソフトウェアをダウンロードすることができます。
ステップ2:APIキーのためのOpenAIアカウントの作成
すでにアカウントをお持ちでない場合は、OpenAIのアカウントを作成してください。アカウントを開設すると、APIキーのタブに移動してください。以下でハイライトされたオプションで、シークレットキーを作成することができます。それをクリックし、シークレットキーをコピーしてください。
ステップ3:AutoGPTリポジトリをハードドライブにコピーする
AutoGPTのGitHubリポジトリをハードドライブにコピーするには、2つの主な手順が必要です。まず、GitHubからプロジェクトのリンクをコピーします。
次に、コマンドプロンプトを開いて、下の画像で示されているようにリンクを貼り付けて、AutoGPT GitHubリポジトリをクローンします。
インストールされている場合、VCSのエディタからAutoGPTにアクセスするために、コマンドプロンプトにcodeと入力することもできます。
ステップ4:Pythonモジュールのインストール
VCSを開くと、左側に多くのファイルが表示されます。その中の1つにrequirements.txtというファイルがあります。このファイルには、AutoGPTを実行するために必要なモジュールが記載されています。
これらのモジュールをインストールするには、pip install -r requirements.txt と入力してエンターキーを押してください。注:リポジトリをコピーした場所を指すようにディレクトリが設定されていることを確認してください。
ステップ5:.env.templateファイルの名前を変更する
「.env.template」ファイルをVCSで見つけ、「.」と「template.」を削除してください。
ステップ6:OpenAI APIキーを入力します
最後の手順は、APIキーを.envファイルに貼り付けることです。キーを入力し、ファイルを保存したら、コマンドプロンプトに移動し、python -m autogptと入力します。以上です。AutoGPTがインストールされ、使用を開始できます。
締めくくりの言葉
自動GPTの可能性は興味深いものだと思いますが、新興技術に関しては現実的な期待を持つことが重要です。AutoGPTが開始されてからまだ1ヶ月も経っていないので、この新しいAIアプリケーションがさまざまなユースケースにおいて何ができるか、できないかを見ることができていません。さらに、個人のプライバシーやデータセキュリティに関連する問題も多く、即座の対応が必要です。
そのように言われると、私はAutoGPTがGPT-4のようなLLMモデルとのやり取り方法を変えていると信じています。今では、AIが問題に取り組む方法、間違いから学ぶ方法、そして良い結果を提供する方法を見ることができるため、プロンプトの最適化をすることができます。ですから、AIエージェントはどこにも行かず、しかし成熟するまで時間がかかり、意味のあるユーザーの採用を促進するでしょう。