DUICUO

AlibabaのAIエージェント「アセンブリファクトリー」がオープンソース化!経験ゼロでも数万のエージェントを同時処理可能。

マルチエージェント開発をブロックを組み立てるのと同じくらい簡単にするために、Alibaba の Tongyi Labs は、マルチエージェント プログラミング フレームワークおよび開発プラットフォームである AgentScope をオープンソース化しました。

このプラットフォームは、マルチエージェント アプリケーションの開発者向けに特別に設計されており、開発者に使いやすいプログラミング エクスペリエンス、安定した信頼性の高いランタイム保証、分散型でマルチモーダルな技術サポートを提供することを目的としています。

OpenAI、DashScope、Gemini、Ollam などのさまざまなプラットフォームのモデル API が組み込まれており、大規模モデルの現在のオープンソース エコシステムとの高度な互換性が確保されています。

AgentScope にはすぐに使用できるさまざまな機能が用意されており、シンプルなドラッグ アンド ドロップ機能を使用して、マルチエージェント アプリケーションを簡単に構築できます。

分散開発の経験がない開発者でも、AgentScope プラットフォーム上で数万の同時エージェントを簡単に実現できます。

より多くのユーザーが独自のマルチエージェント アプリケーションを迅速かつ簡単に開発できるようにするために、AgentScope は次の機能を提供します。

  • ドラッグ アンド ドロップ プログラミング パラダイム - AgentScope Workstation : ユーザーに視覚的なドラッグ アンド ドロップ開発インターフェイスを提供します。
  • インタラクティブプログラミングアシスタント – AgentScope Copilot : AgentScopeに関する開発者の質問に答える
  • 透明性と制御性に優れた開発プロセス - リアルタイム アプリケーション監視: アプリケーション実行時のコストとマルチエージェントの状態をリアルタイムで監視することで、透明性と制御性に優れた開発が可能になります。
  • 豊富な開発リソース: アプリケーションを「ゼロから」構築する必要がなくなり、迅速かつ便利な二次開発が可能になります。

AgentScope ワークステーション

AgentScope Workstation は、便利なドラッグ アンド ドロップによるマルチエージェント アプリケーション オーケストレーション パラダイムを提供します。

プログラミング経験はもはやあなたの想像力を制限する要因ではありません。開発者は誰でも、豊富なツールバーからお気に入りの大規模モデル、エージェント、パイプラインを自由に選択し、まるで積み木のようにコーディングすることなくドラッグ&ドロップして、ユニークで革新的なマルチエージェントアプリケーションを作成できます。

これらのドラッグ アンド ドロップ マルチエージェント アプリケーションが実際に使用可能であることを保証するために、AgentScope Workstation では、アプリケーションの正確性を確認するための静的ルール チェックを導入しています。

AgentScope Workstation は、さらなるカスタマイズと徹底的な開発を求める上級開発者向けに強力なサポートも提供します。

開発者は、アプリケーションを構成情報としてエクスポートし、AgentScope Workstationエンジンを使用して実行するか、AgentScope Workstationコンパイラを使用して構成情報をワンクリックでPythonコードに変換することができます。これにより、開発者はコードをさらに編集・最適化し、より洗練されたパーソナライズされたアプリケーション調整が可能になります。

エージェントスコープコパイロット

AgentScope Copilotは、AgentScopeフレームワーク自体を基盤として構築された開発アシスタントであり、マルチエージェントアプリケーションの開発において開発者が直面する問題の解決を支援するように設計されています。その技術的実装は、マルチエージェント会話、検索拡張生成(RAG) 、エージェント呼び出し(Mention)など、多くの機能を組み合わせています。

AgentScope Copilotとのインタラクションにおいて、開発者はガイドアシスタントに直接問い合わせて支援を受けるか、チュータリングアシスタントコーディングアシスタントといった専用のインテリジェントアシスタントを呼び出して、より専門的で具体的な回答を得ることができます。具体的には、コーディングアシスタントは、開発者がフレームワーク内の様々なモジュールの定義と使用方法を迅速に理解し、より適切なプログラミングの提案を提供するのに役立ちます。

AgentScope CopilotはAgentScopeフレームワークのRAGモジュール上に構築されており、LlamaIndexなどの一般的なデータ取得フレームワークや様々なベクターデータベースタイプをサポートしているほか、様々な大規模言語モデルとの統合もサポートしています。開発者は二次開発を迅速に行い、プロジェクト向けに独自のCopilotアシスタントを簡単に構築できます。

透明かつ制御可能な開発プロセス

ユーザーフレンドリーなアプリケーション開発プロセスは、開発者にとって制御可能かつ透明性が保たれている必要があります。

しかし、マルチエージェントシナリオでは、モデルAPIの種類や呼び出しインターフェースが多岐にわたります。モデルAPIの使用コストを効果的に管理・監視し、リソースの無駄や予期せぬ出費を回避することは、リソース監視機能にとって大きな課題となります。

例えば、検索エンジンを使用する際に複雑なウェブページを大規模モデルの入力として使用すると、大きなオーバーヘッドが発生しますが、開発者はこれに気づかないことがよくあります。この問題に対処するため、AgentScope は以下を実装する Monitor モジュールを設計しました。

自動 API コスト統計: さまざまなモデル API のトークンの使用状況を正確に記録し、現在のコストを自動的に計算して、開発者がモデル API コストのすべての支出を完全に把握できるようにします。

予算設定と超過アラート:開発者は各モデルAPIに予算上限を設定できます。総費用が予算を超過した場合、システムが自動的にアラートを発動し、開発者に確認と調整を促すことで、超過支出を防止します。

カスタム監視メトリックをサポート: プリセット モデル API 関連のメトリックに加えて、Monitor では、検索ツールのオーバーヘッド、データ ストレージ サービスのオーバーヘッド、ネットワーク トラフィックなどの他の監視メトリックをカスタマイズできるため、開発者はアプリケーションのステータスの包括的かつ自動的な監視を実行できます。

モニターモジュール

すぐに使える開発リソース

AgentScope には豊富なユーティリティ関数、エージェント、アプリケーション例が含まれており、開発者は最小限の変更で独自のマルチエージェント アプリケーションを簡単に作成できます。

ユーティリティ関数:AgentScopeは、Web検索、データベースクエリ、ファイル操作、テキスト処理など、様々な種類のユーティリティ関数をサポートしており、カテゴリごとに異なる実装が用意されています。例えば、Web検索レベルでは、AgentScopeは既にBing、arXiv、DBLPといった複数の検索エンジンをサポートしています。

エージェント:AgentScopeには、基本対話、フォーマットされた対話、推論、RAG、分散エージェントなど、様々な機能を持つ様々な組み込みエージェントが含まれています。開発者は、異なるパラメータで初期化するだけで、エージェントを目的のエージェントインスタンスに特化させることができます。

アプリケーション例:AgentScopeには、会話型ゲーム配信型など、様々なアプリケーションがあらかじめ組み込まれています。これらの例は、開発者の開発コストを削減し、アプリケーション開発のためのテンプレートとリファレンスを提供します。

AgentScope の組み込みリソースを開発者がより良く、より早く理解できるように、AgentScope ではチュートリアルAPIドキュメント、設計ペーパーなどの豊富で詳細なドキュメントが提供されており、開発者が AgentScope をより良く理解して使用できるようになっています。

安定性と信頼性

大規模モデルに基づくマルチエージェントアプリケーションは、モデルの錯覚やモデル指示への追従能力の不足など、多くの新たな課題に直面しています。マルチエージェントアプリケーションの安定的かつ信頼性の高い動作を保証するために、AgentScopeはまずアプリケーション内で発生するエラーを分類し、それに応じた包括的なフォールトトレランスメカニズムとカスタムフォールトトレランス処理を提供します。

ランダム性に対するフォールトトレランス:ランダムエラーは、不安定なネットワーク状況やモデルによって生成されるコンテンツの不確実性によって引き起こされることが多く、大規模なモデルに基づくアプリケーションを構築する際に最もよく見られるエラーの種類です。これらのエラーは多くの場合非常に些細で、特定が困難です。そのため、AgentScope は組み込みの再試行メカニズムを使用してこのようなランダムエラーをフィルタリングおよび遮断し、開発者がアプリケーションのオーケストレーションに集中できるようにします。

ルールベースのフォールトトレランス:アプリケーションで発生するエラーの一部は、ルールによって修正できます。例えば、大規模なモデルで特定の形式のレスポンスを生成する必要があるとき、モデルが余分なコンテンツを生成することがあります。そのため、事前定義されたルールを使用してこの余分なコンテンツを切り捨てることで、アプリケーションの正常な動作を確保できます。

モデルベースのフォールトトレランス:マルチエージェントアプリケーションの特徴の一つは、大規模モデルの機能を活用してエラーを修正することです。AgentScopeは、大規模モデルに入力情報とエラー情報を提供し、大規模モデルの理解と知識を活用してエラーを修正します。

エージェント/開発者のフォールトトレランス:事前定義されたルールや大規模なモデルではエラーを解決できない場合、開発者やエージェントの介入が必要となることがよくあります。そのため、AgentScopeはそのようなエラーに遭遇すると、エラーの属性、エラーメッセージ、入出力情報をフォーマットして開発者またはエージェントに提供し、問題解決を支援します。

最適化のヒント

マルチエージェントアプリケーションのパフォーマンス向上は、大規模モデルからのプロンプトの品質に大きく依存します。優れたプロンプトは、アプリケーションの成功確率を大幅に高めます。AgentScopeプログラミングフレームワークは、開発者がアプリケーションを継続的に最適化できるように、プロンプト調整モジュールを提供します。

自動提案生成:開発者にとって、適切な提案を生成することは、多くの場合、時間と労力を要する作業です。AgentScopeには、コンテキスト内学習(ICL)を活用し、開発者のアプリケーションシナリオに基づいて必要な提案を生成するインテリジェントエージェントがプリロードされており、開発者が迅速に開発を開始できるよう支援します。

サンプル入力のサポート:AgentScopeでは、開発者は複数のサンプルをテンプレートとして同時に入力できます。AgentScopeはこれらのサンプルに基づいて、特定の下流タスク向けのプロンプトを生成できます。

動的最適化プロンプト:アプリケーションの運用中、大規模モデルのプロンプトは、実行状況に基づいて、エラーを回避するための新しいルールの追加など、さらなる調整が必要になります。AgentScopeはこのプロセスを自動化します。エージェントと開発者、そして環境とのインタラクションに関する履歴データが、プロンプト調整の基礎となります。AgentScopeは、現在のシナリオに基づいてエージェントのシステムプロンプトを変更し、運用中のエージェントのパフォーマンスを向上させます。

分散並列

マルチエージェント・プログラミング・フレームワークであるAgentScopeは、当初からエージェント間の連携効率の向上を最優先に設計されており、分散モードを採用しています。このモードでは、複数のエージェントを異なるプロセスやマシン上で実行できるため、コンピューティングリソースを最大限に活用し、運用効率を向上させることができます。AgentScopeの分散性には、以下の重要な特徴があります。

自動並列最適化:AgentScopeの分散設計はアクタープログラミングパラダイムに準拠しており、アプリケーションプロセスオーケストレーションにおける異なるエージェント間の潜在的な並列性を自動的に識別し、自動並列最適化を実行することで運用効率を向上させます。さらに、各エージェントはローカルマシンまたはリモートマシン上で独立して実行できるため、コンピューティングリソースを最大限に活用し、大規模な導入をサポートします。

極めて低い学習曲線:AgentScopeは、開発者を分散システムの技術的な実装の詳細から完全に解放します。これにより、開発者は分散マルチエージェントアプリケーションをゼロコストで開発したり、既存のマルチエージェントアプリケーションを分散モードに変換したりすることができます。分散アプリケーションへの移行において、AgentScopeの分散アプリケーションオーケストレーションは、ローカライズされたオーケストレーション手法と完全に互換性があるため、開発者は分散システムの背景知識がなくても、分散マルチエージェントアプリケーションを容易にオーケストレーションできます。

大規模展開をサポート:AgentScopeは現在、1台のマシン(64コア、8基のA100 GPU)で16,000以上のエージェントインスタンスの同時実行をサポートしており、マシン数に応じてスケールを直線的に拡張できます。例えば、AgentScopeは4台のマシンで構成されるクラスタで、30秒以内に64,000以上のエージェント呼び出しを完了できます。この機能により、エージェントの大規模な並列処理とシミュレーションが可能になります。

ローカルモードから分散モードへの変換

マルチモーダルサポート

AgentScope は、開発者がマルチモーダルデータとモデルを用いて強力なマルチエージェントアプリケーションを構築できるようにします。開発者がオーケストレーションされたマルチエージェントアプリケーションをより直感的かつ便利に操作できるように、AgentScope は開発者フレンドリーで使いやすいインタラクティブインターフェースである AgentScope Studio を提供します。このインターフェースは、テキスト、サウンド、画像など、様々なモダリティからのデータを鮮明に表示し、開発者が作成したエージェントアプリケーションを最も直感的に操作し、調整できるようにします。

エージェントスコープスタジオ

今後も、AgentScope は開発者にさらなる開発の利便性を提供し続け、より多くの開発者が AgentScope オープンソース コミュニティに参加して、より興味深いマルチエージェント アプリケーションを探索してくれることを期待しています。

AgentScope オープンソースリポジトリのアドレス:

https://github.com/modelscope/agentscope

ぜひお試しください:

https://agentscope.aliyun.com