graph TD
subgraph クライアント
APP[PC/Mobileアプリ]
end
APP --> GW[APIゲートウェイ]
GW --> ORCH[Agent Orchestrator]
ORCH --> POL[ポリシー/ガードレール]
ORCH --> PLAN[プランナー]
PLAN --> EXEC[ツール実行エンジン]
EXEC --> TOOLS[API/DB/MCP Tools]
ORCH --> MEM[メモリ]
MEM --> VDB[(ベクトルDB)]
MEM --> KV[(KVS)]
ORCH --> LLM[(LLM)]
ORCH --> OBS[Observability]
GW --> AUTH[認証/認可]
AUTH --> IDP[(IdP)]
GW --> RL[レート制御]
subgraph オフライン処理
ETL[ETL/Indexing] --> VDB
TRAIN[Fine-tune/RAG前処理] --> VDB
end
このアーキテクチャは、ユーザからのリクエストを受け取り、AIエージェントが安全かつ拡張可能に動作するための基本構成を示す。
- クライアント層: WebやモバイルのUIからリクエストを送信
- エッジ層: APIゲートウェイを通じて、認証・認可、レート制御などの基本的なセキュリティ機能を提供
- Agent Orchestrator: 中心コンポーネントであり、ポリシーによる安全性の確保、プランナーによるタスク分解、メモリとの連携、LLMへの問い合わせなどを統合
- ツール実行エンジン: Web APIやデータベース、MCPツール群など外部リソースを安全に呼び出し、エージェントの能力を拡張
- メモリ層: ベクトルDBやキー・バリュー ストアを通じて長期知識やセッション情報を保持し、RAG(Retrieval-Augmented Generation)を支援
- オフライン処理: ETLやIndexing、Fine-Tuningなどのバッチ処理により、ベクトルDBを最新の状態に保ち、エージェントの知識基盤を継続的に更新
- Observability: 全体の動作をメトリクス・ログ・トレースとして収集し、監視や改善に役立てる
mermaid version: