Skip to content

Instantly share code, notes, and snippets.

@yokawasa
Last active September 6, 2025 00:49
Show Gist options
  • Save yokawasa/83559d96da5cb11e290fd1ead3800a3a to your computer and use it in GitHub Desktop.
Save yokawasa/83559d96da5cb11e290fd1ead3800a3a to your computer and use it in GitHub Desktop.
AI Agent System Architecture Overview

アーキテクチャ概要

graph TD
  subgraph クライアント
    APP[PC/Mobileアプリ]
  end
  APP --> GW[APIゲートウェイ]
  GW --> ORCH[Agent Orchestrator]
  ORCH --> POL[ポリシー/ガードレール]
  ORCH --> PLAN[プランナー]
  PLAN --> EXEC[ツール実行エンジン]
  EXEC --> TOOLS[API/DB/MCP Tools]
  ORCH --> MEM[メモリ]
  MEM --> VDB[(ベクトルDB)]
  MEM --> KV[(KVS)]
  ORCH --> LLM[(LLM)]
  ORCH --> OBS[Observability]
  GW --> AUTH[認証/認可]
  AUTH --> IDP[(IdP)]
  GW --> RL[レート制御]
  subgraph オフライン処理
    ETL[ETL/Indexing] --> VDB
    TRAIN[Fine-tune/RAG前処理] --> VDB
  end
Loading

このアーキテクチャは、ユーザからのリクエストを受け取り、AIエージェントが安全かつ拡張可能に動作するための基本構成を示す。

  • クライアント層: WebやモバイルのUIからリクエストを送信
  • エッジ層: APIゲートウェイを通じて、認証・認可、レート制御などの基本的なセキュリティ機能を提供
  • Agent Orchestrator: 中心コンポーネントであり、ポリシーによる安全性の確保、プランナーによるタスク分解、メモリとの連携、LLMへの問い合わせなどを統合
  • ツール実行エンジン: Web APIやデータベース、MCPツール群など外部リソースを安全に呼び出し、エージェントの能力を拡張
  • メモリ層: ベクトルDBやキー・バリュー ストアを通じて長期知識やセッション情報を保持し、RAG(Retrieval-Augmented Generation)を支援
  • オフライン処理: ETLやIndexing、Fine-Tuningなどのバッチ処理により、ベクトルDBを最新の状態に保ち、エージェントの知識基盤を継続的に更新
  • Observability: 全体の動作をメトリクス・ログ・トレースとして収集し、監視や改善に役立てる
@yokawasa
Copy link
Author

mermaid version:

info
Loading

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment