生成 AI とエージェント AI: 開発者が知っておくべきこと

生成 AI (GenAI) とその背後にあるモデルは、開発者がコードを作成し、アプリケーションを構築する方法をすでに再構築しています。しかし、新しいクラスの人工知能、エージェント AI が出現しています。コンテンツ生成に重点を置く生成AIとは異なり、エージェントシステムは複数のステップにわたって計画、推論、アクションを実行できるため、インテリジェントで目標主導のエージェントを構築するための新しいアプローチが可能になります。

この投稿では、生成 AI とエージェント AI の主な違いについて説明します。具体的には、それぞれがどのように構築されるか、その課題とトレードオフ、およびDockerが開発者のワークフローのどこに適合するかについて説明します。また、 独自の生成AIアプリやエージェントを実際に構築 するのに役立つユースケースやスタータープロジェクトの例もあります。

GenAIとは?

生成AIは機械学習のサブセットであり、大規模な言語モデルを活用して、テキストやコードの作成から、プロンプトや入力に基づく画像や音楽の作成まで、新しいコンテンツを作成します。生成 AI モデルの核心は予測エンジンです。膨大なデータでトレーニングされたこれらのモデルは、シーケンスで次に何が起こるかを推測することを学習します。これは、文中の次の単語、画像内の次のピクセル、またはコードの次の行である可能性があります。GenAI オートコンプリートをステロイドと呼ぶ人もいます。一般的な例としては、ChatGPT、Claude、GitHub Copilot などがあります。

生成AIの使用例

GenAI の主なユースケースは、コーディング、画像とビデオの制作、執筆、教育、チャットボット、要約、ワークフローの自動化、および消費者およびエンタープライズ アプリケーション全体です (1)。生成モデルを使用して AI アプリケーションを構築するには、開発者は通常、ユースケースを検討し、目標とパフォーマンスのニーズに基づいてモデルを選択することから始めます。その後、モデルはリモート API (GPT-4 や Claude などのホストモデルの場合) を介してアクセスするか、ローカルで実行するか (Docker Model Runner または Ollama を使用)。この違いにより、開発者が GenAI を使用して構築する方法が形作られます: ローカルでホストされるモデルはプライバシーと制御を提供しますが、クラウドでホストされるモデルは多くの場合、柔軟性、最先端のモデル、およびより大規模なコンピューティング リソースを提供します。 

開発者は、ユーザー入力/プロンプトを提供するか、モデルを微調整して動作を形成し、使い慣れたツールやフレームワークを使用してアプリのロジックに統合します。チャットボット、仮想アシスタント、コンテンツ ジェネレーターのいずれを構築する場合でも、コア ワークフローには、モデルに入力を送信し、その出力を処理し、その出力を使用してユーザー向けの機能を駆動することが含まれます。

GenvsAgent図 1

図 1:生成AIの仕組みを示す簡単なアーキテクチャ図

GenAI システムは、その洗練さにもかかわらず、基本的に受動的なままであり、人間の入力が必要です。彼らは、より広範な目標を理解したり、過去のやり取りの記憶を保持したりすることなく、静的なプロンプトに応答します (明示的にシミュレートするように設計されていない限り)。彼らは、トレーニングデータのパターンを認識することによって、なぜ何かを生成するのかを知らず、どのように生成しているのかしか知りません。

生成AIの応用例

何百万人もの開発者が Docker を使用してクラウドネイティブ アプリを構築しています。同様のコマンドと使い慣れたワークフローを使用して、生成 AI ツールを探索できるようになりました。Docker のモデル ランナーを使用すると、開発者は 手間をかけずにローカル モデルを実行できます。Testcontainers は、サービスと依存関係に軽量のコンテナを提供することで、統合 テストを迅速に開始 してアプリを評価するのに役立ちます。 

ここでは、作業を開始するのに役立つ例をいくつか紹介します。

1。ローカルでのモデルの実行を開始する

Go、Python、Node.jsで構築されたシンプルなチャットボット Web アプリケーションで、ローカル LLM サービスに接続して AI を活用した応答を提供します。

2。Docker Model Runner を使用して AI チャットボットをゼロから作成する方法

AI チャットボットをゼロから作成し、Docker Model Runner を使用してローカルで実行する方法を学びます。

3。Spring AI と Docker Model Runner を使用して Java で生成 AI アプリを構築する

Spring AI、Docker Model Runner、Testcontainers を使用して、Java で RAG を使用して生成 AI アプリを構築します。 

4。Goose と Docker Model Runner を使用した簡単なプライベート AI アシスタントの構築

プライベートでスクリプト化可能で、実際の開発者ワークフローを強化できる独自の AI アシスタントを構築する方法を学びます。

5。AI を活用したテスト: 動的モック API のための Microcks での Docker Model Runner の使用

Docker Model Runner と Microcks を使用してテストするための AI 拡張モック API を作成する方法を学びます。動的で現実的なテストデータをローカルに生成し、開発サイクルを短縮します。

エージェントAIとは何ですか?

エージェント AI の業界標準の定義は 1 つではありません。AI エージェント、エージェント システム、エージェント アプリケーションなどの用語が同じ意味で使用されていることがわかります。簡単にするために、単に AI エージェントと呼びます。

AI エージェントは、目標を達成するために主導権を握り、意思決定を行い、複雑なタスクを実行するように設計された AI システムです。個々の人間のプロンプトにのみ応答する従来の生成AIモデルとは異なり、エージェントは複数のステップにわたって計画、推論、アクションを実行できます。このため、エージェントは、オープンエンドまたは緩やかに定義されたタスクに特に役立ちます。一般的な例としては、OpenAI の ChatGPT エージェントや、プログラミング タスクをエンドツーエンドで完了する Cursor のエージェント モードなどがあります。  

エージェント AI の使用例

AI エージェントの導入に成功した組織は、カスタマー サービスとサポート、内部業務、販売とマーケティング、セキュリティと不正検出、専門的な業界ワークフローなど、影響の大きいさまざまな分野で AI エージェントを使用しています (2)。しかし、可能性にもかかわらず、ビジネスの文脈から見ると、導入はまだ初期段階にあります。キャップジェミニの最近のレポートによると、実験を超えてエージェントAIの実装に移行した企業はわずか14%でした。

エージェントAIの仕組み

実装はさまざまですが、ほとんどの AI エージェントは、モデル、ツール、オーケストレーション レイヤーの 3 つの主要コンポーネントで構成されています。 

  • モデル: 高レベルの目標と理由を解釈し、実行可能なステップに分割します。
  • ツール: エージェントが呼び出すことができる外部関数またはシステム。モデル コンテキスト プロトコル (MCP) は、エージェントを外部ツール、データ、およびサービス に接続するための事実上の標準として台頭 しています。 
  • オーケストレーション層: これは、すべてを結び付ける調整ロジックです。LangChain、CrewAI、ADKなどのフレームワークは、ツールの選択、メモリ、計画、状態と制御のフローを管理します。 
GenvsAgent図 2

図 2: マルチエージェント システムの動作の概要アーキテクチャ図。

エージェントを構築するために、開発者は通常、ユースケースをエージェントが実行する必要がある具体的なワークフローに分割し、主要なステップ、決定ポイント、およびジョブを完了するために必要なツールを特定することから始めます。そこから、適切なモデル (またはモデルの組み合わせ) を選択し、必要なツールを統合し、オーケストレーション フレームワークを使用してすべてを結び付けます。より複雑なシステム、特に複数のエージェントが関与するシステムでは、各エージェントはマイクロサービスのように機能し、より大きなワークフローの一部として 1 つの特定のタスクを処理します。 

エージェントスタックにはいくつかの新しいコンポーネントが導入されていますが、開発プロセスの多くは、クラウドネイティブアプリケーションを構築した人にとっては馴染みのあるものに感じられるでしょう。疎結合コンポーネントの調整には複雑さがあります。特にエージェントが機密性の高いツールやデータにアクセスできるようになると、セキュリティの対象範囲が広がります。コミュニティの一部がエージェントを「新しいマイクロサービス」と呼び始めたのも不思議ではありません。モジュール式で柔軟性があり、構成可能ですが、安全なアーキテクチャ、信頼性の高いツール、開発から本番環境までの一貫性も必要です。 

エージェントAIの応用例

エージェントがよりモジュール化され、マイクロサービスのようなものになるにつれて、Docker のツールは、エージェント アプリケーションの構築と実行を開発者をサポートするように進化しました。 

GenvsAgent図 3

図 3: Compose、Model Runner、MCP Gateway などを含む Docker の AI テクノロジー エコシステム。

モデルをローカルで実行する場合、特にプライバシーとデータの機密性が重要なユースケースでは、Docker Model Runner はモデルをスピンアップする簡単な方法を提供します。モデルがローカルハードウェアに対して大きすぎる場合、 Docker Offload を使用すると、開発者はローカルファーストのワークフローと開発制御を維持しながら、 クラウド内のGPUリソースを活用 できます。 

エージェントがツールにアクセスする必要がある場合、 Docker MCP ToolkitGateway を使用すると、セキュアな MCP サーバーを簡単に検出、構成、および実行できます。Docker Compose は、モデル、ツール、フレームワークなどの エージェント コンポーネントをサポートし、 開発から本番環境まですべてを簡単に調整できるようになり、何百万人もの開発者にとって頼りになるソリューションであり続けています。

開始に役立つように、一般的なフレームワークで構築されたエージェントの例をいくつか紹介します。シングルエージェントとマルチエージェントのセットアップの組み合わせ、ローカルとクラウドホストの両方の単一モデルと複数のモデルを使用し、クラウド GPU にオフロードされた例、エージェントが MCP ツールを使用してアクションを実行する方法のデモンストレーションが表示されます。これらはすべて、単一の Docker Compose ファイルだけで実行されます。

1。チャットボットを超えて: イベント駆動型エージェントの行動

この GitHub Webhook 駆動型プロジェクトでは、エージェントを使用してトレーニング リポジトリの PR を分析し、自動的に閉じられるかどうかを判断し、コメントを生成してから PR を閉じます。 

2。LangGraph を使用した SQL エージェント

このプロジェクトでは、 LangGraph を使用して SQL データベースにクエリを実行して自然言語の質問に答える AI エージェントを示します。

3。Spring AI + DuckDuckGo

このプロジェクトでは、 Spring AI とMCPツール DuckDuckGo を使用して自然言語の質問に答えるSpring Bootアプリケーションを示します。

4。CrewAIで自律的なマルチエージェントのバーチャルマーケティングチームを構築する

このプロジェクトでは、CrewAI で構築された自律的なマルチエージェントの仮想マーケティング チームを紹介します。調査からコピーライティングまで、高品質のエンドツーエンドのマーケティング戦略の作成を自動化します。

5。Agno で構築された GitHub Issue Analyzer

このプロジェクトでは、 Agno で構築された協調マルチエージェント システムを実証し、コーディネーター エージェントと 3 サブエージェントを含む特殊なエージェントが連携して GitHub リポジトリを分析します。 

6。マルチエージェントファクトチェッカーの2

このプロジェクトでは、Agent2Agent SDK (A2A) と OpenAI を使用して構築された協調マルチエージェント システムを実証し、トップレベルの監査エージェントがワークフローを調整して事実を検証します。

その他のエージェントの例は 、こちらでご覧いただけます。 

生成AIとエージェントAI:主な違い

属性

生成AI(GenAI)

エージェントAI

の定義に当てはまること

プロンプトに基づいてコンテンツ(テキスト、コード、画像など)を生成するAIシステム

定義された目標を達成するために複数のステップにわたって計画、推論、行動する AI システム

コア動作

入力に基づいて次の出力を予測します (例: 次の単語、トークン、ピクセル)

主体性があり、意思決定が可能で、行動を実行し、主体的に活動できる

ChatGPT、Claude、GitHub Copilot

ChatGPTエージェント、カーソルエージェントモード、Manus

主な使用例

コード生成、コンテンツ作成、要約、教育、チャットボット、画像/ビデオ作成

カスタマーサポートの自動化、IT運用、マルチステップ戦略、セキュリティ、不正検出

採用段階

コンシューマーおよびエンタープライズアプリケーションで広く採用されています

初期段階; 14% の企業が大規模に利用

開発ワークフロー

– モデルを選択

– プロンプトまたは微調整

–アプリロジックと統合

– ユースケースをステップに分割する

– モデルとツールの選択

– フレームワークを使用してエージェントフローを調整する

一般的な課題

モデルの選択と一貫性のある信頼性の高い動作の確保

より複雑なタスクの調整とセキュリティサーフェスの拡張

アナロジー

ステロイドのオートコンプリート

新しいマイクロサービス

最終的な感想

生成AIで構築する場合でも、エージェントの可能性を探る場合でも、AIへの取り組みを倍増させる組織が増えるにつれ、AIの習熟度は開発者にとって中核的なスキルになりつつあります。生成AIは、比較的シンプルな統合と人間の入力により、コンテンツ駆動型アプリケーションへの迅速なパスを提供します。一方、エージェント AI は多段階の戦略を実行でき、マイクロサービスの複雑さとモジュール性に似た目標指向のワークフローを可能にします。 

エージェント AI システムはより強力ですが、オーケストレーション、ツール統合、セキュリティに関する新たな課題ももたらします。それぞれをいつ使用するか、Docker Model Runner、Offload、MCP Gateway、Compose などの AI ソリューションを使用して効果的にビルドする方法を知ることは、開発を合理化し、本番アプリケーションを準備するのに役立ちます。

Docker を使用して最初の AI アプリケーションを構築する

プライベート LLM チャットボットのプロトタイピングを行う場合でも、仮想チームのように機能するマルチエージェント システムを構築する場合でも、今こそ実験の時です。Docker を使用すると、すでに知っているのと同じ使い慣れたコマンドとワークフローを使用して、簡単に開発し、安全に拡張し、迅速に移動できる柔軟性が得られます。

エージェント AI アプリケーションを構築する方法→

さらに詳しく

参照

  1. Chip Huyen, 2025, 基盤モデルを使用したAIエンジニアリング構築アプリケーション, O'Reilly
  2. ボルネット・パスカル、 2025、 エージェント人工知能、AIエージェントを利用してビジネス、仕事、生活を再発明する、かけがえのない出版  

投稿カテゴリ

関連記事