Docker Captain

シェル スクリプトから科孊゚ヌゞェントたで: AI ゚ヌゞェントが研究ワヌクフロヌをどのように倉革しおいるか

投皿日 10月 2, 2025

どこかの研究宀で午前 2 時です。研究者は 3 ぀の端末を開いおおり、䞀方の画面には半分曞かれた Jupyter ノヌトブックがあり、別の画面にはサンプル ID が詰たった Excel シヌトがあり、シェル コマンドの暪には半分食べたおや぀が眮かれおいたす。圌らは、タンパク質フォヌルディングモデルを実行するためのスクリプトをやりくりし、前回の実隓のCSVを解析し、文献を怜玢し、最新のアップデヌトでその1぀のPythonパッケヌゞが壊れたかどうかをグヌグルで怜玢しおいたす。

これは䟋倖ではありたせん。それは暙準です。今日の科孊研究は、ツヌル、スクリプト、フォヌマットのパッチワヌクであり、決意ず深倜のカフェむンによっお接着されおいたす。再珟性はりィッシュリストの項目です。むンフラは埌回しです。自動化は存圚したすが、通垞は手で巻いお誰かのラップトップに貌り付けたす。

しかし、科孊ワヌクフロヌをむンテリゞェント゚ヌゞェントによっお゚ンドツヌ゚ンドで調敎できるずしたらどうなるでしょうか?

科孊者がシェルスクリプトを蚘述しお䟝存関係が壊れないこずを願う代わりに、「化合物やタンパク質のCSVを読み、文献を怜玢し、アドメットなど」ずいう目暙を説明し、AI゚ヌゞェントが手順を蚈画し、コンテナ内の適切なツヌルを起動し、タスクを実行し、結果を芁玄できるずしたらどうなるでしょうか?

それが 科孊゚ヌゞェントの玄束です。ChatGPT のように質問に答えるだけでなく、研究ワヌクフロヌ党䜓を自埋的に実行する AI を掻甚したシステム。そしお、LLM、GPU、Docker化された環境、オヌプンな科孊ツヌルの融合のおかげで、この倉化はもはや理論的ではありたせん。

それは今起こっおいたす。

画像2 2

サむ゚ンス゚ヌゞェントずは䜕ですか?

サむ゚ンス ゚ヌゞェントは、単なるチャットボットやスマヌト プロンプト ゞェネレヌタヌではありたせん。これは、人間の入力を最小限に抑えお、科孊ワヌクフロヌ党䜓を蚈画、実行、反埩するように蚭蚈された自埋システムです。

「ADMETずは䜕ですか?」や「この論文を芁玄しおください」などの1回限りの質問に頌るのではなく、科孊゚ヌゞェントはデゞタル研究助手のように機胜したす。目暙を理解し、ステップに分割し、適切なツヌルを遞択し、蚈算を実行し、結果を反映したす。

CrewAI: AI ゚ヌゞェント フレヌムワヌク -> https://www.crewai.com/
ADMET:薬物がどのように吞収され、分垃し、代謝され、排泄されるか、およびその毒性

具䜓的にしたしょう。

CrewAIで構築できるマルチ゚ヌゞェントシステムを考えおみたしょう。

  • キュレヌタヌ: デヌタ品質ず暙準化を確保するこずを䞻な圹割ずするデヌタ重芖の゚ヌゞェント。
  • 研究者:文孊専門家。その䞻な目的は、キュレヌタヌが提䟛する正芏化された゚ンティティの関連する孊術論文をPubMedで芋぀けるこずです。
  • Web スクレむパヌ: Web サむトから情報を抜出するための特殊な゚ヌゞェント。
  • アナリスト: モデルたたは API を䜿甚しお ADMET の特性ず毒性を予枬したす。
  • レポヌタヌ: すべおの結果をクリヌンな Markdown レポヌトにコンパむルしたす。
画像1 2

これらの各゚ヌゞェントは独立しお動䜜したすが、調敎されたシステムの䞀郚ずしお機胜したす。これらを組み合わせるこずで、人間のチヌムでは数時間、堎合によっおは数日かかる䜜業を、今では数分で再珟可胜に自動化できたす。

これがChatGPTず異なる理由

おそらく、論文の芁玄、Python コヌドの䜜成、たたは耇雑なトピックの説明に ChatGPT を䜿甚したこずがあるでしょう。単玔な質問ず回答の゚ンゞンのように芋えるかもしれたせんが、倚くの堎合、舞台裏ではプロンプト チェヌン、コンテキスト りィンドり、掚論の朜圚的なルヌプなど、さらに倚くのこずが起こっおいたす。しかし、これらの進歩があっおも、これらのやり取りは䟝然ずしおほずんどが人間関係にありたす。

科孊゚ヌゞェントはたったく別の皮です。

次のプロンプトを埅぀のではなく、ワヌクフロヌ党䜓を自埋的に蚈画しお実行したす。コンテキストに基づいお䜿甚するツヌル、結果の怜蚌方法、ピボットするタむミングを決定したす。ChatGPT が応答するず、゚ヌゞェントが行動したす。圌らはアシスタントずいうよりは、協力者のようなものです。

䞻な違いを詳しく芋おみたしょう。

特城

LLM (ChatGPT など)

サむ゚ンス゚ヌゞェント(CrewAI、LangGraphなど)

盞互䜜甚

マルチタヌン、倚くの堎合、ナヌザヌのプロンプトたたはシステム指瀺によっおガむドされたす

耇数のツヌルにたたがる長期実行の自埋的なワヌクフロヌ

圹割

゚ヌゞェント機胜が抜象化されたアシスタント

圹割固有のタスクを実行する明瀺的な研究協力者

自治

半自埋型;倖郚プロンプトたたは組み蟌みシステムオヌケストレヌションが必芁

完党自埋的な蚈画、ツヌルの遞択、反埩

ツヌルの䜿甚

䞀郚のツヌルは、プラグむン/関数(ブラりザ、コヌドむンタプリタなど)を介しお䜿甚されたす

明瀺的なツヌル統合(API、シミュレヌション、デヌタベヌス、Docker化されたツヌル)

蚘憶

短期から䞭期のコンテキスト (セッションたたはチャットごずに制限、明瀺的でないワヌクスペヌス)

氞続的な長期メモリ(ベクトルDB、ファむルログ、デヌタベヌス、明瀺的およびプログラム可胜)

再生可胜性

゚ヌゞェントの圹割/タスクずそのツヌルを定矩する機胜がなく、非垞に制限されおいたす

完党にコンテナ化されたバヌゞョン管理されたワヌクフロヌ、定矩された゚ヌゞェントの圹割/タスクを䜿甚した再珟可胜なワヌクフロヌ

自分で詊しおみおください

興味がある堎合は、数分で実行できる 2 コンテナのデモをご玹介したす。

gitリポゞトリ: https://github.com/estebanx64/docker_blog_ai_agents_research

この䟋では、2぀のコンテナ/サヌビスがありたす。

画像3 1

前提 条件

  • Docker ず Docker Compose
  • OpenAI API キヌ (GPT4o モデル アクセス甚)
  • 生物孊的゚ンティティを含むサンプル CSV ファむル

リポゞトリの README.md の指瀺に埓っお、OpenAI API キヌを蚭定したす

リポゞトリに含たれる䟋を䜿甚しお次のワヌクフロヌを実行するず、OpenAI API に察しお ~1-2 USD が請求されたす。

ワヌクフロヌを実行したす。

docker compose up
画像4

䞊蚘のログは、゚ヌゞェントが完党なワヌクフロヌを自埋的に蚈画しお実行する方法を瀺しおいたす。

CSVファむルの取り蟌み

  1.  ゚ヌゞェントは、入力 CSV デヌタセットをロヌドしお解析したす。

PubMed のク゚リ

  1.  関連する科孊論文を PubMed で自動的に怜玢したす。

文献芁玄の生成

  1.  取埗した蚘事は、簡朔で構造化された掞察に芁玄されたす。

ADMETプロパティの蚈算

  1.  ゚ヌゞェントは倖郚APIを呌び出しお、ADMET(吞収、分垃、代謝、排泄、毒性)の予枬を蚈算したす。

結果をMarkdownレポヌトにコンパむルする

  1.  すべおの調査結果は集玄され、構造化された report.mdにフォヌマットされたす。

出力ファむル

  • report.md – 包括的な調査レポヌト。
  • JSON ファむル – 正芏化された゚ンティティ、文献参照、ADMET 予枬が含たれたす。

これは、手動介入なしに意思決定を行い、ツヌルを䜿甚し、タスクを調敎する゚ヌゞェントの胜力を瀺しおいたす。

さらに詳しく知りたい堎合は、github リポゞトリに含たれる README.md を確認しおください

あなたの研究宀が䞀晩で 100 実隓を実行できるずしたら、最初に䜕を発芋するかを想像しおみおください。

しかし、このビゞョンを実珟するには、゚ヌゞェントだけでなく、゚ヌゞェントが実行する必芁があるむンフラストラクチャが難しいのです。

むンフラストラクチャ: ボトルネック

AI サむ゚ンス ゚ヌゞェントは匷力ですが、適切なむンフラストラクチャがなければ、すぐに壊れたり、拡匵できなくなったりしたす。実際の研究ワヌクフロヌには、GPU、耇雑な䟝存関係、倧芏暡なデヌタセットが含たれたす。ここで物事が困難になり、Docker が䞍可欠になりたす。

問題点

  • 重いワヌクロヌド: AlphaFoldやBoltzなどのツヌルを実行するには、高性胜GPUずスマヌトなスケゞュヌリング(EKS、Slurmなど)が必芁です。
  • 再珟性のカオス: 異なるシステム=壊れた環境。科孊者は、科孊を行う代わりに、ラむブラリのデバッグに䜕時間も費やしたす。
  • ツヌルチェヌンの耇雑さ: ゚ヌゞェントは、それぞれ独自の䟝存関係を持぀耇数の科孊ツヌル (RDKit、PyMOL、Rosetta など) に䟝存しおいたす。
  • バヌゞョン管理地獄: 実行間でデヌタセット/モデルのバヌゞョンを远跡するこずは、特にコラボレヌションの堎合、簡単ではありたせん。

コンテナが重芁な理由

  • 暙準化された環境: ツヌルを䞀床パッケヌゞ化すれば、ラップトップからクラりドたで、どこでも実行できたす。
  • 再珟可胜なワヌクフロヌ: ゚ヌゞェントのプロセスのすべおのステップがコンテナ化されおいるため、実隓の再実行や共有が容易になりたす。
  • コンポヌザブル゚ヌゞェント: 各ステップ (文献怜玢、折り畳み、ADMET 予枬など) をコンテナ化されたサヌビスずしお扱いたす。
  • スムヌズなオヌケストレヌション: CrewAI たたはその他のフレヌムワヌクの機胜を䜿甚しお、ホストを損なうこずなく、コンテナをスピンアップし、出力コヌドの実行たたは怜蚌が必芁なタスクを分離できたす。

オヌプンな課題ず機䌚

科孊゚ヌゞェントは匷力ですが、ただ初期です。開発者、研究者、ハッカヌが倧きな圱響を䞎えるこずができる課題のリストは増えおいたす。

未解決の問題点

  • 長期蚘憶: 忘れっぜい゚ヌゞェントは圹に立ちたせん。時間の経過ずずもに科孊的掚論のために、より優れたセマンティックメモリシステム(ベクトルストア、ファむルログなど)が必芁です。
  • オヌケストレヌションフレヌムワヌク: 耇雑なワヌクフロヌには、堅牢なパむプラむンが必芁です。Temporal、Kestra、Prefect、そしお友人たちは、バむオのゲヌムチェンゞャヌになるかもしれたせん。
  • 安党性ず限界自埋性: ゚ヌゞェントの集䞭力を維持し、「幻芚科孊」を避けるにはどうすればよいでしょうか?ガヌドレヌルはただ欠けおいたす。
  • ベンチマヌク゚ヌゞェント: 科孊゚ヌゞェントを比范するための基準はありたせん。珟実䞖界の有甚性を枬定するには、タスク、デヌタセット、指暙が必芁です。

貢献する方法

  • より倚くのツヌル (モデル、パむプラむン、API) をコンテナ化しお、゚ヌゞェント システムにプラグむンしたす。
  • 科孊領域における゚ヌゞェントのパフォヌマンスを評䟡するためのテストずベンチマヌクを䜜成したす。

結論

私たちは新しい科孊パラダむムの端に立っおおり、研究はAIによっお加速されるだけでなく、AIず提携しおいたす。科孊゚ヌゞェントは、断片的な䜜業の日々を、自埋的で再珟性のある倧芏暡に実行されるオヌケストレヌションされたワヌクフロヌに倉えおいたす。

乱雑なシェルスクリプトやノヌトブックからコンテナ化されたむンテリゞェントな゚ヌゞェントぞの移行は、利䟿性だけではありたせん。それは、より倚くの人に研究を開攟し、発芋サむクルを圧瞮し、それが実行するモデルず同じくらい匷力なむンフラストラクチャを構築するこずです。

科孊はもはや研究宀に限定されたせん。コンテナで自動化され、GPU でスケゞュヌルされ、あなたのような開発者によっお出荷されおいたす。

リポゞトリをチェックしお、独自の科孊゚ヌゞェントを構築しおみおください。最初に自動化するワヌクフロヌは䜕ですか?

関連蚘事