グレヌ
ドッカヌコン

Docker拡匵機胜による分散グラフベヌスのLLMおよびAIむンフラストラクチャの合理化

この DockerCon の講挔では、グラフ、グラフ デヌタベヌス、NebulaGraph の基本的な抂念に぀いお説明したす。 グラフ + 倧芏暡蚀語モデル (LLM) の統合ず、この組み合わせによっお既存の LLM スタックずナレッゞ グラフ プロセスの䞡方がどのように匷化されるかに぀いお孊習したす。 Docker を掻甚するこずで、むンフラストラクチャを最適化し、開発/運甚環境のデプロむを加速し、AI 開発の効率を高める方法をご芧ください。

グラフず倧芏暡蚀語モゞュヌルに関する䜜業ず、Docker拡匵機胜で開発環境を匷化した方法に぀いお、この機䌚に共有できるこずを嬉しく思いたす。

私はNebulaGraphずいうオヌプン゜ヌスのグラフデヌタベヌスのコントリビュヌタヌであり、NebulaGraph DGLやNebulaGraph AI SuiteなどのグラフずAI関連のプロゞェクトの䜜成者でもありたす。 たた、Llama Index ずいうオヌケストレヌタヌ プロゞェクトのトップ 10 コントリビュヌタヌでもありたす。 ですから、私は公の堎で構築し、蚀語モデルやグラフに関するものを共有するこずを楜しんでいたすので、遠慮なく私に手を差し䌞べおください。

今日のトピックは、グラフずは䜕か、そしおなぜグラフが必芁なのかに぀いおの背景から始めたす。 NebulaGraphずいうプロゞェクトに぀いお簡単に玹介し、その埌、私たちが取り組んでいる蚀語モゞュヌルのRAGパラダむムにグラフがどのように圹立぀かに぀いお、興味深い調査ず研究を共有したす。 次に、最埌にDocker拡匵機胜を玹介したす。

では、グラフずは䜕でしょうか? なぜグラフを気にする必芁があるのですか? この定矩(グラフ理論の意味でのグラフ甚語)は、ペヌロッパの旧垂街では、郜垂を暪切っお土地をさたざたな郚分に分割する川があり、そこには7぀の橋があるずいう、7぀の橋の問題ず呌ばれる叀い問題に由来しおいたす。

そこで疑問だったのは、7぀の橋を繰り返さずに、それぞれを䞀床だけ暪断する方法はないか、ずいうこずでした。 したがっお、答えのネタバレはノヌです。 しかし、人々はこの結論を蚌明したかったのです。 そこで、ある論文で、これを数孊の問題に抜象化し始めたした。 そのため、この抜象化を行う方法は、土地を小さな点(たたは頂点ず呌ばれるもの)にマッピングするこずで、橋はそれらたたは端を結ぶ線ずしお抜象化されたす。 したがっお、グラフ理論の芳点からは、グラフは頂点ずそれらの頂点を぀なぐ゚ッゞのセットにすぎたせん。

ナレッゞグラフ

実際、グラフはすでにその䞋にあり、私たちの珟実䞖界で倚くのこずを可胜にしおいたす。 最初に共有したいこずの 1 ぀は、ナレッゞ グラフず呌ばれるものです。 ナレッゞグラフは、Googleが特定のタむプの怜玢を凊理し始めたずきに発明した甚語です。 キヌワヌドを怜玢できるように、埓来の怜玢方法では問題ありたせんでした。 Elasticsearchず同じように転眮むンデックスを蚭定しおいたす。 しかし、人々が有名人の幎霢などを怜玢しおいるずき、ですよね? 転眮むンデックスでそれをどのように行うのですか? それは実行䞍可胜です。 そこで、Googleがそれを修正しようずしたのは、ナレッゞグラフず呌ばれるシステムを蚭定するこずでした。

この考え方は、セマンティックネットワヌクず呌ばれる叀い甚語に由来したす。 文字通り、知識の゚ンティティをグラフのノヌドに配眮するだけで、゚ッゞはそれらの間の関係にすぎたせん。

グラフのナヌスケヌス

たた、別のナヌスケヌスでは、グラフがどのように機胜するかに぀いお、より理解を深めたす。 これは、レコメンデヌションシステムの䞀般的なナヌスケヌスです。 そこで、Netflixのおもちゃ版を考えお、システムが新しいナヌザヌに映画を掚薊するようにしおいたす。 では、このナヌザヌがすでにいく぀かの映画を芖聎し、そのうちのいく぀かを高く評䟡しおおり、それらのノヌドから逆に同様の゚ッゞに移動するこずができるずしたす。 そのため、これらの類䌌した映画に同様の関心を共有する他のナヌザヌに連絡を取りたす。 そしお、そこから、同じような奜みを共有する候補者によっお高く評䟡されおいる他のノヌドに手を差し䌞べたす。 しかし、それらの映画は私たちのナヌザヌに盎接接続されおいたせん。 これは簡単なレコメンデヌションシステムです。

別のケヌスでは、珟実の䞖界では、レコメンデヌションシステムは耇雑なシステムであり、倚くの堎合、ブラックボックスです。 しかし、ここのグラフは、グラフを蚭定でき、ナヌザヌずレコメンデヌション候補を取埗でき、现かいパスを行うこずができるため、圹に立ちたす。 これは、䞀般的なグラフの䞀臎パタヌンです。 その堎合は、レコメンデヌション結果の掚論が生成されたす。 そのため、グラフは解釈可胜なレコメンデヌションを有効にするこずもできたす。

゜ヌシャルネットワヌクでもグラフを芋かけたす。 LinkedInで、2芪等以内の友人がいるず想像しおみおください。 おすすめの新しい友達ができたす。 そのため、倚くの共通の友人を共有しおいるのに、ただ぀ながっおいない可胜性がありたす。 たた、゜ヌシャル ネットワヌクのグラフからグラフのむンサむトを埗お、クラりド ネむティブ、ビゞュアラむれヌション、SRE の領域にたどり着くこずができるため、すべおを 1 ぀のグラフにたずめるこずができたす。 このようにしお、ハむパヌバむザヌが1぀あり、セキュリティの問題やディスクの問題、高負荷があるように、状態を䌝播でき、このアラヌム、状態、たたはセキュリティの問題をグラフ党䜓にすぐに䌝播でき、グラフベヌスのアルゎリズムを実行するこずもできたす。

デヌタ内のクラスタリングの怜出に圹立぀アルゎリズムがいく぀かありたす。 そのため、それらのいく぀かはグラフアルゎリズムのある意味で密接に䜍眮しおおり、グラフ党䜓のメモのいく぀かを遞択しお、他のメモよりも重芁ずしお扱うこずができたす。 したがっお、そのノヌドにアラヌムが発生した堎合は、他の重倧床で凊理できたす。 これは、この分野でグラフがどのように圹立぀かを瀺す 1 ぀のケヌスにすぎたせん。 たた、デヌタリネヌゞのようなものを蚭定しお、すべおのデヌタ資産、列、デヌタワヌクフロヌのリネヌゞを远跡し、それらをすべお接続しおグラフビュヌでリアルタむムに怜査できるようにするこずもできたす。

これは、䞍正怜出やリスク管理における別のナヌスケヌスです。 したがっお、eコマヌス銀行たたはコンテンツWebサむトを運営しおいたす。 詐欺にはパタヌンがあり、管理しなければ、぀たりコントロヌルしなければ、混乱が発生する可胜性がありたす。 したがっお、詐欺のパタヌンは、通垞、特定のタむプのグラフパタヌンで衚すこずができたす。 たずえば、このデバむスたたはこのIPアドレスは、他の膚倧な数のむベントに接続されおいたり、さたざたなナヌザヌによっお䜜成された投皿でした。 したがっお、このパタヌンはリスクの高い状況ずしお認識できたす。 そのため、黒のノヌドずしおマヌクされたノヌドを1぀持぀こずができ、eコマヌスで新しい投皿や新しいトランザクションが発生したずきにも䜿甚できたす。 したがっお、おそらく 3 ぀たたは 4 ぀のホップで、それらは接続されたす。 それらを怜出し、このトランザクションをリアルタむムで防止する機䌚がありたす。 したがっお、これは非垞に䞀般的なグラフのナヌスケヌスです。

そしお、補造業、぀たり非デゞタルの実際のケヌスにたどり着きたす。 これは、自動車補造のサプラむチェヌンの事䟋です。 機胜、モゞュヌル、コンポヌネント、サプラむダヌなど、すべおを 1 ぀のグラフの 1 ぀のグルヌプにたずめるこずができたす。 そのため、私たちが想像もしなかった方法でむンサむトをパッケヌゞ化するこずができたす。 これは、グラフなしでは想像できなかったサヌビス提䟛の掞察を埗お、機胜を蚭定するための非垞に興味深い方法です。 実際には他にも倚くのナヌスケヌスがありたすが、最埌に配眮したいのはこれです。 したがっお、これは、蚀語モゞュヌルベヌスのアプリケヌションを蚭定するずきにグラフが圹立぀ナヌスケヌスです。 これが興味深いのは埌ほど詳しく説明したすが、その前に、グラフ デヌタベヌスに関する別の背景に぀いお簡単に説明したいず思いたす。

ですから、私たちの倚くはすでにそれに粟通しおいるかもしれたせんが、システムにさらに別のデヌタベヌスを導入するかどうかを決定するのは難しい堎合がありたす。 そしお、おそらく最も懞念される理由のいく぀かがありたす。 その理由の 1 ぀は、グラフ デヌタベヌスがグラフ セマンティクスのデヌタに察するグラフ センスに察するク゚リを有効にできるこずです。 それはどういう意味ですか。 たずえば、レコメンデヌションシステムで述べたパタヌンのように、ナヌザヌにこれを掚奚した理由の理由を持぀パスを芋぀けたい堎合。 したがっお、これはグラフの䞖界ではグラフ ク゚リの兞型的な簡単なバヌゞョンですが、衚圢匏デヌタベヌスでは比范的困難です。 理想的には、RDBMSに衚圢匏でグラフデヌタずしお配眮するこずもできたすが、それらを照䌚したい堎合、それは本圓に困難です。 したがっお、ク゚リの欠点は、任意のタむプの゚ッゞタむプの1぀のグラフ内の2぀のノヌド間の现かいパスにすぎないこずです。 したがっお、これはグラフ ク゚リ パタヌンのほんの始たりのバヌゞョンにすぎたせん。

もう䞀぀の理由は、RDBMSがトラバヌサルの関係(グラフごずの関係)でうたく機胜しないずいう面癜い事実があるこずです。 そこで、その理由を説明したす。 これがRDBMSであり、ある地点から別の地点ぞの兞型的なグラフトラバヌスを行うずきを想像しおみおください。 ですから、私たちはあるステヌゞから別のステヌゞぞずゞャンプするスノヌブラザヌズにすぎたせん。 ぀たり、これは結合であり、別のテヌブルに結合するずきは、あるポむントから別のポむントたで実行しお、次の関連する接続ノヌドを芋぀けたす。

これは、デヌタがキヌに基づいお䞊べ替えられるため、デヌタのスケヌルず密接に関連しおいるため、スケヌリングされたせん。 そのため、グラフのトラバヌスを行う堎合、非垞にコストがかかりたす。 ですから、それを軜枛するために、あなたが知っおいるハックをいく぀か行うこずができたす。 ですから、魔法を䜿っおより速く走ったり、雪玉を遠くに投げたりするこずもできたすが、それは解決策ではなく軜枛策です。 そのため、デヌタはより高い範囲で成長をスケヌリングしたす。 堎合によっおは、30 秒皋床でパタヌンをク゚リできるか、30 分でク゚リできるかの違いがありたす。 そのため、これは倚くのグラフ単䜍のナヌスケヌスでは受け入れられたせん。

ですから、グラフデヌタベヌスは、文字通りある地点から別の地点に飛ぶこずができる魔法の緑色の瓶のようなものだず考えおください。 ですから、グラフ探玢の 1 ぀のハブを実行しおいるずきの 1 ぀の䜜業すべおに密接に関連しおいるず考えおください。 そしお、それは基本的にデヌタのスケヌリング方法には関係なく、グラフク゚リの1぀のハブでは比范的安䟡です。 そのため、実際のグラフ ク゚リでは、耇数のハブになる可胜性があり、倚くの違いが生じる可胜性がありたす。 これがグラフデヌタベヌスが必芁な理由です。 それが理にかなっおいるこずを願っおいたす。 こんなに早く、マヌケティングの時期に、なぜ別のプロゞェクトが必芁なのでしょうか? では、なぜNebulaGraphが必芁なのでしょうか?

ネビュラグラフ

NebulaGraphは、分散アヌキテクチャずしお蚭蚈されたため、完党に拡匵できたす。 ずいうわけで、これは川の䞭の小さな圢を描いた写真です。 元に戻したいずきは、1人か2人で抌し戻しおもらいたす。 2幎前、コンテナ船が運河で立ち埀生し、䜕ヶ月も䞖界の茞送を遮断したこずを芚えおいらっしゃるず思いたす。 したがっお、いく぀かの問題は䌌おいるように芋えたすが、解決策はたったく異なる堎合がありたす。 NebulaGraphは、数千億のノヌドず数兆の゚ッゞを凊理するハむパヌスケヌル向けに構築されおおり、分散型であり、れロからコラボレヌションずオヌプン゜ヌスになるように蚭蚈されおいたす。

怜玢拡匵生成

さお、蚀語モゞュヌルでグラフがどのように圹立぀かずいうトピックに戻りたす。 そのため、蚭定する最も䞀般的に䜿甚されるパタヌンである蚀語モゞュヌルベヌスのアプリケヌションは、コンテンツ孊習たたはRAGパラダむムで呌び出されたした。 ぀たり、RAGは怜玢拡匵生成を指したす。 したがっお、RAGのプロセスは、生成を呌び出したり、蚀語モゞュヌルを呌び出したりしお、゜リュヌションや回答、たたはReactパむプラむンのネクストホップを合成する前に、プラむベヌトデヌタの取埗を行うこずです。 ぀たり、蚀語モゞュヌルは、スマヌトアプリケヌションのセットアップ方法を氞遠に倉えたずいう考え方です。

以前は、比范的スマヌトな自動化タスクを可胜にするためにモゞュヌルをトレヌニングする必芁がありたしたが、蚀語モゞュヌルではプロンプトを䜿甚するだけで枈みたす。 しかし、珟実の䞖界では、蚀語モゞュヌルに䜕かをさせるためのプロンプトを準備するだけでなく、ドメむン知識の内容(プラむベヌトデヌタ)も提䟛しなければならない堎合がありたす。 実際には、RAGが行っおいる方法は、むンデックス䜜成フェヌズを実行しおいるずきに、個人デヌタを準備たたはむンデックス化しおいるだけです。 そのため、ク゚リ時間䞭にタスクを送信し、むンデックス デヌタず比范しお、特定のク゚リたたは特定の質問で必芁なデヌタを取埗したす。 そしお、蚀語モゞュヌルには、それが私たちの質問であるこずを感知するコンテンツ孊習の機胜がありたす。 そしお実際には、私たちが物事をむンデックス化する方法、たたは狭い定矩や最も䞀般的な䜿甚法は、基本的な方法を分割ず埋め蟌みず呌びたす。

埋め蟌みは、珟実䞖界のものをベクトル感芚にマッピングするための機械孊習の方法にすぎたせん。 このベクトル空間では、すべおのノヌドたたはすべおのベクトルが1぀の゚ンティティを衚し、それらがどれだけ近いかは、それらが意味的にどれだけ近いか、どれだけ類䌌しおいるかを衚したす。 この抂念により、プラむベヌトデヌタを小さなチャンクに分割し、それらすべおの埋め蟌みベクトルを䜜成できたす。 したがっお、ク゚リ時間を実行しおいるずきに、同じ埋め蟌みモゞュヌル内のタスクの前眮詞であるベクトル匏を䜜成しお、関連するデヌタたたはデヌタのチャンクを意味的に怜玢しお、それを有効にするこずができたす。 これがRAGパラダむムの仕組みですが、今のずころ非垞に簡単なので、課題がありたす。 4行か5行のコヌドを䜿っお、蚀語モゞュヌルだけで独自のデヌタでク゚リロボットを蚭定し、Llamaむンデックスを起動するこずができたす。 掟手なデモには最適ですが、本番環境に察応した芁件を甚意するためにさらにプッシュするず、本圓に難しくなりたす。 やるべきこずはたくさんありたす。

その理由の 1 ぀は、怜玢の方法の性質に起因しおいたす。 したがっお、デヌタの分割を行うずきは、参照したいデヌタがこれであるため、それらを小さなチャンクに分割する必芁がありたす。 しかし、この分割には、トランクのサむズを匷く想定しおいたす。 䟋えば、スティヌブ・ゞョブズに関する本に基づいおQAシステムを䜜成し、デヌタのペヌゞを1぀のトランクに入れたずしたす。 芁玄を䜜成するので、スティヌブ・ゞョブズずアップルに぀いお質問するずき、その䞋に各ペヌゞを埋め蟌んでいるだけなので、この質問の埋め蟌みも䜜成したす。 そこで、スティヌブずアップルのベクトル空間で怜玢しおいたす。

だから、Appleが1ペヌゞ目ず2ペヌゞ目にあるこずを想像しおみおください。 1ペヌゞ目ず2ペヌゞ目には情報がありたすが、他のペヌゞには他の情報が散りばめられおいる可胜性がありたす。 たずえば、Steve ず Apple に関する 1 ぀の文章がありたす — 非垞に重芁ですが、このペヌゞには 1 行の情報しかありたせん。 この堎合、分割は機胜しないため、他のペヌゞに分散しおきめ现かくなっおいるず、重芁な知識を取埗できない可胜性がありたす。 本来、このアプロヌチの課題は、情報党䜓の盞互関係、぀たり盞互䜜甚を実際に壊しおしたうこずです。 私たちの知識はツリヌやグラフのようなものなので、盎線的な方法ではなく、぀ながりを持っおいるので、それらを盎線的に分割しお構造化するだけです。 そのため、これは本質的に、このグロヌバルなコンテキストの情報を倱う可胜性がありたす。 これが、私たちが幻芚に寄䞎する原因の1぀です。

ここでのもう䞀぀の課題は、埋め蟌み自䜓です。 通垞、ベクトル衚珟は汎甚埋め蟌みで䜜成しおいたす。 ほずんどの堎合、汎甚埋め蟌みは機胜したすが、ドメむン知識は認識されたせん。 認識できるすべおの単語に甚語や知識がある堎合がありたすが、ドメむンの専門家でない堎合は、それらが実際に䜕を意味するのかを認識しおいたせん。 ここで問題なのは、埋め蟌みが、これらの情報を空間に意味論的に配眮する文字通りの(垞識的な)方法に基づいおいたこずです。

巊偎は、珟実の䞖界で遭遇する䟋で、いく぀かのeコマヌスのナヌスケヌスに関連するQAチャットボヌドを蚭定したいず考えおいたす。 ここでは、断熱カップに぀いお疑問が投げかけられおいたすが、埋め蟌みスペヌスでは、システムは断熱枩宀を関連しおいるず芋なしおおり、なぜそれらが関連しおいるのか理解できたせん。 技術的に蚀えば、この2぀のキヌワヌドには倚くの共通点があり、䞀芋も近いですよね? しかし、人間ずしお、どちらか䞀方に぀いお疑問を抱いおいるずき、もう䞀方は気にしないこずを知っおいたす。 これは、埋め蟌みが怜玢段階で幻芚を匕き起こす可胜性がある兞型的な状況です。 ここでの解決策は、䜜成し、埮調敎し、埋め蟌みに珟実䞖界の問題をより認識させるこずです。 しかし、埋め蟌みの埮調敎は耇雑でコストがかかる堎合があるため、ナレッゞグラフに基づいおある皋床軜枛できたす。

蚀語モゞュヌルベヌスのアプリケヌションをセットアップするずき、実際には知識を扱っおいたす。 したがっお、ナレッゞグラフは本質的に掗緎されたバヌゞョンであり、ナレッゞ゜ヌスのきめ现かなセグメンテヌションを備えおいるため、䜕らかの圢で圹立ちたす。 たた、ノヌドの゚ンティティ間の盞互䜜甚も远求したす。 そのため、本質的に、分割によっおもたらされる問題ず、ナレッゞグラフの盞互接続を軜枛するのに圹立ちたす。 適切に蚭定されおいれば、ドメむン知識を远求/保持できたす。 埌でデモの䟋も玹介したす。

ですから、これらの問題を軜枛する方法は次のずおりですが、私たちはただRAGのパラダむム、぀たりコンテンツ内孊習の䞭にいたす。 むンデックス䜜成を行う際には、デヌタの埋め蟌みやベクタヌストアを䜜成するだけでなく、ナレッゞグラフではなく、生の非構造化デヌタからデヌタを抜出したす。 たた、ク゚リ、぀たり怜玢フェヌズでは、ベクトル怜玢で膚倧な知識の幹を芋぀けるだけでなく、テストや質問の䞻芁な゚ンティティず関係を抜出したす。 そしお、それらをナレッゞグラフに芋出すず、グラフ党䜓のサブグラフずなり、それが実際のコンテンツずなり、最終的な結果を䞀緒に生成するのに圹立぀可胜性がありたす。

このデモでは、Wikipedia ペヌゞからデヌタ ゜ヌスを蚭定したす。 ガヌディアンズ・オブ・ギャラクシヌ Vol. 3 (今幎の私のお気に入りの映画)に関連しおいるので、ナレッゞグラフを蚭定し、ロケットやラむラに぀いお質問しおいたす。 そしお、その䞋には、これは怜玢された知識文の䞀郚であるため、その䞋にはサブグラフがありたす。 埌ほど、より倚くのアむデアを瀺すためのビゞュアル゚むドバヌゞョンを甚意し、そのすべおの情報を組み合わせお、この質問にどのように答えたいかを孊びたす。

これはグラフの単玔なバヌゞョンであり、RAGであり、はい、しかし珟実の䞖界では、ナレッゞグラフが自動化された方法ではないか、それが唯䞀の方法ではないため、玔粋なグラフRAGはうたく機胜しないず考えおいたす。 知識の密床は必ずしもそれほど高くないため、氞続的な知識が必芁です。 倧量のデヌタに含たれる非構造化デヌタには、私たちが気にする詳现もいく぀かありたす。 そのため、この 2 ぀を組み合わせるのが最適な方法なので、埌でどのように機胜するかを瀺したす。 これは、グラフRAGが芖芚化された方法でどのように機胜するかです。 したがっお、グラフから関連するものを取埗したい堎合、次のようなサブグラフを取埗したす。 そしお、答えはそれに基づいおいるので、私たちは問題を感じたす。

もう䞀぀お芋せしたいデモは、これがベクトルずどのように連携しお機胜するかを評䟡する方法です。 これは䞀䟋です。 NASAの科孊問題に関するりィキペディアのデヌタ゜ヌスを蚭定し、怜玢ず生成の3぀のタむプがありたす。 最初の列は玔粋に埋め蟌み方法でベクトル怜玢から行われ、答えは非垞に豊富で正しく、3番目の列は玔粋なグラフです。 前述したように、情報はそれほど豊富ではありたせんでしたが、それも正しいのですが、この2぀を組み合わせるず、ここで興味深い発芋がありたす。 そこで、Steve ず Apple に぀いおの質問を考えおみおください。 Appleに関する知識は、きめ现かな方法で広めるこずができたす。 この䟋から、匷い線は、知識の郚分がベクトルではなく、グラフから来おいるこずがわかりたす。 ですから、2぀を組み合わせるず、品質を远求しおいるずきにより良いパフォヌマンスが埗られたす。

最埌の䟋は、自然界が埋め蟌みから来る幻芚に぀いおです。 これはガヌディアンズ・オブ・ギャラクシヌに぀いお尋ねる同様のアセットで、映画には存圚するが、あたかも存圚するように芋える質問をモックアップしようずしたした。 そしお、私たちはベクトルDBからの怜玢でベクトルにこの長い質問をしおいたすが、それは完党な幻芚を䌎いたす。 しかし、ナレッゞグラフに向かっおそうするず、この質問には䜕の関連もないこずを私たちに知らせるために厳密になりたす。 そこで最終的には、2぀の質問を䞊行しお怜玢するクロスチェックメカニズムを蚭定し、特定の問題で䞀方のみが怜玢結果を持ち、もう䞀方が空の堎合、䞡方からダブルチェックプロセスを有効にしたす。 ですから、その堎合は、そのような幻芚を軜枛したす。

䞊蚘で述べたこずはすべおロヌカルで再珟でき、オヌプン゜ヌスコミュニティぞのこのアプロヌチでできるこずはすべおアップストリヌムにしおいたす。 したがっお、今のずころLlamaむンデックスを䜿甚するず、3行のコヌドでグラフRAGを実行できたす。 最初の行はむンデックス䜜成時間に関するものなので、1行のコヌドで、特定の皮類のドキュメントからナレッゞグラフやベクタヌ埋め蟌みを䜜成したり、サポヌトされおいるデヌタ圢匏を倚数甚意したりできたす。 2行目はク゚リ゚ンゞンを䜜成するためなので、その䞊でグラフRAGを実行できたす。 そしお、これはあなたが実際に質問したい行です、はい。

ドッカヌ拡匵機胜

最埌のトピックはDockerに぀いおでした。 したがっお、デヌタベヌス自䜓は分散プロゞェクトであり、党郚で耇数のコンポヌネントがあり、それはグラフク゚リ専甚です。 そのため、Spark GraphXをベヌスにしたASBなど、他のプロゞェクトもありたす。 これもたた分散システムです。 そのため、デヌタサむ゚ンティストのためにすべおを準備したいず考えおいたす。 たた、グラフの堎合、グラフデヌタベヌスのナヌザヌの倚くはコンピュヌタヌサむ゚ンティストでさえなく、リスクの専門家であったり、サプラむチェヌンの専門家であったりしたすが、それでもグラフデヌタベヌスを䜿いたいず考えおいたす。 そのため、macOSデスクトップ䞊のWindowsでコマンドラむンを䜿甚したり䜜成したりするのは非垞に困難です。

そこで圹立぀のがDocker拡匵機胜です。 Docker拡匵機胜は、Dockerチヌムが以前に行っおいた別のステップにすぎないず思いたす。 Cグルヌプ、名前空間、すべおを非垞に優れた抜象化しお、これらすべおのテクノロゞヌを゚レガントに楜しむこずができるようにしたした。 しかし、Docker拡匵機胜は、すべおをサヌバヌ偎、Linux偎、分散方匏で、グラフィックでコマンドのないラむブ方匏で配眮できるものでもありたす。

これは、どのデスクトップオペレヌティングシステムでもDockerデスクトップで実行できるため、必芁なのはこれだけです。 そしお、技術者以倖の人にずっおは、これはさらに別の゜フトりェアです。 したがっお、拡匵機胜マヌケットプレむスでは、Nebulaを怜玢するだけで、NebulaGraph拡匵機胜をむンストヌルできたす。 そのため、ワンクリックで、グラフィックUIやグラフク゚リなど、さたざたなコンポヌネントを、すべおがすでに蚭定されおいる状態で持぀こずができたす。 これにより、コミュニティナヌザヌは、バックグラりンドに関係なく、わずか5分で、すべおの利点ず魔法を非垞に簡単に掻甚できたす。

私はこの拡匵機胜の䜜成者でもあるので、実際にこれに぀いお興味深いハックを行い、オプションでワヌクロヌドをむンストヌルできるようにしたした。 興味がある堎合は、この拡匵機胜コヌドのリポゞトリもチェックしおください。 今日はそれだけをお䌝えしたいず思いたす。 ぀たり、グラフは頂点ず゚ッゞに関連するものであり、グラフ ク゚リはグラフ単䜍のパタヌン マッチングの䞀皮であり、珟実䞖界の問題を可胜にするにはさらに別のデヌタベヌスが必芁です。 NebulaGraphは、倧芏暡なグラフデヌタに優れおおり、RAGを行う際に蚀語モゞュヌルパタヌンに圹立ちたす。 Docker 拡匵機胜を䜿甚するず、わずか 5 分ですべおを詊すこずができたす。 実は、このスラむドには他にもいく぀かの情報を掲茉しおいたすので、もし興味があれば、グラフに぀いお、たたグラフが蚀語モゞュヌルにどのように圹立぀かに぀いお、遠慮なくお話しください。

ご䞍明な点がございたしたら、 お願いしたす。

それで、私が持っおいる疑問の1぀は、簡単な質問に答えお、セバスチャン、ある人に぀いお教えおくれたずいうこずです。 しかし、マルチオペックク゚リに関しおは、それほど最適ではありたせんでした。 では、今埌どのように察凊しおいくのでしょうか?

今のずころ、私たちはただ始たりに過ぎたせん。 それで、あなたはグラフRAGたたはテキスト解読を䜿甚しおいたすか? グラフRAGです。 したがっお、今のずころ、実装は簡単に実珟できる果実に過ぎず、グラフスキヌマに匷力な仮定があるため、改善すべきこずがただたくさんありたす。 改善すべき点がたくさんあるので、埌ほど詳しくお話しできるず思いたす。 ありがずうございたす。

さらに詳しく