【エンタープライズLLM】自社のビジネス環境に併せた大規模言語モデル(LLM)を作るには? 企業向けLLMの紹介 #enterprise-llm
エンタープライズLLMとは?
エンタープライズLLM(Enterprise LLM)は、LLM(大規模言語モデル:Large Language Model)に対して企業独自のビジネス環境に併せて知識を追加したカスタマイズしたモデルです。通常のLLMとは異なり、公開・一般化されている世界知識に加えて、エンタープライズLLMは企業の利用目的・ニーズに合わせて知識を追加・編集し、企業の事業領域において役立つものにしたものです。
エンタープライズLLMは以下のような特徴を有しています。
- ドメイン知識・企業固有の知識の統合: エンタープライズLLMは、特定の業界やビジネス領域に関する豊富なデータや知識を統合できます。これにより、企業独自の知識や業界特有の専門用語などの文脈を理解し、適切な情報や解決策を提供します。
- セキュリティとプライバシー: エンタープライズLLMは、企業のセキュリティとプライバシーを保護するための環境で動作させる必要があります。企業機密情報や個人データの取り扱いにおいて、高い機密性と安全性を確保が必要です。
- カスタマイズ可能性・ビジネス追従性: エンタープライズLLMは、企業独自のニーズに合わせてカスタマイズ可能します。特定の業務プロセスやタスクに対応するために、知識の追加・編集、モデルの訓練や調整を行います。これらは企業のビジネスの成長や変化に伴い、継続的に行う必要があります。
今後、AI企業がAI・LLMを活用し業務効率を向上させ、またサービスの価値向上を行うために、エンタープライズLLMは必須なツールとなります。一般に公開されているLLMに加えて、ドメイン知識・企業固有の知識のを有したエンタープライズLLMを企業自身で作り上げることにより、より価値の高いユーザへのサービス提供、精度の高い意思決定、業務の効率化を行うことが、市場競争の中で優位性を確立するために必要になります。
エンタープライズLLMの重要なポイント
LLMをエンタープライズ領域で活用する際には、以下のポイントに特に注意が必要です。
- 有効性・精度検証: エンタープライズLLMの出力結果を人間の判断と比較し有効性を明確にする重要です。精度検証の基準、フレームワークを設計し、有効性・精度を高める必要があります。
- 顧客データの保護とプライバシー確保: 企業向けのプロダクトでは、顧客データや個人情報の保護が最優先です。データからの個人情報の削除や、適切なアクセス権限管理やデータ暗号化などのセキュリティ対策が必要です。特に、ファインチューニングやRAGのような手法を使用する場合は、データの適切なフィルタリングが不可欠です。
- データ漏洩の防止: エンタープライズLLMが学習したデータや生成した情報が意図せず外部に漏洩しないように注意が必要です。
エンタープライズLLMの活用に際して、これらのポイントを考慮し利用することで、企業はより安全かつ効果的な利用を実現し、ビジネスに付加価値をもたらすことができます。
エンタープライズLLMを構成する3つの要素
上図ではエンタープライズLLMを構成するための3つの方向の要素を示しています。ドメイン特化LLM、クローズソースLLM、オンプレミスLLMの3つ構成要素を段階的に組み合わせる必要があります。
クローズドソースLLM
この領域は、インターネット上で公開されているAIの進化するLLMの知識を活用することを示しています。具体的なモデルとしては「GPT-3.5/4」、「Bard」、「Claude」「Megatron Turing」などが存在します。
ドメイン特化LLM
特定の業界や分野に特化したLLMを使用することが重要となります。例として「Bloomberg GPT」、「BopMed LM」、「FinBERT」といったモデルが挙げられています。これらは金融、医療、ビジネスニュースなどの特定のドメインに最適化されたモデルです。
オンプレミスLLM
企業の内部データセンターなどで運用されるLLMを指しており、「Llama 2」、「Falcon 180B」、「CodeLlama」といったモデルがあります。これらは企業が自身のデータセンター内で管理し、プライバシーを保ちながらカスタマイズ可能なモデルです。中央の「エンタープライズLLM」は、これら3つの領域からのデータや知識を統合し、企業が利用する中心的なLLMを表しています。これにより、企業はクローズドソースの知識、ドメイン特化の専門知識、そしてオンプレミスでのカスタマイズ可能なモデルを組み合わせて、ビジネスに最適なAIソリューションを構築することができます。
エンタープライズLLMを構築する流れ
エンタープライズレベルの大規模言語モデル(LLM)を活用する戦略としては、先ほどの3つの構成要素をどのような順番で活用していくかが重要となります。
1. クローズドソースLLM
第1段階としては、社内AIポータルの構築として、社内データの外部流出制御や、利用ポリシーの徹底、プロンプトエンジニアリング、AI利用コスト集約管理、利用実態把握と管理が挙げられます。
業種特化型LLM
第2段階としては、業界特化型LLMの活用として、特定業界の正確なデータから、ハルシネーションが少ない情報源、業界に最適化されたトレーニングなどが挙げられます。
オンプレミスLLM
第3段階としては、ローカルLLMの構築として、企業に帰属したデータのカスタマイゼーション、AI活用の他社との差別化、企業独自データの流出は防止などが挙げられます。
最終的に、これらの戦略は「エンタープライズ LLM + RAG」という形になります。
エンタープライズLLMの技術
前述したようにエンタープライズLLMでは、「大規模言語モデル(LLM)」に加え、「検索強化生成(RAG:Retrieval-Augmented Generation)」という技術が必要になります。検索強化生成(RAG)は、情報の検索とテキストの生成を融合させた手法であり、大量の文書から必要な情報を抽出し、その情報をもとにテキストを作成することができます。特にエンタープライズ環境においては、RAGを用いることで、特定分野の専門知識や企業内の膨大な非構造化データを利用し、組織特有の知識を反映した精度の高い回答やコンテンツ生成が可能になります。
RAGの動作は、以下の二つの主要なステップに分けられます。
ステップ1:情報検索
ユーザーのクエリに基づき、広範なデータベースや文書群から関連する情報を探し出します。この段階では、類似度に基づく検索やキーワードによるマッチングなどの手法が活用されます。
ステップ2;テキスト生成
検索によって得られた情報を基に、大規模言語モデルが新たなテキストを生成します。このプロセスでは、検索結果を入力として使用し、クエリに応じた詳細な回答や関連コンテンツを作り出します。
エンタープライズLLMの提供サービスおよび活用事例
エンタープライズLLMのような企業向けLLMサービスは幾つかの会社から提供されています。以下に代表的なサービスを示します。(2024年4月時点)
会社名 | サービス名または活用事例 | 特徴 |
クラスメソッド株式会社 | 生成AIコンサルティング | 様々なファイル形式に対応し、社内の問い合わせ対応の効率化を図るためにエンタープライズなセキュリティ環境を提供しています。生成AI環境構築パッケージは、シングル・サインオンの認証環境など、エンタープライズレベルのセキュリティを各社のセキュリティ要件に合わせて構築します。自社のクラウド環境でログ管理や社内データ、対話記録の管理を行い、ユーザー利用状況を安全に管理できる環境を提供します。また、複数のLLMに対応し、自社データの登録も可能です。生成AI環境構築サービスは、AWS、Google Cloud、Azureなど、多様なクラウド環境での構築が可能です。利用するLLMも、OpenAIが提供するLLMからオンプレミスLLMまで様々なLLMを利用することができます。 |
クリエーションライン株式会社 | AI Knowledge Link(AI ナレッジ リンク) | 社内のナレッジを活用し、高い生産性を実現するためのセキュアな知識共有プラットフォームとなります。このプラットフォームは、カスタマイゼーションの自由度が高く、企業内のデータのプライバシー管理が完全にできます。また、ベクトルデータベースに加え、知識グラフによる検索精度の改善も可能です。 |
株式会社 セゾン情報システムズ | Enterprise向け生成AI導入支援サービス | GPT × Azure × Slackを活用した社内データの蓄積・活用 ・ビジネスメッセージングアプリ「Slack」を介して、生成AIの利用が可能です。 ・Microsoft社の「Azure OpenAI Service」を活用し、Azureの専用環境にて構築します。 ・入力データは大規模言語モデル(LLM)の再学習を行わず、お客様ごとに専用環境でのみデータを利用します。 ・ガイドラインの例を活用することで、社内での生成AIの利用に関するガバナンスを確保することも可能です。 |
株式会社AI Shift | AI Messenger Chatbot | 各企業専用のカスタマーサポート特化LLM 親会社であるサイバーエージェントが独自に開発した日本語LLMを活用し、カスタマーサポートに特化しています。 各企業専用LLMを構築し、企業ごとに学習を行うため、第三者によるデータの利用を心配することなく、より安全にサービスを利用できます。さらに、企業ごとのデータを使用するため、専門用語への対応や、企業独自の言い回しやフォーマットに合わせた受け答えが可能です。 |
株式会社野村総合研究所 NRIデジタル株式会社 | プライベートLLM(2024年春以降に提供予定) | 基盤モデルを公開しているMetaのLlama 2などのLLMを、ユーザーのニーズに合わせてカスタマイズし、NRIのデータセンターやユーザーのオンプレミス環境などで動作させます。金融機関など、特に高いレベルの情報セキュリティ統制を必要とする企業に向けて提供します。 ・機密・機微情報を安全に扱えるよう、プライベートクラウドやオンプレミス環境で動作します。 ・個別企業の業務に合わせてLLMをカスタマイズします。 ・「プライベート音声認識」などの周辺モジュールも提供します。 |
メルセデス・ベンツ | (活用事例)ChatGPT を使った車載音声制御 | この事例は、メルセデス・ベンツが、車内の音声制御にChatGPTを用いた取り組みです。MicrosoftのAzure OpenAI Serviceを通じて、OpenAIの大規模生成AIモデルの活用から、既存の「Hey Mercedes」機能を強化し、ナビゲーションクエリ、天気のリクエストなどにChatGPTの能力を加えています。自然な対話とフォローアップの質問をサポートしたことにより、ユーザーは自然な声を使用して会話を行うことができるようになり、より包括的な回答を受け取ることができたようです。 |
AWS | AWS Bedrock | AWS Bedrockは、エンタープライズ向けに設計されたサービスで、大規模言語モデル(LLM)を企業のプライベートなデータやカスタマイズされた要件に基づいて利用できるようにするプラットフォームです。このサービスは、 エンタープライズLLMの利用を容易にし、企業が自然言語処理の最先端技術を自社のデータと組み合わせて活用することを可能にするプラットフォームとして位置付けられます。これにより、顧客サービスの自動化、文書の自動生成、情報抽出、意思決定支援など、多岐にわたる用途での応用が期待されます。 |
Microsoft | Azure Chat | Azure Chatは、Microsoft Azureが提供するサービスの一つで、エンタープライズレベルでの大規模言語モデル(LLM)を活用したチャットボットや会話型AIの構築を可能にするプラットフォームです。エンタープライズLLMの文脈でAzure Chatを位置付ける際、その主な特徴として、高度な自然言語理解能力、カスタマイズ性、セキュリティとプライバシーの保護、そしてMicrosoftのクラウドエコシステムとの統合が挙げられます。 |
Google Cloud | Vertex AI | Google CloudのサービスであるVertex AIは、エンタープライズ向けの機械学習(ML)および人工知能(AI)ワークロードをサポートする統合プラットフォームです。Vertex AIは、モデルのトレーニング、デプロイメント、監視などの機械学習ワークフロー全体を統合し、シームレスな開発および運用環境を提供します。これにより、エンタープライズLLMの開発プロセスを効率化し、迅速なモデルの実装を可能にします。 |
まとめ
今回の記事では、企業でのLLMの活用で必要となるエンタープライズLLM(Enterprise LLM)の概要、活用方法、関連するサービスや技術について解説しました。エンタープライズLLMは、企業の業務効率化やサービス価値の向上において活用が期待されています。しかし、各々の企業に適したAI・LLMの活用は容易ではありません。自社の事業ドメイン・業務内容に合致しLLMを活用するためには、個別の知識の活用が必要です。企業独自のLLM(=エンタープライズLLM)を作っていくための道筋を戦略として作っていくことが、AI時代の今後の企業の成長の鍵と言えるでしょう。
お気軽にご相談ください
生成AIについて興味関心があり、
ご相談があれば以下よりお問い合わせください