トップ10ユースケース: データリネージュ #Neo4j #ユースケース
この記事は1年以上前に投稿されました。情報が古い可能性がありますので、ご注意ください。
本ブログは、「Neo4j」社の技術ブログで2021年3月8日に公開された「Top 10 Use Cases: Data Lineage」の日本語翻訳です。
グラフテクノロジーは未来です。グラフデータベースは、データ間の関係を効果的に保存するだけでなく、新しい種類の関係を追加したり、新しいビジネス要件にデータモデルを適応させたりする柔軟性も備えています。
しかし、現在、企業はどのようにグラフデータベースを使用して、困難な問題を解決しているのでしょうか?このブログシリーズでは、グラフテクノロジーのトップ10のユースケースを取り上げ、それぞれについて実際の事例を紹介します。
今回は金融機関が抱える膨大なデータリネージュ※の問題を解決するために、グラフテクノロジーを活用する方法をご紹介します。多くの金融機関は、複数のデータサイロを跨いでデータを追跡するという、難しい要件に直面しています。本ブログでは、スイス最大の銀行機関であるUBSにおけるユースケースを取り上げて、グラフテクノロジーがこの問題を解決する方法を紹介します。
※データリネージュ:データの流れや由来を追跡・可視化すること
ユースケース:データリネージュ
リスクモデリングには、さまざまな要件があります。特に大手銀行・ヘッジファンド・積極的な投資会社などでは、投資・保有・金融商品・詳細な価格データの複雑なネットワーク上でデータのつながりを追跡する必要があります。
データリネージュにグラフテクノロジーを使用する理由
銀行やその他の規制対象金融機関は、元となる信頼性のあるデータソースに到達するまでに、多くの複雑なレベルを通じてデータの依存関係を追跡する必要があります。BCBS 239※のような厳しい要件に起因するデータリネージュの課題には、従来のデータストレージシステムが提供するよりも、はるかに柔軟で持続的なものが必要です。
元の信頼性のあるデータソースにたどり着くまで、個別のデータサイロを経由してデータを逆方向に追跡する必要があります。また、データは共通の識別子が必要なのにも関わらず、部署やグループによってバラバラの用語やアルゴリズムを使用していることがあります。そして場合によっては同じ組織内でもバラバラであることもあります。
データの構造や場所によって、単一のデータベースで対応することが不可能な場合も少なくありません。そして皮肉なことに、すべてを単一のデータベースに移すと、データをたどることがより困難になる場合があります。
企業全体の情報を単一のデータモデルに統合するためにはグラフテクノロジーが必要です。グラフデータベースでは、単一の真実のデータソースにアクセスでき、複雑なデータや隠れたデータのつながりも、数ミリ秒以内に照会することができます。
※BCBS 239:バーゼル銀行監督委員会による「実効的なリスクデータ集計とリスク報告に関する諸原則」のこと
活用例:UBS
UBSのソリューションアーキテクトであるSid Hannif氏は、最新かつリアルタイムのデータを活用してシームレスなCXを提供するために、何百ものシステムやサイロ化したデータを結合する必要があり、苦労していました。
「私たちは、タイムリーで正確かつ完全な情報提供を求められていましたが、ユーザが自ら情報を取りに行く必要がありました。」と彼は言います。
UBSは1854年創業の歴史ある企業です。従業員数は約6万人で、金融事業はウェルスマネジメント、投資銀行、資産運用、コーポレートセンター、データサービスなどの部門に分かれています。
データサービス部門では、Sidと彼のチームは12のデータドメインとサブデータセットを管理し、そのデータはさまざまな方法や経路を通じて他のシステムや部門に配信されます。ユーザアカウントデータはリレーショナルデータベースに格納されていました。統合すべきデータ数が大きな障害となり、UBSの顧客情報配信プラットフォームは困難な状況に立たされていました。
データサービスチームは、メタデータを使用してデータの形状や他のデータとの関連性を調査し、データの結合を行いたいと考えていました。そして、それこそが、システムのサブコンポーネントであるナレッジグラフの役割なのです。
UBSは、データをモデリングするために、Neo4jのグラフデータベースを選択しました。「データのガバナンス(さまざまな場所にあるデータを参照すること)が非常に簡単になりました。誰が・どのような経路で・データを取得しているのかをすぐに理解できます。しかし、より重要なのは、顧客があるデータが他のデータとどのように関連しているかを理解できるようになったことです。」とSid氏は言います。
結論
プライバシーとリスク報告のコンプライアンスにおいてグラフデータベースを使用することで、従来のシステムにはない多くの有益な成果を得ることができます。
-
リスク要因について、元の信頼性のあるデータソースまで遡って追跡することができる
-
プライシング、ポジション、キャッシュマネジメント、その他のデータサイロを統合したデータセットにすることができる
-
規制当局と連携して、リスクのグラフモデルを作成し、修正することができる
-
市場環境の変化、組織変更、投資戦略に合わせて、リスクモデルを容易に変更できる
-
トレーディングデスクの過去および将来の運用とパフォーマンスに影響を与える合併・売却・組織変更に対応する
Neo4jグラフデータベースは、成功を保証するプロフェッショナルサービスに支えられたグローバルな金融用語の標準をサポートしており、コンプライアンスの取り組みや日々の業務に新たな可視性を提供します。