fbpx

アストラゼネカのグラフアルゴリズムを活用した転帰の向上 #Neo4j #RDB

この記事は1年以上前に投稿されました。情報が古い可能性がありますので、ご注意ください。

本ブログは、「Neo4j」社の技術ブログで2020年6月24日に公開された「Improving Patient Outcomes with Graph Algorithms 」の日本語翻訳です。

プレゼンテーションの概要

このブログ記事では、アストラゼネカ社のグローバルコマーシャルITインサイトおよびアナリティクス担当シニアディレクター、Joe Roemer氏が、グラフによる視覚化やグラフクエリの活用による、転帰の向上に向けた一連の取り組みについて語っています。

まずはじめに、Joe Roemer氏は、アストラゼネカの会社概要を説明し、次に、Neo4jによるグラフアルゴリズムのPoCレビューについて言及しています。このレビューでは、ペイシェントジャーニー(患者がたどる一連の道のり)における類似性や、医師の連携、医師の及ぼす影響について扱っています。そして最後に、インサイトと、同社の今後の取り組みについて述べています。

*ペイシェントジャーニー(Patient Journey)とは
ペイシェントジャーニーとは、患者さんが疾患や症状を認識して、最終的に病院での受診や服薬など、治療するまでの患者さんの「行動」、「思考」、「感情」などのプロセスを表したものです。

プレゼンテーションの詳細:グラフアルゴリズムを活用した転帰の向上

本日は、アストラゼネカにおける1つの取り組みを、一連の流れに沿ってご紹介いたします。まずはじめに、弊社の概要をご説明いたします。ほとんどの方が弊社の名前をご存知ないのではないでしょうか。そして、ここからが本題ですが、次に、グラフアルゴリズムのPoCについてお話しいたします。そして最後に、弊社の今後の取り組みについてご説明いたします。

アストラゼネカの概要
グラフテクノロジーについて調査を始めた理由
アストラゼネカのアプローチ
アルゴリズム
ペイシェントジャーニーの類似性
医師の連携および医師の及ぼす影響
インサイト
今後の取り組み

アストラゼネカの概要

まずは、弊社をご存知ない方々のためにご説明いたします。アストラゼネカは、グローバル規模で事業を展開する製薬会社です。売上高は約244億ドルで、研究開発に61億ドルの投資を行っています。従業員数は約70,000人を数え、26か国で事業を展開しており、開発中の新規化合物の数は167を超えています。基本的に、これらの新規化合物は将来、新たな医薬品になります。

全体として弊社は、主要なプラットフォームを網羅しながら、主に3つの治療分野に注力しており、下記に示すように、オンコロジー、循環器・腎・代謝疾患、呼吸器疾患の患者様の治療を支援しています。

アストラゼネカは、低分子製剤、バイオ医薬品、プロテインエンジニアリングの領域をカバーしています。これらはどれも、オンコロジー、循環器・腎・代謝疾患、呼吸器疾患という3つの主要な分野を扱うライフサイエンス企業にとって不可欠な要素なのです。

しかし、弊社について私が最も心を躍らせていることは、組織としてのアストラゼネカの価値とミッションに他なりません。アストラゼネカのコアミッションは、科学の可能性を押し広げ、患者と社会に価値をもたらす画期的な新薬を開発することにあります。私はIT部門に所属しているので、このミッションをコンピューターサイエンスの領域から達成することや、テクノロジーが科学の進歩に寄与する領域を探求することに興味がありました。これらの観点による価値は、グラフデータベースを活用した弊社の活動において重要な役割を果たすようになっており、患者が自身の治療方針を計画するのをこのテクノロジーで支援する場合は特に、その傾向が顕著になっています。

グラフアルゴリズム:PoC

次に、弊社の実施したPoCについてお話しいたします。ここでは、このプロセス全体を通じた弊社の取り組みについてご説明すると共に、実際にどのようなかたちでグラフテクノロジーを活用し、どのような成果が得られたのかをお話しいたします。

グラフテクノロジーについて調査を始めた理由

私は、インサイトとアナリティクスを扱うITキャパシティリードの役職にあるため、ビジネスの差別化や、インサイトやアナリティクスの面で役に立つ新たなテクノロジーを常に探しています。そのようなわけで、グラフテクノロジーに関するさまざまな文書に目を通すようになり、列や行、リレーションシップなどの要素を含め、それが従来のRDBMSとは異なるものであると知ったのです。また、運転やナビゲーション、レコメンドエンジン不正検知などを支援するアプリケーションにおいても、グラフテクノロジーが使われているとの話も耳にしました。

そこで、グラフテクノロジーについて調査を始め、チームのメンバーも加えて議論をするようになったのです。そして、グラフテクノロジーの手法はチーム内で注目を集めるようになります。チームのメンバーは、グラフテクノロジーをビジネスに適用する方法の検討を始めました。

興味深いことに、実際にこのテクノロジーを初めて適用したのは、マーケットリサーチのプロジェクトでした。マーケットリサーチでは、ある特定の役職の一群を対象にコールセンターが質問を行う際に慣習的に用いられる専用のドキュメントがあります。その内容は非常に興味をそそるものでした。ブランドを新規に立ち上げる際は、多くの場合、医師に対して次のような質問を投げかけます。「現在、この疾患を抱える患者の治療を行っていますか」、「この疾患の患者には通常、どのような症状がありますか。また、何が懸念されますか」、「治療の内容はどのように調整していますか」、「治療の内容を調整する際はどのようなことを行っていますか」、「患者の病状が変化する中で、具体的にどのような治療を行っていますか」などといった質問です。

ただし、実際に話を聞くことのできる医師の数はごく少数に限られるため、情報に対する視点は狭い範囲に限定されたものになります。
このドキュメントに目を通したときに私の頭に浮かんだことがありました。ペイシェントジャーニーを構成する実際のデータに目を向ければ、マーケットリサーチを基に得られた仮説のいくつが正しいかどうかを判断するのに十分な数多くのデータが得られるという事実です。そして、これが、グラフテクノロジーの利用に向けた入り口となったのです。まずはじめに私たちが着手したのは、同様のマーケットリサーチをすでにいくつか実施しているブランドから話を聞くことでした。そして、グラフテクノロジーを適用する方法や、仮説のいくつかについて回答を導き出す方法、データを基に仮設の真偽を確かめる方法を確認したのです。

アストラゼネカのアプローチ

弊社のアプローチはきわめて一般的なものでした。グラフテクノロジーについての知識がほとんどない状態のまま、まずはこのテクノロジーを使ってみようとしたのです。しかし、私たちにとって特に重要だったのは、ブランドチームが本当に回答を望んでいる質問に答えを出すことでした。

そして、これを起点に、1つのグラフモデルを構築し、質問のいくつかを可視化したのです。まずはグラフモデルを構築し、これまでとは違う考え方を理解しようと努めたわけですが、これが本当に容易ではありませんでした。グラフモデルは従来のデータベースとはまったく異なるモデルだったのです。ここで案の定、多くの困難に直面しました。気がつくと、このグラフに何度も手を入れていました。モデルの開発では、グラフテクノロジーに精通している人々の助けも借りました。

以下に示すのは、私たちが一番初めに開発した、きわめてシンプルなモデルです。このモデルは、医師、処方薬、愁訴、実際の患者の間に存在する関係を表しています。より複雑な質問に答えを出すことができるよう、使用する名詞や動詞、それらが意味を成す組み合わせに配慮しました。そしてわかったことは、このグラフモデルをさらに進化させなければならないということでした。

このグラフモデルを基に私たちはバージョン2のモデルを作成しました。時間の経過に伴い事象がどのように変化するのかを把握できるよう、次のモデルでは、時間の関連性の概念を取り入れました。

私たちは、医師と愁訴の間の関係もいくつかモデル化しました。その結果、ペイシェントジャーニーが、連続して発生するいくつものイベントによって構成されていることがわかりました。可視化を行い、状況の進行を把握することで、より多くの問いに答えを出すことができるようになり、そして最終的には、医師と医療施設との関係、医師同士の関係などを組み込んだ、非常に内容の充実したモデルを構築することができるようになったのです。

しかし、それでもまだ、このグラフモデルには、繰り返し数多くの手を入れる必要がありました。そして、その過程で私たちが気づいたのは、答えを出そうとしている質問の内容がさらに複雑化し、興味深いものになっていくという事実でした。最初は、「この症例の患者はどのくらいいますか」、「AからBに移動した患者は何人いますか」といったごく単純な質問だったものがさらに複雑な質問になったのです。

実際の可視化のスナップショットをお見せいたしましょう。初期段階の仮設や質問を扱った単純なモデルです。この可視化は、弊社のブランドチームにとって大いに役立つものになりました。そして、これをきっかけとして、私たちの取り組みも次の段階に進むことになりました。グラフアルゴリズムを中心とした取り組みです。

この可視化では、単一の患者とそのジャーニーを、病状の進行の観点から可視化しています。

青の点はどれも愁訴を表し、赤の点はすべて、診断の結果を意味します。そして、緑の点はそのどれもが、処方薬を表します。この図を左から右に見ると、実際に何が起こっているのかを理解できます。個々のデータが現実の出来事として意味を持つようになり、データの中にさまざまなパターンを発見することができます。

赤線で示した2つの小さな箇所にご注目ください。緑(処方薬)の点に続いて、新たな診断が行われたことがわかります。最初の薬の処方の後に行われたこの診断の結果を踏まえ、医師は新たな薬を処方しています。この種のパターンは、患者について私たちが把握しようと努めてきた内容そのものを表しています。医師がどのように患者を治療しているのか、弊社の製品が患者の治療に役立っているのかどうかを伝える情報であり、多くのケースで、転帰の向上に寄与します。

このような可視化はそれぞれが、1つの出発点になります。そこから、まったく新しい視点でのデータ分析が始まるのです。私たちはこれまでも同様のパターンを見つけ出そうとしてきましたが、「イベントA、イベントB、イベントCが発生したが、イベントDは発生しなかった」といったような、複数のイベントが順番に発生する状況に目を向ける必要があるときには、パターンを見出すのは容易ではありません。しかし、グラフテクノロジーを活用すれば、このような分析を迅速に処理できます。

アルゴリズム

いったん、このような可視化を行えば、グラフテクノロジーを活用して驚くほど速く、次々に質問の答えを得ることができます。しかし、実は、もっと複雑な問いに答えを出すべくここから次の段階に進むことになるのです。

可視化によってすぐに生まれた問いが主に2つあり、それを起点としていくつかの取り組みを行うことになります。

個々のペイシェントジャーニーの分析について、チームは満足した結果が得られるようになりました。そして次にまず取り組んだのが、「まったく同じではないが似通った他の患者をすべて見つけ出すことはできるか」という課題でした。患者を診断するという行為の内容を熟知している人であれば、いくつかの診断の基準には数多くの微妙な違いがあることをご存知のはずです。その多くは似通っていながら、違いも豊富にあるのです。そして、あらゆる可能性について繰り返しこのようなグラフ分析を続けるのは非常に難易度が高いことがわかりました。このような患者を見つけ出すのはきわめて困難でしたが、際立って特殊なことをするつもりはありませんでした。このような状況においても、汎用的な方法を求めたのです。さて、どのような方法があるでしょうか。

このデータに関して私たちが探ろうとしたことがもう1つあります。医師同士がどのように連携しているのかを把握しようとしたのです。興味深い医師同士の連携がありました。専門医が患者を診断し、その医師の助手が処方箋を書くのです。医療業界において、専門的な医療機関の医療行為では、しばしばこのような形態を目にします。まずは、専門性の高い医療行為を行う医師が患者を担当し、次にその助手や看護師が患者を引継ぎ、処置を終えます。

このようなネットワークがどのように機能しているのかを正確に把握したいと思いました。そしてこのケースは、人と人のつながりや、人々がどう連携しているのかを理解する際にグラフテクノロジーがいかに有用であるのかを知る恰好の出発点となったのです。

ペイシェントジャーニーの類似性

そこで、次に、患者の類似性に注目することにしました。とりわけ、このアプローチで考えられる可能性や、可能な事柄に焦点を当てました。診断A、処方B、診断C、D、Eといったようなペイシェントジャーニーを何かに変換し、そこからパターンを見つけ出すにはどうすればよいのかを考えたのです。

データサイエンスの観点からサポート提供してくれる有能な人々のサポートを私たちは得ることができました。まず頭に浮かんだのは、ワードベースでドキュメントを比較したときにしばしば遭遇する問題と同じような問題でした。似通ったセンテンスやパラグラフ、あるいは同じトピックやパターンを持つものをどう見つけ出すかです。

そしてここからは、ペイシェントジャーニーをあるベクターや語句にマッピングするアプローチを取ることにしました。個々の診断において、その基準や診断の一連の内容は文書化されていました。診断、処置、処方から構成される一連の流れが1つのセンテンスになっており、ペイシェントジャーニーは1つのドキュメントになっていたのです。

この手法により、まったく同じではないが特定の患者と似通った他のすべての患者を見つけ出すことができました。そして次にこのアプローチを類似性のアルゴリズムというグラフアルゴリズムを通じて実行しました。その際に、自然言語処理(NLP)で使用するいくつかのテクニックや、ドキュメントとベクターを比較する手法を活用しました。

上記の右の図では、いくつかの次元からの切り口で非常に有用な分析が行われています。右側にあるオレンジの丸はこの分析で対象にしている診断を受けていない患者を表し、左側にある青の丸は診断を受けている患者を表します。

このモデルでは、分類が非常に上手くできました。必要な情報を見つけ出すことができるように切り口の次元を設定できたのです。このように複数の次元から分析をすれば、類似性があり、私たちが関心を持っている診断を受けた患者を見つけ出すことができます。また、これらの患者を他の患者と区分しながら、一方では、まったく同じではないが多くの点で似通っている他の患者の存在を適切に予想することも可能になります。

グラフテクノロジーで達成できた成果は驚くべきものでした。これまでは、このような視点からプロジェクトに取り組んだことはまったくありませんでした。個人的にもグラフアルゴリズムの可能性に大いに心踊らされた成果の1つです。ペイシェントジャーニーを時系列に把握することで得られた成果でした。そしてここからさらに次のレベルへと進み、このアルゴリズムを使って別の分類を行いました。

医師の連携および医師の及ぼす影響

私たちが実現を目指した2つ目の大掛かりなアルゴリズムは、医師同士の連携を分析するアルゴリズムでした。ここでは、お互いに連携している医師やお互いに影響を与え合っている医師の存在を確認するといった観点からこのアルゴリズムを考えました。

どの時点で医師は連携し、患者の情報を共有するのか、どの時点で患者を他の医師に任せるのか、一次診療に携わる医師が患者を専門医に引き継ぐのは多くの場合どの時点かといったような事柄を、まずは議論し、そして、これらのパターンを見つけ出す作業に着手したのです。

以下に示す一番下の図は、医師がどのようにして連携しているのかを示すシンプルな例の1つです。私たちが実行した数多くの中心性アルゴリズムでは、他の医師と最も連携している医師や、医師のクラスターが連携している場所や、単一のポッドとして扱う必要のある医師のグループを視覚する方法を把握することができます。たとえば、医師の1人と有意義な内容の会話ができた場合、当然のことながら、医師のグループ全体が同じ会話からメリットを得られると予想できます。

ここからは、これらのアルゴリズムで古典的なクラスタリングの手法を使用しました。すると、チームとして緊密に連携している医師のグループが数多く点在することがわかりました。

私たちは媒介中心性にも興味を惹かれました。ある医師のグループとは非常に充実した会話のできる機会が何度もありました。一方では、弊社の医療関係者やセールスチームとは会話する機会を持てないおそらくは多忙な医師のグループが存在するのも事実です。私たちは、2つの医師のグループや組織をつなげるポイントを見つけ出そうとしました。ここでは、媒介中心性が非常に重要な役割を果たしました。

媒介中心性アルゴリズムを使用した結果、ある非常に重要な関係が存在することがわかりました。相互に連携しお互いの経験を共有できる2人の医師が存在し、彼らを結びつければ確実に患者の支援に役立つことが判明したのです。

また、PageRankにも大いに興味を惹かれました。この手法では、お互いに影響を与える可能性のある医師を特定することができました。PageRankをよくご存じない方は、Googleのエクスペリエンスを思い浮かべてみてください。多くの人々とつながりのある人物ほど、大きなPageRankを持つことになります。たとえば、ある医師が講演を行い、この医師のイベントに別の複数の医師が参加した場合、この医師のPageRankは高くなります。また、多くの医師が在籍する医療施設に勤務しており、どの医師からも患者を任される医師の場合も、PageRankが高くなります。

私たちは、ネットワークにおいて影響を持つと考えられる医師に特に重点を絞って会話を行い、注意深く彼らの話に耳を傾け、彼らが関心を示す事柄を把握し、これらの情報に重点を置いて、より大きなネットワークを特定しました。このような医師の連携から生み出される可能性には、大いに興味をそそられました。また、影響力のある特定の医師を特定し、それらの医師を結びつけ、医師のクラスターを見つけ出すことのできる中心性アルゴリズムを知ることができたのも心躍る体験でした。

これらは、刺激的なユースケースであり、このプロジェクトを始めた当初は、このようなことが可能になるとは夢にも思いませんでした。グラフクエリの使用を経験し、いくつかのパターンを発見することで、私たちはある種の進化を成し遂げたのです。

インサイト

今回の取り組みを通じて得られたインサイトを要約すると、まずはじめに、チーム内には、患者の治療にあたって緊密に連携する医師のグループが複数存在します。彼らは、患者の状態の把握に努め、患者が最善の治療を受けられるよう、連携しています。会話の出発点になるのは、常に専門医であるとは限りません。専門医を中心としたチーム全体から非常に有用なインサイトが得られるのです。

そして、これらのインサイトを視覚化すれば、常に興味深い結果を期待できます。初めのうちは視覚化の必要性をほとんど感じていなくてもやがてそれを意識するときが出てきます。そして、実際には、医師が患者の情報をどのように共有しているのかを視覚化し、多くの医師が患者とのやり取りで行っていることの意味を理解する必要があるのです。

次に、すぐにわかった以下のことを指摘しておきたいと思います。それぞれのペイシェントジャーニーには多くの共通点がありながら1つとして同じペイシェントジャーニーは存在しないという事実です。私たちはグラフアルゴリズムを活用し、固有のジャーニーのタイプやパターンを持つ患者と、それに近いタイプやパターンを持つ患者の両方を特定しました。

今回の取り組みで学んだ特に重要な事柄の1つとして、グラフモデルを使用するときには、従来の考え方を改めねばならないということが挙げられます。この取り組みを始めた当初は、何の問題や苦労もなくグラフテクノロジーを利用できるだろうと考えていました。まずは、チーム全員でホワイトボードに図を書き、ノードを割り当て、関係性を記述していきました。グラフのクエリさえ使用できるようになれば、後は簡単に作業を進められるだろうと思っていたのですが、実際にわかったのは、思考の方法を完全に改めねばならないという事実だったのです。

特に、私たちの場合は、専門家に相談したことで、大きな助けが得られました。そのサポートのおかげで、それまでとはまったく違ったかたちで関係性やノードを定義できるようになりました。グラフテクノロジーについて経験を積んだ専門家のアドバイスがなければ、そのような定義は絶対にできませんでした。初めてグラフテクノロジー使用するときには誰もが私たちのように苦労するのは間違いありません。一方、私たちの場合は、これまでとは異なる思考方法を身につけた結果、きわめて大きな知恵を得ることができました。

グラフテクノロジーは進化を続けているがゆえに、強力なテクノロジーとなっています。すでに説明したように私たちの取り組みでは、1つのことから始めてそれを発展させていきました。そして、次々と新たな質問が生まれ、それは今も続いています。これは他のデータベースの場合には問題となりますが、グラフデータベースなら、何も心配はいりません。

今後の取り組み

今後集中的に取り組んでいこうとしている領域は主に2つあり、私たちにとって重要な意味を持つ事柄の間にどのような関係が存在するのかを、グラフテクノロジーで明確にする予定です。

まず第一に、医師自体や、医師が勤務している医療施設の環境、医師同士の連携の方法をグラフテクノロジーでさらに詳しく把握したいと考えています。

以下の図の緑の丸印はどれも、医療施設や病院、または医局を表します。一方、赤の丸印は数人の医師を表します。医師の数が増えるのに従い、医師のできることとできないこと、処方のパターン、プロトコール、クリニカルパスに対し、医師の勤務する医療施設が与える影響が大きくなります。

そして、医師は医療施設とどのように結びついているのか、医師は複数の医療施設に勤務しているかといったことを把握したり、これらの事柄が弊社と医師の関係にどのような変化を及ぼすか、患者支援の質を高めるうえで弊社が医師に伝えるべきメッセージは何かといったことを理解したりしたいと、私たちは考えています。

さらには、インフルエンスポイントを見つけ出したり、同じような経験を積んでいる医師を探して、お互いを結びつけ、それぞれの情報を交換できるようにしたりすることも考えています。

私たちは誰もが、第三者がどれだけ多くのことを語っても、真の結びつきや信頼を必要とする立場にいます。インフルエンスポイントやインフレクションポイントを見つけ出すことは、私たちが継続的に行っている取り組みに他なりません。そしてこれらの結びつきを患者のサポートにどう役立てるかも考え続けています。

そして、最後に、ペイシェントジャーニーに関する取り組みについても、継続していきたいと考えています。私たちがマッピングするペイシェントジャーニーの数が増えれば、弊社と医療機関との対話の内容が充実し、その結果、医療機関では、患者ケアの質が高まり、患者にとって最適な薬の処方が可能になります。そして、私たちとしては、ペイシェントジャーニーの適切なタイミングで会話の機会を見出すことや、適切な患者の中にパターンを見つけ出すことが重要になります。

一定の期間、野心的な取り組みをすれば、医療システムを身動きの取れないような状態にしてしまう深刻な事態をグラフアルゴリズムを活用して予測することが可能になるのであれば、そのような取り組みを支持したいと考えます。

心臓事象などの事象を有する人が身近にいるとしたら、深刻な事態を避ける上で最も効果があるのは、適切な治療や予防治療に他なりません。医療機関との連携、協力が可能で、コストのかかる事象を回避できる環境を、そして慢性的な疾患で入院や再入院をしなくても済むよう患者をサポートできる環境を実現したいと、アストラゼネカは強く望んでおり、そのために注力しています。

そして、これこそが、今回の取り組みを実施したいと考えた起点なのです。私たちが実施したPoCのアプローチや、グラフテクノロジーを用いた取り組みについて説明する機会をいたただきありがとうございました。

医療分野やライフサイエンスの分野におけるグラフテクノロジーの活用事例を他にもご用意しています。
Neo4j Connections: Life Sciences and Healthcareに今すぐご登録ください。お客様やNeo4jのエキスパートによる、データサイエンス関するオンライントークをいつでも視聴できます。

New call-to-action

新規CTA