日本最大級の診療データベースをVertica+AWSで刷新。分析処理のパフォーマンスを最大10倍向上
メディカル・データ・ビジョン株式会社
- 導入製品/サービス…
- Vertica
|
日本最大級の規模を誇る診療データベースを使った各種情報サービスを展開するメディカル・データ・ビジョンでは、これまでデータベースの肥大化に伴うシステム性能低下に悩まされてきました。そこで、同社はVertica を導入。診療データベースを刷新することで、システム性能の大幅な改善を実現しました。また、Verticaが備える機械学習機能の評価も行い、将来的にAIを使ったサービスを開発・提供する道を切り拓くことができました。 |
|
導入のポイント
1.大容量かつ複雑なデータを高速に処理できるシステムを実現
2.システム負荷に柔軟に対応できる拡張性を備えたデータベース基盤をAWSで実現
3.データベースの標準機能だけで容易に機械学習を利用できる手段を獲得
課題
- 診療データベースのデータ増大に伴い、システム性能低下が深刻化していた
- データベースサーバのスケールアップによる性能向上が限界を迎えていた
- 機械学習を活用した新たなビジネス創出を模索していた
対策
- スケールアウトでリニアに性能向上が期待できるVerticaを導入
- AWS上での事前検証の結果、Verticaを使ったスケールアウト対応へ変更
- Verticaが備える機械学習機能の有効性と操作性を検証
効果
- 12ノード構成により、最大で10倍のパフォーマンス向上を実現
- Amazon EC2インスタンス追加でリニアに性能が向上できるデータベース基盤を構築
- SQLだけで簡単に機械学習が行える環境を整備
診療データ分析サービスの流れ
|
日本最大級の診療データベースのパフォーマンス低下が問題に
「日本初の医療データのインフラを実現する」というビジョンの下、2003年に設立されたメディカル・データ・ビジョン株式会社。現在では、医療機関向け経営支援システムの開発・提供や、医療機関から提供された医療データを使った製薬会社・研究機関向けの情報サービスなどの事業を展開しています。特に後者の情報サービスでは、実患者数2,000万人以上の診療データを格納しています。この診療データベースは日本最大級を誇っており、これを基に付加価値の高いサービスを提供しています。
診療データベースの運用は2008年からスタートし、年を追うごとにデータ量が増加してきました。そしてその運用の歴史は、データ量増大に伴うパフォーマンス低下との闘いでもありました。同社 取締役 EBM事業ビジネスオーナー 中村正樹氏は、その経緯を次のように振り返ります。
中村氏
当初はDWH(データウェアハウス)製品を使ってシステムを構築しましたが、データベースのレコード件数が数十億件の規模まで増えるに従い、システムのパフォーマンスが目に見えて低下してきました。このデータベースの検索では複雑なテーブル結合が発生するため、どうしてもパフォーマンスが低下しやすい傾向があります。そのため性能問題が顕在化するたびに、システムのCPUやメモリを増強するスケールアップで対処してきました。 |
|
「Vertica」を使ったスケールアウトで性能低下に対処
当初はこれまでどおり、データベースサーバのスケールアップで危機を乗り切ろうと考えた同社でしたが、スケールアップ後のサーバスペックで性能検証を行ったところ、CPUコアを増加しても性能が向上するどころか、逆に悪化してしまうことが判明しました。そのため、急遽スケールアップ以外の方法を検討する必要性に迫られました。
ここで同社が白羽の矢を立てたのが、アシストが提案した列指向型データベース製品Verticaでした。
中村氏
実は過去に性能問題に直面した際、アシストからVerticaの提案を受けたことがあり、「Verticaならサーバを増やすことでリニアに性能を向上できます」という説明が強く印象に残っていました。そこで、それまでのスケールアップから、Verticaを使ったスケールアウトへの方針変更を前提に検討を開始しました。
まずは、Verticaのスケールアウトでどの程度のパフォーマンス向上が見込めるか、AWSで評価検証を行うことにしました。3ノード、6ノード、9ノード、12ノードのそれぞれの検証環境を用意し、Verticaを使って本番システムとほぼ同じデータとSQLで性能テストを行いました。その結果、ノード数を増やしていくに従い、ほぼリニアにパフォーマンスが向上することを確認できました。12ノードの環境では、SQLの処理が従来の5分の1程度の時間で完了しました。
こうした評価結果を踏まえ、同社は正式にVerticaを使って診療データベースを刷新することに決めました。
Verticaの導入で最大10倍のパフォーマンス向上を達成
導入後、パフォーマンス向上の効果は目に見えて表れています。特定のSQLに合わせてテーブルを自動的に最適化するVertica独自の機能も活用し、最大で10倍の性能向上を実現した処理もありました。
診療データベースは今後もサイズの増加が予想されるため、もし将来的にデータベースのキャパシティが不足したとしても、Amazon EC2インスタンスの追加でリニアに性能を向上できるVerticaであれば、今後も安心して運用していくことができます。
|
なお同社が導入したVerticaは、本番運用を始めて以来、現在に至るまで特に大きな問題もなく稼働を続けています。EBM事業部 EBM開発ユニット長 兼 EBM解析ユニット長 丑久保浩一氏はその安定性も高く評価します。 |
Verticaの機械学習機能を使ったAI分析にチャレンジ
さらに同社は、Verticaが備える機械学習機能の評価も併せて行いました。Verticaはデータベース製品でありながら、機械学習に関する処理をSQLで行える機能を備えています。この機能で、機械学習を使った新たなビジネスを創出できるのではないかと考え、その有効性や操作性を評価することにしました。
まずは、診療データベースに保管されている膨大な量の患者データとそれに紐づく診療データを基に、「30日以内に冠動脈疾患を発症するリスクが高い患者を検出する」ための機械学習モデルを試験的に作成しました。患者の性別、年齢、コレステロール値、中性脂肪値、喫煙指数といった各種データをVerticaの機械学習エンジンに学習データとして与え、モデルをいくつか作成してそれらの評価を行いました。最も精度が高かったモデルを使って、本番データの中から発症リスクの高い患者や低い患者の予測値を取得したところ、示唆に富む考察が得られたといいます。
この評価作業を担当した丑久保氏によれば、機械学習に関しては全く予備知識がなかったにもかかわらず、極めて手軽にモデルの作成と運用ができたと言います。
丑久保氏 機械学習を行う際に必須と言われるR言語やPython言語のスキルは一切不要で、SQLだけを使って学習データの準備からモデルの作成・評価、予測までを行うことができました。またVerticaの環境以外にハードウェアやソフトウェアを導入・設定する必要もないため、とても簡単に機械学習を利用できることが分かりました。
同社では現在、Verticaの機械学習機能を使った新たなサービスの開発を検討しています。
- ※本事例は取材時の内容に基づくものです。
- ※製品内容は、予告なく変更される場合があります。
- ※記載されている会社名、製品名は、各社の商標または登録商標です。
- ※AWSはAmazon Web Services、Amazon EC2はAmazon Elastic Compute Cloudの略称です。
メディカル・データ・ビジョン様の事例記事(PDF)をダウンロード
本事例をまとめたPDF資料を今すぐダウンロードいただけます。印刷や社内共有等にご活用ください。
お客様情報
※お客様情報は取材時の内容に基づくものです。
会社名 | メディカル・データ・ビジョン株式会社 |
---|---|
概要 | 医療機関向け経営支援システム、DPCベンチマーク統合パッケージ、臨床データ活用サービスなど、医療・健康分野のICT化を促進する各種ソリューションの提供を通じて生活者のメリット創出に貢献します。 |
本社 | 東京都千代田区神田美土代町7番地 住友不動産神田ビル10階 |
設立 | 2003年8月20日 |
資本金 | 9億9,266万1,739円(2018年12月末現在) |
従業員数 | 連結220名(2018年12月末現在) |
URL | https://www.mdv.co.jp/ |
取材日 | 2019年7月 |
関連製品/サービス
Vertica
Verticaは、エンタープライズDWHとしてだけではなく、全社的なビッグデータ分析基盤として活用できる次世代型データベースです。様々なユーザのデータ分析要望をその圧倒的なパフォーマンスとスケーラブルな構成、Vertica独自の分析機能で強力に支援します。
- 1台のPCサーバからスタートできる柔軟な拡張性
- 最小レベルのディスクI/Oで高いパフォーマンスを実現
- 複雑な設計/チューニングが不要。DB運用の簡易化を促進
- 2024.5.30アシスト、SaaS横断検索×チャット機能のAIアシスタント「Glean」で顧客サポート業務の高度化を実現
- 2024.5.20エア・ウォーター、グループ企業の経営情報を管理する基幹システムをOracle Cloud Infrastructureで刷新
- 2024.3.25日本オラクルとアシスト、エネルギー会社の全社データ利活用基盤をOracle Cloud Infrastructureで刷新
- 2023.6.27UQコミュニケーションズ、Oracle Cloud Infrastructureで事業継続性を強化
- 2023.6.15南相馬市、ネットワーク強靭化のリプレースに「InterSafe WebIsolation」を採用