EAI/ETL技術者のブログ

  • データ仮想化
2023.06.29

今、注目され始めた「データ仮想化」とは?

今、注目され始めた「データ仮想化」とは?

データドリブンを背景に市場には様々な製品がリリースされていますが、ガートナーアナリティクスサミットで注目を集め、DX白書2023にもコラムが掲載され、今、注目されつつある「データ仮想化」について、ブログを書いてみました!
是非、ご参照宜しくお願い致します!



データ仮想化が注目され始めた背景

クラウドリフト&シフトの加速、様々なソフトウェア、サービスの個別採用が進み、企業が管理するデータのサイロ化が進んでいるとお聞きすることが多くなりました。皆さんの企業でもそうではないでしょうか?

その一方、データドリブンやDXをキーワードに、企業で管理する全社のデータを横断して活用したい、今まで利用していないデータを分析に使いたいといったニーズが発生し、IT部門の方はこの2つの状況に板挟みになっていると思います。

このような中、データ活用を促進し、データドリブン経営を実現するためには、データ参照の目的とそこに求められる要件を整理し、最適なアプローチを取らなければなりません。

下の図は、データの参照目的とその中で求められる要件を纏めたものとなります。
私は、データ参照の目的は大きく2つに分類されると考えています。

目的が異なれば要件も変わる為、データ活用のアプローチ方法を変える必要があるとイメージできたのではないでしょうか?

日頃、お客様との会話では、現状は左側の目的への対応を行っているお客様が多く、DWHやデータレイクの構築、活用に尽力されている状況といった印象です。


では、右側に記載されている「インサイトを見つけ、想像する」に向いているのはどのようなツールでしょうか?
インサイトを見つけるということで、BIツールを想像する人も多いと思いますが、この部分でお客様にお役立ちできるのが今回のテーマ「データ仮想化」となります。
※データ仮想化は左側の目的でもお役立ちできますが、今回は右側メインの内容にします!

「インサイトを見つけ、想像する」際のお客様の課題感

なぜ「インサイトを見つけ、想像する」にデータ仮想化が活躍できるのでしょうか?
データ仮想化の特徴を知る前に、まずはお客様の課題感をインサイトを見つける時に取るアクションをベースに考えてみたいと思います。

【インサイトを見つける為のアクション】

  • 仮説を作る、考える
  • 仮説の検証に必要なデータを集める
  • データを使って、仮説を検証する
  • (適切なものだけ)ビジネスに実装する

ここでポイントとなるのが検証に必要な「データ」です!
仮説を検証するためにはデータが必要ですが、必要なデータをユーザ部門の方が全て把握されているケースはレアケースであり、たいていの場合、IT部門やデータの取り扱いに特化したメンバーにデータ提供を求めることになるかと思います。

しかし、そのような方は増え続けるシステムのサイロへの対応やユーザからのデータ提供依頼などの対応でとても多忙となっており、ユーザ部門の要望に対し、シームレスにデータを提供することが難しい状況になっています。

特に仮説を検証する場合、データの見方が事前に決まっているわけではないため、一度データを提供したら終わりではなくデータを何度も変更する必要があり、対応が難しい、データ提供までにとても時間が掛かってしまう。。という状況も起きてしまっています。

データがないと検証ができず、データドリブンの繰り返しがうまく回らず、もどかしい状況になってしまいますよね。

つまり、インサイトを見つけるためには、
・データを柔軟に変えることができる状態をつくること
・データをなるべく早く提供できる状態にすること
・少ない人員や工数で対応できること

が求められます。

では、上記要件とデータ仮想化がどのように結びつくのでしょうか?
データ仮想化の基本概念と特徴、そして上記要件との関連性を整理していきたいと思います。

データ仮想化とは?

まずデータ仮想化とはどういったものなのでしょうか?
簡単に言えば、データ仮想化は実データを持たずにデータを仮想的に統合し、データ活用ツール(BIやAIなど)にデータ提供する手法です。

従来のDWHでは、ETLツールで実データをDWHにコピーし、DWHからデータ提供を行っておりましたが、データ仮想化では実データのコピーを行わずメタデータからビューを作成します。そして、データ活用ツールからビュー参照のリクエストを受けるたびに、各種データソースに必要なデータを取りに行き、データ活用ツールに提供致します。

特徴は以下となります。

※メタデータ:RDBでいうスキーマやテーブル情報(カラム名、カラム型)など

では、データ仮想化を利用することで、要件にどのように対応できるようになるのでしょうか?データ仮想化が持つ一部の機能の紹介、それにより対応がどのように変わるかを以下に簡単に纏めてみました。

もし、同じような課題をお持ちのお客様がいらっしゃいましたら、一度データ仮想化で課題が解決できるか検討いただくと良いと思います。

データ仮想化の価値はインサイトを見つけることだけなのか?

今まで、データ仮想化でインサイトを見つける観点を説明させていただきました。
最後の章では、視点を変え、データ仮想化が「現在を正しく捉え、判断する」という参照目的で役に立つのか?頭出ししたいと思います。

この分野では、DWHを利用したアプローチが一般的だと思います。DWHに必要なデータを集め、管理することで見たい時にすぐにデータを参照できることがメリットです。
しかし、データを物理的に格納しておく前提となる為、無制限にデータを格納することはできず、以下のような悩みが発生することも多いのではないでしょうか?

  • DWHに格納されていないデータがあり、全社データの横串参照ができない
  • DWHにユーザ要望のあるデータを全て格納したいが、以下の要因で対応が困難
  • 対応メンバー(情報システム部門など)が多忙で、要望に応える人的リソースがない
  • DWHに格納できるデータサイズの上限により、データを増やすことができない
  • ServiceNowなどで用意したフロントシステムとDWHや業務システムなどを連携させ、いち早くフロントシステムにデータを届ける仕組みを構築したい

上記のような課題は、DWHだけで解決しようとすると、コストや時間の観点でかなり困難になると思います。この場合には是非、データ仮想化を組み合わせて使うことをご検討いただくと良いと思います。
既存のDWHの負荷をデータ仮想化で軽減することで柔軟性の高いデータ活用基盤を構築することが可能となります。

まとめ

今回は、データ活用に向けて、データ仮想化が必要となる背景を整理してみました。
データ仮想化の細かな機能性とその効果の詳細は、今後ブログで発信していきます。

ブログを見ていただき、データ仮想化に興味を持った!もう少し詳細な情報を知りたいと思っていただいた方は是非以下リンクにございます「「データ仮想化」を事例といっしょに分かりやすく解説!【オンデマンド動画】」をご参照ください!

こちらで、データ仮想化の価値、データ仮想化製品の機能性、事例を1時間の動画でご紹介しております!

執筆者情報:

執筆者 中村遼平

中村 遼平  (なかむら りょうへい)
株式会社アシスト DX推進技術本部 技術統括2部 DI技術部
TDVインキュベーションプロジェクト

2008年に株式会社アシストに入社。
入社以来、ETL/EAI製品の担当部署で「Precisely Connect」「DataSpider」のフィールドエンジニアとして活動し、2022年からデータ仮想化製品「TIBCO Data Virtualization」の立ち上げを担当。
趣味は「ゴルフ」と「面白ガジェット探し」

関連している記事

DataSpider Connect HULFT

ページの先頭へ戻る