
- Qlik Cloud
- Qlik Sense
- 開発者
- データロード
- 可視化・分析
Qlik Senseで前年同月のデータを求めてみよう!
Qlik Senseで分析を行う際、前年同月のデータを使って比較をしたいと思ったことはありませんか?
|
前回は「ビジュアライゼーション」について、Qlik Sense活用の視点で概要をお伝えしました。
今回は少し具体的に「グラフの使い方」を見ていこうと思います。
データ分析を行う際に、目的に応じたグラフを利用することが大切です。そして基本となるパターンを把握することでグラフの活用はとてもスムーズになります。まずは前回記事のおさらいも兼ねて、基本的な5つのパターンを表にしたので確認しておいてください。
<前回までの記事>
|
各種グラフの構造を見ていくにあたっては、前回までの記事で確認してきた「メジャー」と「軸」に視点をおいて説明をしていきますのでそれぞれを思い出しながらじっくり読んでみてください。
基本グラフの中でも特に一般にもなじみの深いのが、棒グラフ、折れ線グラフ、円グラフです。これらは、軸とメジャーをどのように構成するかによって、様々な目的で利用できます。一番シンプルな構成が「1軸/1メジャー」のパターンです。単一のメジャー(売上金額 等)の推移や構成比を見たり、比較したり、ランキングを作成したりする際に使用できます。
|
これらのビジュアライゼーションは分析対象となるメジャーが1つなので、組み合わせる軸によって分析の切り口が変わります。推移を見る場合には、年や月など時系列の順番を持った軸を組み合わせ、棒グラフか折れ線グラフを利用します。推移以外を見る場合は、モノ、場所、人など様々な軸を組み合わせることとなります。
同じグラフを使用していても、1軸/1メジャーのグラフに別のメジャーを追加することで、複数メジャーを比較して情報を得ることができます。軸を時系列にすることで、複数メジャーの推移を比較できますし、それ以外の軸を組み合わせると項目ごとに複数メジャーを並べて比較できます。
|
棒グラフ、折れ線グラフは、軸を複数にすることで、異なる軸を組み合わせた情報を得ることができます。一見すると「1軸/複数メジャー」のグラフのようにも見えますが、色分けされた複数の要素が、複数のメジャーではなく、1つのメジャーを複数軸で集計した値であることがポイントです。
下図で例えると「売上」に対して「製品」「支社」「年/期」といった複数の軸で分析していることが確認できます。
|
補足)データの持ち方とグラフの構成
「1軸/複数メジャー」で構成するか「複数軸/1メジャー」で構成するかはデータの持ち方とも関係してきます。
上図の右から2つ目の折れ線グラフを例にすると、一般的なデータの持ち方としては[年月]、[製品名]、[売上]となり、[年月]と[製品名]を軸として扱えるため 「複数軸/1メジャー」の構成でグラフを表現することができます。
しかし、場合によっては[年月]、[製品Aの売上]、[製品Bの売上]、[製品Cの売上] というように、売上というメジャーが既に製品ごとに分けられた状態でデータになっていることがあります。この場合は、データを一般的な持ち方に加工して「複数軸/1メジャー」で構成するか、そのまま「1軸/複数メジャー」で構成するかの状況判断が必要になります。
|
|
また、比較する複数のメジャーの大きさや単位が異なる場合には、コンボグラフを利用することで単位や範囲の異なる目盛り軸を追加することができます。下図では売上(円)と達成率(%)を比較しており、達成率の目盛りを副軸として追加することで両メジャーをビジュアライゼーションしています。また、下段の比較パターンでは、通常は推移を表現するために使用する折れ線グラフから線を省略することで比較しやすくしています。
|
複数のメジャーを座標軸上に表示することで、メジャー同士の関係性を見ることができます。Qlik Senseでは、座標にプロットする点は軸として定義することができます。一般的にはメジャーの相関関係を把握する際に利用されますが、実際の業務の中では、下図のようにアクションにつながる軸の値(顧客や営業マン)を見つけ出すために使用されることもあります。
|
この散布図では、X座標に[受注数]、Y座標に[出荷数]という2つのメジャーを表現しています。
軸としては[営業マン]をプロットしています。[受注数]が多ければ当然[出荷数]も多いはずという前提のもとで見てみると、[新川 誠]という営業マンだけ、[受注数]の割に[出荷数]が大幅に少ないことが分かります。
この情報から、[新川 誠]さんは何らかのトラブルで出荷が出来ていないのでは?とチェックするなどのアクションを起こすことができます。また、軸を[営業マン]ではなく、[顧客]や[製品]などにすれば、出荷が滞っている顧客や製品を発見することも容易に実現できます。
グラフ選択の基本を間違えると、有効な情報を得ることができないことがあります。
例えば下図①(「2019年1期」など時系列データを円グラフで表現)や、②(異なるメジャーを積み上げグラフで表現)などは、何を目的にしているかが分かりにくいことを感じていただけると思います。
|
他にも、③のように目的に応じたグラフでも項目数が多すぎると見づらくなることがあります。また、④については推移表現に向いている折れ線で比較表現していますが、コンパクトな領域で表現できるので、おしいと言いつつ状況によってはアリかもしれないですね。
|
しっかりと基本を抑えれば、目的を明確にした上であえてはずしたグラフを使うといった高等テクニックも使えるようになります。
では、最後におまけで私がおススメの「分布プロット」をご紹介します。
このグラフは、複数軸/1メジャーで構成されており、メジャーに設定した数値の個別の値(軸1ごとの値)を点でプロットしてくれます。また複数軸にすることで、軸ごとのバラつきを並べて比較することもできるので、俯瞰的にバラつきを捉えたいときに便利です。
|
この例では、各製造工程におけるリードタイムのバラつきを表現しています。データは[工程名(軸2)][製造番号(軸1)][リードタイム(メジャー)]で構成されており、グラフ上の点のひとつひとつが各製造番号をプロットしています。よって、グラフの右へ行くほど製造リードタイムが長い製品となります。
2回に分けて進めてきた「ビジュアライゼーション」と「グラフ」のまとめです。
・何らかの目的を持ってグラフやクロス集計などで表現したり、情報をイメージすることを「ビジュアライゼーション」とする。
・グラフの基本構成は、「メジャー」と「軸」であり、これらの組み合わせでグラフが出来ていることを理解する。
・目的に応じたグラフを利用することで、誰にでも伝わりやすい情報となる。
・まずは、基本的なグラフパターンの特性を抑える。(棒、折れ線、円、コンボ、散布図)
・基本を抑えたら目的に応じて様々な表現にチャレンジする。
Qlik Senseで分析を行う際、前年同月のデータを使って比較をしたいと思ったことはありませんか?
先行ロードの機能を使用すると、すぐ下に記載されたLOAD文の結果をデータソースとして、上のLOAD文で使用することができます。
テーブルに表示する列や行を、ユーザーが選択できるようにする方法をご紹介します!