JOINに引き続き、データ準備のテクニックをご紹介します。
今回はJOINと同じように複数テーブルを1つにまとめ、
分析しやすいデータに加工できる「Concatenate」(連結)についてです。
似たデータやテーブルが複数あり、データ準備の過程で
以下のような課題がある場合に有効です。
・テーブル数が多くなり、テーブル構造が把握しづらくなった
・循環参照(関連付けのループ)が発生し、関連付けが上手くいかない
・シンセティックキー(複合キー)ができ、データ量が増えた
本記事ではスクリプト(データ ロード エディタ)の方法をご紹介します。
GUI(データ マネージャー)の方法を知りたい方は
こちらをご覧ください。
目次
※本記事は バージョン「May 2021」の[SaaS]で作成しています。
Concatenateとは
ロード スクリプトのステートメントで、複数のテーブルを縦に「連結」するときに使用します。
例えば、似たデータを持つテーブルA、テーブルBがあるとします。
▼テーブルA
年月 |
商品名 |
売上 |
2021/05 |
いちご |
100 |
▼テーブルB
年月 |
商品名 |
売上 |
担当者 |
2021/06 |
りんご |
200 |
A |
この2つをConcatenateすると以下のように縦に連結され、
テーブルを1つにまとめられます。
年月 |
商品名 |
売上 |
担当者 |
2021/05 |
いちご |
100 |
- |
2021/06 |
りんご |
200 |
A |
データ ロード エディタでConcatenateする方法
LOAD文の前に「Concatenate (連結先テーブル)」を指定します。
(連結先テーブル)を省略すると直前にロードされたテーブルが連結先となります。
意図しない動作とならないよう、明記することをお勧めします。
▼記述例
売上明細:
LOAD
年月,
商品名,
売上
FROM [lib://DataFiles/Book1.xlsx]
(ooxml, embedded labels, table is Sheet1);
Concatenate (売上明細)
LOAD
年月,
商品名,
売上,
担当者
FROM [lib://DataFiles/Book1.xlsx]
(ooxml, embedded labels, table is Sheet2);
▼記述イメージ
さいごに
複数のテーブルを1つにまとめる方法として、JoinとConcatenateを紹介しました。
この2つの違いは、弊社サポート担当者が動画コンテンツ「BI学校」で
分かりやすく解説しています。(動画タイトル:JoinとConcatenate)
動画は弊社AWSCサイトのFAQで公開しておりますので
気になる方はチェックしてみてください!
AWSCアカウント登録方法はこちら
BI学校(動画コンテンツ)の一覧や視聴方法はこちら