Concatenate(連結)で分析しやすいデータに加工する!

JOINに引き続き、データ準備のテクニックをご紹介します。今回はJOINと同じように複数テーブルを1つにまとめ、分析しやすいデータに加工できる「Concatenate」(連結)についてです。
似たデータやテーブルが複数あり、データ準備の過程で以下のような課題がある場合に有効です。
・テーブル数が多くなり、テーブル構造が把握しづらくなった
・循環参照(関連付けのループ)が発生し、関連付けが上手くいかない
・シンセティックキー(複合キー)ができ、データ量が増えた
本記事ではスクリプト(データ ロード エディタ)の方法をご紹介します。GUI(データ マネージャー)の方法を知りたい方はこちらをご覧ください。
目次
※本記事は バージョン「May 2021」の[SaaS]で作成しています。
Concatenateとは
ロード スクリプトのステートメントで、複数のテーブルを縦に「連結」するときに使用します。
例えば、似たデータを持つテーブルA、テーブルBがあるとします。
▼テーブルA
年月 | 商品名 | 売上 |
2021/05 | いちご | 100 |
▼テーブルB
年月 | 商品名 | 売上 | 担当者 |
2021/06 | りんご | 200 | A |
この2つをConcatenateすると以下のように縦に連結され、
テーブルを1つにまとめられます。
年月 | 商品名 | 売上 | 担当者 |
2021/05 | いちご | 100 | - |
2021/06 | りんご | 200 | A |
データ ロード エディタでConcatenateする方法
LOAD文の前に「Concatenate (連結先テーブル)」を指定します。(連結先テーブル)を省略すると直前にロードされたテーブルが連結先となります。意図しない動作とならないよう、明記することをお勧めします。
▼記述例
売上明細:
LOAD
年月,
商品名,
売上
FROM [lib://DataFiles/Book1.xlsx]
(ooxml, embedded labels, table is Sheet1);
Concatenate (売上明細)
LOAD
年月,
商品名,
売上,
担当者
FROM [lib://DataFiles/Book1.xlsx]
(ooxml, embedded labels, table is Sheet2);▼記述イメージ

さいごに
複数のテーブルを1つにまとめる方法として、JoinとConcatenateを紹介しました。
この2つの違いは、弊社サポート担当者が動画コンテンツ「BI学校」で
分かりやすく解説しています。(動画タイトル:JoinとConcatenate)
動画は弊社AWSCサイトのFAQで公開しておりますので
気になる方はチェックしてみてください!
AWSCアカウント登録方法はこちら
BI学校(動画コンテンツ)の一覧や視聴方法はこちら