-
基本操作
Verticaで中央値を算出する方法(MEDIAN分析関数)
はじめにVerticaでは、MEDIAN分析関数を使って、代表値の一つである中央値を算出することが出来ます。中央値は、外れ値を含むデータの実態をつかむのに便利です。※代表値とは、データセットの特徴を表す統計学上...
- #関数
-
基本操作
分析関数(ウィンドウ関数)の概要
はじめに本記事では、SQLでの分析の幅を広げる機能として注目されている、分析関数(ウィンドウ関数)の概要をご案内します。分析関数では、レコードのグルーピングを行いながら、レコードの集約をせずに1行ずつ処...
- #関数
-
基本操作
日付データを任意のフィールドで切り捨てる関数(DATE_TRUNC関数)
はじめにDATE_TRUNC関数を使うと、日付/時刻型のデータから、任意のフィールドまでデータを切り捨てることが可能です。年や月という単一の項目でなく、年と月をセットにしてグルーピングしたい場合などに便利です...
- #関数
-
基本操作
新バージョン/機能
機械学習
各列の平均、中央値、最大値/最小値、標準偏差等を一括で確認する(Vertica9.0新機能)
はじめに機械学習を行う際などは、対象データの平均、中央値、最大値/最小値、標準偏差等を確認して、データを俯瞰する必要があります。Vertica 9.0より、SUMMARIZE_NUMCOL関数を使用することで、これら統計サマ...
- #機械学習
- #関数
-
基本操作
機械学習
時系列データを一定の時間間隔で処理する
はじめにセンサーデータやログデータといったのストリームデータ(時系列データ)を使用してリアルタイムに監視等を行う際、データ1件1件を監視するのではなく、以下のように一定の時間間隔(ウィンドウ)の集計結果...
- #関数
-
基本操作
指定列の値が条件を満たす場合にカウントアップする列を追加する(Event Based Windows)
はじめにVertica拡張SQLのEvent Based Windowsを使用すると、指定列の値が条件を満たす場合にカウントアップする列を追加できます。CONDITIONAL_CHANGE_EVENTCONDITIONAL_CHANGE_EVENTを使用すると、指定列の値に...
- #関数
-
基本操作
テーブル内に格納されているデータと異なる時間間隔でデータを抽出する(Time Series Analytics)
はじめにVertica拡張SQLのTime Series Analyticsを使用すると、テーブル内に格納されているデータと異なる時間間隔でデータを抽出することができます。 例えば、株価が変動する度に書き込まれる取引明細テーブル...
- #関数
-
データロード
データロード時に関数などを使用しロードする方法
COPYコマンドで関数などを使用してロードする方法をご紹介します。概要データをCOPYコマンドを使用してロードする場合、そのままデータをロードするだけでなく、関数などを使用してデータを編集してロードするこ...
- #COPY
- #関数
-
基本操作
新バージョン/機能
テキストインデックスのマルチバイト文字対応(8.0新機能)
はじめにVertica8.0から、テキストインデックスがマルチバイト文字対応となり、日本語による全文検索が可能になりました。本記事では、テキストインデックスを用いた日本語による全文検索を行う方法を紹介します...
- #関数
-
基本操作
Verticaでファンクション機能を利用する方法
はじめにVerticaには汎用的なデータベース製品同様に、ファンクションが提供されています。ファンクションを使うことで、与えられたパラメータで計算やロジックを行い戻り値を返す処理を実行できます。この記事で...
- #関数