-
基本操作
新バージョン/機能
機械学習
Cross-Validation(交差検証)を行い、最適なアルゴリズム/パラメータを発見する(Vertica9.0新機能)
はじめに機械学習を行う際、最適なアルゴリズムやパラメータを見極めるための評価手法としてCross-Validation(交差検証)を使用することができます。例えば、10,000件のデータで予測モデルを作成する場合、学習デ...
- #機械学習
-
基本操作
新バージョン/機能
機械学習
各列の平均、中央値、最大値/最小値、標準偏差等を一括で確認する(Vertica9.0新機能)
はじめに機械学習を行う際などは、対象データの平均、中央値、最大値/最小値、標準偏差等を確認して、データを俯瞰する必要があります。Vertica 9.0より、SUMMARIZE_NUMCOL関数を使用することで、これら統計サマ...
- #機械学習
- #関数
-
基本操作
Verticaをsyslog監視する方法
はじめに本記事では、Verticaで発生したイベント(エラーや警告など)をOSのsyslogに出力する方法を紹介します。 この設定を行う事で、syslog監視の仕組みを使ってVerticaの監視をする事ができようになりますので...
- #監視
-
基本操作
LONG VARCHAR型の列にLIKE検索をする方法
はじめにSQLでLONG VARCHAR型の列にLIKE検索する方法をご紹介します。LONG VARCHAR型の列に、通常のLIKE検索を行うと下記エラーが表示され検索することができません。(例) dbadmin=> select count(*) from tbl...
- #vsql
-
基本操作
機械学習
Verticaで始める機械学習~ランダムフォレストを使った分類~
Verticaでは、機械学習の分類アルゴリズムとしてランダムフォレストを利用できます。ランダムフォレストとはランダムフォレストは、機械学習における教師あり学習で、分類を行う際に利用できます。ランダムフォレ...
- #機械学習
-
基本操作
チューニング
新バージョン/機能
階層的なパーティション管理(Vertica9.0新機能)
はじめにパーティション機能を利用すると、不要なデータへのアクセスを削減できパフォーマンスを向上できます。しかし、これまでのパーティション機能は、テーブルの全データに対して、一定単位でしかパーティシ...
- #パーティショニング
-
基本操作
外部テーブル用のCSVファイルを配置する場所
はじめにVerticaでは、CSVファイルを外部テーブルとして利用する事ができます。当記事では、複数台ノードで構成されたVerticaクラスタ構成で外部テーブル用に使用するCSVファイルを配置する場所についての注意点...
- #テーブル
-
基本操作
DROP TABLE実行時の留意点
DROP TABLE実行時の留意点DROP TABLEの仕様DROP TABLE実行時に以下のエラーが発生する場合があります。dbadmin=> DROP TABLE schema1.table1; NOTICE 4927: The Projection table1_DBD_1_rep_dbd1213 depends ...
- #テーブル
- #注意点
-
基本操作
新バージョン/機能
UUIDデータ型のサポート(Vertica9.0新機能)
はじめにVertica9.0より、Universally Unique Identifier (以下、UUID)データ型をサポートしています。Vertica9.0からは、UUIDデータ型がサポートされ、16バイトで管理することができるようになりました。 これま...
- #データ型
-
基本操作
機械学習
Verticaで始める機械学習~k-meansを使ったクラスタリング~
Verticaでは、機械学習のクラスタリングアルゴリズムとしてk-means(k平均法)を利用できます。k-meansとはk-meansは、機械学習における教師なし学習で、クラスタリングを行う際に利用されます。k-meansの利用例は...
- #機械学習