-
基本操作
機械学習
ROC/AUCによるモデル評価
はじめに機械学習の分類において、作成した予測モデルを評価する際にROC/AUCを用いることがあります。VerticaはROC関数を利用するとROC/AUCによる評価を行えます。ROCコマンド構文ROC ( targets, probabilities...
- #機械学習
-
基本操作
機械学習
Confusion Matrix(混同行列)によるモデル評価
はじめに機械学習の分類において、作成した予測モデルを評価する際に混同行列(Confusion Matrix)を用いることがあります。VerticaはCONFUSION_MATRIX関数を利用するとConfusion Matrixによる評価を行えます。CO...
- #機械学習
-
基本操作
機械学習
異常値(外れ値)を検出/除外する
はじめに機械学習において、学習データの中に他と比較して極端に大きな値や小さな値といった「異常値」が存在すると、その値の影響により正しい学習が行えない場合があります。そのため、異常値はノイズとして事...
- #機械学習
-
基本操作
機械学習
不均衡データをバランシングする(アンダー/オーバーサンプリング)
はじめに機械学習において分類問題などを扱う場合、学習対象データのクラス比率が不均衡であると正しい学習ができないことがあります。このような場合、件数が多い方のデータを削減する「アンダーサンプリング」...
- #機械学習
-
基本操作
機械学習
データの正規化を行う
はじめに機械学習において数値データの列を説明変数として利用する場合は、事前に正規化を行うと精度が向上することがあります。例えば従業員データの内、「給与」列と「勤続年数」列を説明変数として機械学習に...
- #機械学習
-
基本操作
チューニング
統計情報が取得されたタイムスタンプ
はじめに一般的にデータベースは統計情報を取得することで、オプティマイザが実行計画を立てる際に役立ちます。Verticaも同様に、統計情報を取得することが推奨されます。この記事では、統計情報が最後に取得され...
- #統計情報
-
基本操作
FAQ
文字型のデータ長の指定
はじめにVerticaの文字型のデータ長について記載します。文字型のデータ長の指定VARCHAR(10)やCHAR(10)のように文字型のデータ長を指定する数値があります。この数値は、文字数なのかバイト数なのかというお問い...
- #UTF8
-
基本操作
FAQ
ハードウェア構成変更時のVertica要件チェック
はじめにVerticaは、データ量やユーザーの増加にあわせ、ハードウェアを柔軟にスケールアップ、スケールアウトすることができます。特に仮想環境やクラウドを使っている場合は、その恩恵を得やすいでしょう。ハー...
- #要件
-
基本操作
コマンドラインからデータベースを即時停止する方法
はじめに通常、Vertica のデータベース停止操作をした場合、ユーザセッションが存在すると NOTICE 2519 が発生し、操作が中断されます。この記事では、ユーザの接続有無に関わらず即時にデータベースを停止する方...
- #起動
- #停止
-
機械学習
お知らせ
【SQLで機械学習】Vertica×機械学習 ~需要予測デモ~
SQLで機械学習 Verticaはデータベースでありながら、ハイパフォーマンスな機械学習機能を持っており機械学習モデルの作成や、モデルを使った予測をSQLで簡単、高速に実現できます。本動画では、Verticaの機械学習...
- #機械学習
- #デモ動画