はじめに
VerticaはSQLで機械学習を行うことができます。
本記事は、Verticaの機械学習機能のページをまとめた記事です。
Verticaで機械学習を行うことによるメリットは以下の記事をご確認ください。
Verticaで始める機械学習~ビッグデータ分析/IoTに有効な機械学習機能の紹介~
https://www.ashisuto.co.jp/cm/analytics-database/vertica-in-database-machine-learning.html
機械学習機能の一連の動作イメージを理解する
以下の記事では、機械学習のチュートリアルとして有名なタイタニック号の乗客生存予測をVerticaの機械学習を用いて実施しています。
Verticaで機械学習を実施する場合の一連の流れをご確認いただけます。
Verticaで始める機械学習~タイタニック号の乗客生存予測にチャレンジ~
https://www.ashisuto.co.jp/cm/analytics-database/machine_learning_titanic.html
各機能の詳細を理解する
以降の記事では、具体的な機械学習機能の利用方法を紹介しています。
データ準備に関する機能
各列の平均、中央値、最大値/最小値、標準偏差等を一括で確認する
https://www.ashisuto.co.jp/cm/analytics-database/summarize_numcol.html
異常値(外れ値)を検出/除外する
https://www.ashisuto.co.jp/cm/analytics-database/detect_outliers.html
欠損値を補完する
https://www.ashisuto.co.jp/cm/analytics-database/imputing_missing_values.html
任意のデータをOne-hot 表現に変換する
https://www.ashisuto.co.jp/cm/analytics-database/one_hot_encoder.html
データの正規化を行う
https://www.ashisuto.co.jp/cm/analytics-database/normalize.html
不均衡データをバランシングする(アンダー/オーバーサンプリング)
https://www.ashisuto.co.jp/cm/analytics-database/balance.html
データのサンプリングを行う
https://www.ashisuto.co.jp/cm/analytics-database/tablesample.html
主成分分析(PCA)を用いた次元削減
https://www.ashisuto.co.jp/cm/analytics-database/pca.html
モデル作成・実装に関する機能
回帰モデル
Verticaで始める機械学習~線形回帰を使った回帰~
https://www.ashisuto.co.jp/cm/analytics-database/linear_reg.html
Verticaで始める機械学習~SVM(サポートベクターマシン)を使った回帰~
https://www.ashisuto.co.jp/cm/analytics-database/svm_regressor.html
Verticaで始める機械学習~ランダムフォレストを使った回帰~
https://www.ashisuto.co.jp/cm/analytics-database/rf_regressor.html
分類モデル
Verticaで始める機械学習~ロジスティック回帰を使った分類~
https://www.ashisuto.co.jp/cm/analytics-database/logistic_reg.html
Verticaで始める機械学習~ナイーブベイズを使った分類~
https://www.ashisuto.co.jp/cm/analytics-database/naive_bayes.html
Verticaで始める機械学習~SVM(サポートベクターマシン)を使った分類~
https://www.ashisuto.co.jp/cm/analytics-database/vertica-ml-svm.html
Verticaで始める機械学習~ランダムフォレストを使った分類~
https://www.ashisuto.co.jp/cm/analytics-database/random_forest.html
クラスタリングモデル
Verticaで始める機械学習~k-meansを使ったクラスタリング~
https://www.ashisuto.co.jp/cm/analytics-database/kmeans.html
評価に関する機能
回帰モデルの評価
MSE/RMSEによる評価
https://www.ashisuto.co.jp/cm/analytics-database/mse.html
決定係数(R-squared)によるモデル評価
https://www.ashisuto.co.jp/cm/analytics-database/rsquared.html
分類モデルの評価
エラー率によるモデル評価
https://www.ashisuto.co.jp/cm/analytics-database/error_rate.html
Confusion Matrix(混同行列)によるモデル評価
https://www.ashisuto.co.jp/cm/analytics-database/confusion_matrix.html
ROC/AUCによるモデル評価
https://www.ashisuto.co.jp/cm/analytics-database/roc.html
PR曲線/F1値によるモデル評価
https://www.ashisuto.co.jp/cm/analytics-database/prc.html
モデル管理に関する機能
作成したモデルの一覧を確認する
https://www.ashisuto.co.jp/cm/analytics-database/models.html
作成したモデルのモデル名を変更する
https://www.ashisuto.co.jp/cm/analytics-database/renaming_a_model.html
モデルのスキーマを変更する
https://www.ashisuto.co.jp/cm/analytics-database/moving_models_to_another_schema.html
モデルの所有者を変更する
https://www.ashisuto.co.jp/cm/analytics-database/changing_model_ownership.html
作成したモデルを別の環境に移行する(モデルのエクスポート/インポート)
https://www.ashisuto.co.jp/cm/analytics-database/export_import_models.html
モデルを削除する
https://www.ashisuto.co.jp/cm/analytics-database/dropping_models.html

