OpenText Analytics Database 旧Vertica

技術情報サイト

Analytics Database

機械学習に関するまとめ記事

公開日:
更新日:
まとめ記事
機械学習
#機械学習

はじめに

VerticaはSQLで機械学習を行うことができます。
本記事は、Verticaの機械学習機能のページをまとめた記事です。

Verticaで機械学習を行うことによるメリットは以下の記事をご確認ください。

  • Verticaで始める機械学習~ビッグデータ分析/IoTに有効な機械学習機能の紹介~

https://www.ashisuto.co.jp/cm/analytics-database/vertica-in-database-machine-learning.html

機械学習機能の一連の動作イメージを理解する

以下の記事では、機械学習のチュートリアルとして有名なタイタニック号の乗客生存予測をVerticaの機械学習を用いて実施しています。
Verticaで機械学習を実施する場合の一連の流れをご確認いただけます。

  • Verticaで始める機械学習~タイタニック号の乗客生存予測にチャレンジ~

https://www.ashisuto.co.jp/cm/analytics-database/machine_learning_titanic.html

各機能の詳細を理解する

以降の記事では、具体的な機械学習機能の利用方法を紹介しています。

データ準備に関する機能

  • 各列の平均、中央値、最大値/最小値、標準偏差等を一括で確認する

https://www.ashisuto.co.jp/cm/analytics-database/summarize_numcol.html

  • 異常値(外れ値)を検出/除外する

https://www.ashisuto.co.jp/cm/analytics-database/detect_outliers.html

  • 欠損値を補完する

https://www.ashisuto.co.jp/cm/analytics-database/imputing_missing_values.html

  • 任意のデータをOne-hot 表現に変換する

https://www.ashisuto.co.jp/cm/analytics-database/one_hot_encoder.html

  • データの正規化を行う

https://www.ashisuto.co.jp/cm/analytics-database/normalize.html

  • 不均衡データをバランシングする(アンダー/オーバーサンプリング)

https://www.ashisuto.co.jp/cm/analytics-database/balance.html

  • データのサンプリングを行う

https://www.ashisuto.co.jp/cm/analytics-database/tablesample.html

  • 主成分分析(PCA)を用いた次元削減

https://www.ashisuto.co.jp/cm/analytics-database/pca.html

モデル作成・実装に関する機能

回帰モデル

  • Verticaで始める機械学習~線形回帰を使った回帰~

https://www.ashisuto.co.jp/cm/analytics-database/linear_reg.html

  • Verticaで始める機械学習~SVM(サポートベクターマシン)を使った回帰~

https://www.ashisuto.co.jp/cm/analytics-database/svm_regressor.html

  • Verticaで始める機械学習~ランダムフォレストを使った回帰~

https://www.ashisuto.co.jp/cm/analytics-database/rf_regressor.html

分類モデル

  • Verticaで始める機械学習~ロジスティック回帰を使った分類~

https://www.ashisuto.co.jp/cm/analytics-database/logistic_reg.html

  • Verticaで始める機械学習~ナイーブベイズを使った分類~

https://www.ashisuto.co.jp/cm/analytics-database/naive_bayes.html

  • Verticaで始める機械学習~SVM(サポートベクターマシン)を使った分類~

https://www.ashisuto.co.jp/cm/analytics-database/vertica-ml-svm.html

  • Verticaで始める機械学習~ランダムフォレストを使った分類~

https://www.ashisuto.co.jp/cm/analytics-database/random_forest.html

クラスタリングモデル

  • Verticaで始める機械学習~k-meansを使ったクラスタリング~

https://www.ashisuto.co.jp/cm/analytics-database/kmeans.html

評価に関する機能

回帰モデルの評価

  • MSE/RMSEによる評価

https://www.ashisuto.co.jp/cm/analytics-database/mse.html

  • 決定係数(R-squared)によるモデル評価

https://www.ashisuto.co.jp/cm/analytics-database/rsquared.html

分類モデルの評価

  • エラー率によるモデル評価

https://www.ashisuto.co.jp/cm/analytics-database/error_rate.html

  • Confusion Matrix(混同行列)によるモデル評価

https://www.ashisuto.co.jp/cm/analytics-database/confusion_matrix.html

  • ROC/AUCによるモデル評価

https://www.ashisuto.co.jp/cm/analytics-database/roc.html

  • PR曲線/F1値によるモデル評価

https://www.ashisuto.co.jp/cm/analytics-database/prc.html

モデル管理に関する機能

  • 作成したモデルの一覧を確認する

https://www.ashisuto.co.jp/cm/analytics-database/models.html

  • 作成したモデルのモデル名を変更する

https://www.ashisuto.co.jp/cm/analytics-database/renaming_a_model.html

  • モデルのスキーマを変更する

https://www.ashisuto.co.jp/cm/analytics-database/moving_models_to_another_schema.html

  • モデルの所有者を変更する

https://www.ashisuto.co.jp/cm/analytics-database/changing_model_ownership.html

  • 作成したモデルを別の環境に移行する(モデルのエクスポート/インポート)

https://www.ashisuto.co.jp/cm/analytics-database/export_import_models.html

  • モデルを削除する

https://www.ashisuto.co.jp/cm/analytics-database/dropping_models.html