はじめに
機械学習で作成したモデルのサマリー情報を確認する場合は、GET_MODEL_SUMMARY関数を使用します。
サマリー情報では、説明変数のp値や、モデル作成時に使用した説明変数やハイパーパラメータの値などを確認できます。
例えば、どんなモデルを作成したか忘れてしまった場合や、モデル作成者がいなくなってしまった場合でも、GET_MODEL_SUMMARY関数を使用すれば簡単にモデルの情報を確認できます。
GET_MODEL_SUMMARY
コマンド構文
dbadmin=> SELECT GET_MODEL_SUMMARY (USING PARAMETERS model_name= 'モデル名');利用例
例として事前にロジスティック回帰分析を使用したmyLrClassModelモデルをしておきます。
dbadmin=> SELECT LOGISTIC_REG('myLrClassModel', 'mtcars_train1', 'am', 'mpg,carb');
LOGISTIC_REG
---------------------------
Finished in 7 iterations
(1 row)myLrClassModelモデルのサマリー情報を確認します。
dbadmin=> SELECT GET_MODEL_SUMMARY (USING PARAMETERS model_name= 'myLrClassModel');
GET_MODEL_SUMMARY
-------------------------------------------------
=======
details ★統計情報
=======
predictor|coefficient|std_err |z_value |p_value
---------+-----------+--------+--------+--------
Intercept| -24.55958 |12.38222|-1.98346| 0.04732
mpg | 0.80042 | 0.39917| 2.00519| 0.04494
carb | 2.59483 | 1.51426| 1.71360| 0.08660
==============
regularization ★正則化情報
==============
type| lambda
----+--------
none| 1.00000
===========
call_string ★モデル作成構文
===========
logistic_reg('public.myLrClassModel', 'mtcars_train1', '"am"', 'mpg,carb'
USING PARAMETERS optimizer='newton', epsilon=1e-06, max_iterations=100, regularization='none', lambda=1, alpha=0.5)
===============
Additional Info ★追加情報
===============
Name |Value
------------------+-----
iteration_count | 7
rejected_row_count| 0
accepted_row_count| 20
(1 row)参考情報
GET_MODEL_SUMMARY
https://my.vertica.com/docs/9.0.x/HTML/index.htm#Authoring/SQLReferenceManual/Functions/MachineLearning/GET_MODEL_SUMMARY.htm
検証バージョンについて
この記事の内容はVertica 9.0.2で確認しています。