-
基本操作
機械学習
Pythonを利用したユーザー定義拡張関数
はじめに本記事では、Verticaの拡張機能であるユーザー定義拡張関数(UDx)を紹介します。ユーザー定義拡張関数(UDx)とはユーザー定義拡張関数とは、外部の言語を用いて書かれた関数です。通常のSQLでの記述が難し...
- #機械学習
- #関数
-
基本操作
機械学習
インストール
Rを利用したユーザ定義拡張関数の実行環境セットアップ
はじめにVerticaの拡張機能であるユーザー定義拡張関数(UDx)は「R/Pythonなどの言語で書かれたプログラム」と「データベース操作言語のSQL」をシームレスに連携する手段を提供します。利用する言語によってそれぞ...
- #R
-
基本操作
機械学習
Rを利用したユーザー定義拡張関数
はじめに本記事では、Verticaの拡張機能であるユーザー定義拡張関数(UDx)を紹介します。ユーザー定義拡張関数(UDx)とはユーザー定義拡張関数とは、外部の言語を用いて書かれた関数です。通常のSQLでの記述が難し...
- #R
-
基本操作
機械学習
Rで記述したモデルを用いて機械学習
はじめに本記事では、Rで記述された機械学習の関数をVerticaに読み込んで予測を行う方法に関して説明します。 流れは以下の通りになります。 ・使用するデータ(irisデータ)を読み込む。 ・学習用データからモデル...
- #R
- #機械学習
-
基本操作
機械学習
機械学習のトレーニングで使用可能なデータ型
はじめに本記事では、機械学習アルゴリズムのトレーニングで使用できるデータ型について、ご紹介します。各アルゴリズムで使用できるデータ型には「Y」、使用できないデータ型には「N」を記しています。回帰モデ...
- #機械学習
- #トレーニング
- #データ型
-
まとめ記事
機械学習
機械学習に関するまとめ記事
はじめにVerticaはSQLで機械学習を行うことができます。本記事は、Verticaの機械学習機能のページをまとめた記事です。Verticaで機械学習を行うことによるメリットは以下の記事をご確認ください。Verticaで始める...
- #機械学習
-
基本操作
機械学習
主成分分析(PCA)を用いた次元削減
はじめに機械学習において、多くの特徴量を使用することは学習時間の増加を招いたり、多重共線性の確認を難しくする可能性があります。また、データの内容を理解する際も、3次元(x,y,z)を超えると可視化が難しく...
- #機械学習
-
基本操作
機械学習
PR曲線/F1値によるモデル評価
はじめに機械学習の分類において、作成した予測モデルを評価する際にPR曲線/F1値を用いることがあります。VerticaはPRC関数を利用するとPR曲線/F1値による評価を行えます。PRCコマンド構文PRC ( target, probab...
- #機械学習
-
基本操作
機械学習
作成したモデルの一覧を確認する
Verticaの機械学習機能を使用して作成したモデルはmodelsシステムテーブルで情報を確認することが可能です。利用例dbadmin=> SELECT * FROM models; model_id | model_name | schema_id | schema_name | owner...
- #機械学習
-
基本操作
機械学習
決定係数(R-squared)によるモデル評価
はじめに機械学習の回帰問題において、作成した予測モデルを評価する際に決定係数(R-squared)を確認したい場合があります。VerticaはRSQUARED関数を利用すると決定係数による評価を行えます。RSQUAREDコマンド構...
- #機械学習