-
基本操作
機械学習
データのサンプリングを行う
はじめにTABLESAMPLE句を利用すると任意のテーブルやビューから、無作為にデータをサンプリングすることができます。例えば、機械学習のためのデータを準備する際にTABLESAMPLE句を利用して、学習データ/テスト...
- #テーブル
- #機械学習
-
FAQ
データ型を変更する際の注意点
はじめに既存テーブルのカラムのデータ型を変更しようとした際に、エラーが発生することがあります。今回の記事では、そのエラーが該当カラムに制約が付いていることが原因で発生した場合について、解決方法を紹...
- #エラー
-
基本操作
既存のテーブルを高速にコピーする方法
はじめにVerticaは既存のテーブルから新しいテーブルを作成する方法として、”COPY_TABLE” コマンドを利用することができます。論理的なコピーのため、”CREATE TABLE AS SELECT” と比較して高速です。動作イメージ...
- #テーブル
-
データロード
S3のデータをVerticaにロードする/外部テーブルを使用してS3内のデータファイルを検索する
はじめにVerticaをAWS上で利用している場合、以下のS3ダイレクト連携機能を利用することが可能です。①S3内のデータファイルをVerticaにロードする②外部テーブルを使用してS3内のデータファイルを検索する事前準備...
- #AWS
-
基本操作
テーブル間で特定のパーティションを入れ替える方法
はじめにテーブル間でパーティションを入れ替える方法をご紹介します。 例えば、テーブルの特定パーティションの洗い替えを行い、別テーブルのパーティションと入れ替えることができます。 その場合、洗い替える...
- #テーブル
- #パーティショニング
-
基本操作
FAQ
セッションを全てクローズする方法
実行中の全ての処理を強制的に終了したい場合は、CLOSE_ALL_SESSIONS を利用します。CLOSE_ALL_SESSIONS コマンドCLOSE_ALL_SESSIONS コマンドの構文およびパラメータの説明は、次のとおりです。構文CLOSE_ALL_SE...
- #セッション
-
基本操作
FAQ
Verticaの可用性設定を確認する方法
はじめにVerticaでは、データベースの可用性をK-Safety によって設定することができます。Verticaの可用性やK-Safetyにつきましては、以下の記事をご確認ください。Verticaの可用性機能https://www.ashisuto.co.j...
- #可用性
-
基本操作
FAQ
vertica.logのログローテート設定を変更する方法
はじめにvertica.logはLinuxのlogrotateにより、ログのローテートが行われます。デフォルトでは1日1回ログファイルのサイズがチェックされ、10MBを超えている場合はローテートされます。10MBを超えない場合も、週...
- #ログファイル
-
基本操作
機械学習
機械学習で作成したモデルのサマリー情報を確認する
はじめに機械学習で作成したモデルのサマリー情報を確認する場合は、GET_MODEL_SUMMARY関数を使用します。サマリー情報では、説明変数のp値や、モデル作成時に使用した説明変数やハイパーパラメータの値などを確...
- #機械学習
-
基本操作
新バージョン/機能
機械学習
任意のデータをOne-hot 表現に変換する(Vertica 9.0新機能)
はじめに機械学習を行う際、多くの場合はカテゴリデータをそのまま利用することはできないため、事前にベクトル表現に変換する必要があります。例えば、カラー列に「赤」、「緑」、「青」の三種類のデータがある...
- #機械学習