- Oracle Cloud
- Oracle Database
OCIでGPUインスタンスを構築してみた
OCIで提供されている生成AIサービスとGPUインスタンスを前回の記事「生成AIにGPUが適している理由」で紹介しました。本記事では、GPUインスタンスをデプロイして、インスタンス上でLLM(大規模言語モデル)の動作環境を構築する方法をご紹介します。
|
Oracle Databaseのメモリ領域は、大きく分けるとSGAとPGAがあります。11gR1以降のリリースでは、自動メモリ管理(Automatic Memory Management:AMM)を利用することで、SGAとPGAを名前のとおり自動で管理してくれます。
例えば、共有プールとして使用したいメモリが不足すると、バッファキャッシュから共有プールにメモリを動的に割り当て、ORA-04031の発生を防いでくれるなど非常に有効な機能なのですが、設定によって獲得される共有メモリのサイズについて正しい認識をしておかないと、思わぬトラブルを引き起こします。
自動メモリ管理(AMM)を利用するには、初期化パラメータMEMORY_TARGET/MEMORY_MAX_TARGETを設定します。
MEMORY_TARGETはSGAとPGAの合計で使用するメモリサイズのターゲットを指定し、MEMORY_MAX_TARGETを指定することで使用可能な最大メモリサイズを設定することが可能です。
関連するパラメータの関係を簡単にまとめると以下のとおりです。
・MEMORY_MAX_TARGETはMEMORY_TARGET以上の値を設定する(指定しなくても良い)
・MEMORY_TARGETを設定、MEMORY_MAX_TARGETが未設定の場合、
MEMORY_TARGET = MEMORY_MAX_TARGETに設定される
・MEMORY_MAX_TARGET > MEMORY_TARGET の場合、
MEMORY_MAX_TARGETの値までMEMORY_TARGETをインスタンス稼働中に増やすことが可能
・SGA_MAX_SIZEが未設定の場合、MEMORY_MAX_TARGETの値が設定される
最後の、SGA_MAX_SIZEのデフォルト値がMEMORY_MAX_TARGETの値であることに注意が必要です。
SGAとPGAのサイジングについては実測値ベースで検討することが多いため、MEMORY_TARGETに設定する値を段階的に増やして様子を見たいという要望は少なくありません。
MEMORY_MAX_TARGETは静的なパラメータです。設定値の変更を有効にするには再起動が必要なため、MEMORY_MAX_TARGETに非常に大きな値を設定し、不足していた場合に増加することを考慮してMEMORY_TARGETを小さめの値に設定されているケースがあります。
Oracle Databaseはインスタンス起動時、SGA_MAX_SIZEの値で共有メモリを獲得します。
つまり、"MEMORY_MAX_TARGET > MEMORY_TARGET"で値を指定していた場合には、デフォルトではSGA_MAX_SIZE = MEMORY_MAX_TARGETとなるため、MEMORY_MAX_TARGETに指定した値の分だけ共有メモリが獲得されます。
▲MEMORY_MAX_TARGET(SGA_MAX_SIZE) = MEMORY_TARGET時のipcsコマンドの結果 |
▲MEMORY_MAX_TARGET(SGA_MAX_SIZE) > MEMORY_TARGET時のipcsコマンドの結果 |
MEMORY_MAX_TARGETに必要以上に大きな値を設定してしまうことで意図せず共有メモリが獲得されてしまい、パフォーマンスダウンやメモリ枯渇に起因したエラーが発生したというお問い合わせは少なくありません。
特に、同一サーバ内に複数のデータベースを作成している環境では、いずれかのデータベースでこのような設定を行うことによって、他のデータベースで影響が顕在化することもあります。
なお、MEMORY_MAX_TARGET > SGA_MAX_SIZE で初期化パラメータを明示的に設定することで獲得する共有メモリを指定することはできますが、この場合、自動メモリ管理で調整されるSGAの幅がSGA_MAX_SIZEで指定した範囲内に限定されてしまいますので、自動メモリ管理の恩恵を十分に受けることができません。
SGA_MAX_SIZEのデフォルト値はリファレンスマニュアルの
SGA_MAX_SIZE
には記載されていますが、
MEMORY_TARGET
/
MEMORY_MAX_TARGET
には記載されていないため、知らずに変更をされてしまうケースがあります。
MEMORY_TARGET/MEMORY_MAX_TARGETはSGA_MAX_SIZE以外にも、Linux環境でHugePagesを使用する場合は無効化しておく、/dev/shm(共有メモリのサイズ)よりも小さい値を指定する(ORA-00845)必要があるなどの注意点もあります。この点については
管理者リファレンス
や
インストレーション・ガイド
に記載されています。
初期化パラメータの変更を行う際には、その初期化パラメータだけでなく他に影響する範囲がないか、ということも慎重に確認するようにしましょう。
サービス事業部 サポートセンター
2007年にアシスト入社後、Oracle Databaseのサポート業務に従事。現在はサポートの傍ら、未解決のトラブルを一つでも多く減らせるよう、サポートセンターに蓄積されているノウハウを社内外に伝える活動を行っている。
■本記事の内容について
本記事に示した定義及び条件は変更される場合があります。あらかじめご了承ください。
■商標に関して
・Oracle®、Java、MySQL及びNetSuiteは、Oracle、その子会社及び関連会社の米国及びその他の国における登録商標です。
・Amazon Web Services、AWS、Powered by AWS ロゴ、[およびかかる資料で使用されるその他の AWS 商標] は、Amazon.com, Inc. またはその関連会社の商標です。
文中の社名、商品名等は各社の商標または登録商標である場合があります。
OCIで提供されている生成AIサービスとGPUインスタンスを前回の記事「生成AIにGPUが適している理由」で紹介しました。本記事では、GPUインスタンスをデプロイして、インスタンス上でLLM(大規模言語モデル)の動作環境を構築する方法をご紹介します。
前回の記事でお伝えしたとおり、OCVSを構築するとVMwareの複数の機能が利用可能です。 それらの機能の中で、今回はHCXの概要や具体的な機能、OCVSでHCXを利用するメリットなどをお伝えします!
2024年5月にOracle Cloud環境にて、先行してOracle DB 23aiがリリースされました。 Oracle Base Database ServiceにおけるOracle Database 23aiの検証結果を報告します。 今回は「統合メモリー管理」をテーマにお伝えします。