Google Cloud Vertex AI で VantageCloud Lake の Teradata Jupyter Notebook デモを実行する方法
概要
このクイックスタートでは、Google Cloud の AI/ML プラットフォームである Vertex AI で Teradata Jupyter Notebook Demos for VantageCloud Lake を実行する方法について説明します。
前提条件
-
Teradata modules for Jupyter Linuxデスクトップ版(ダウンロードは こちら 、登録が必要です)
-
Vertex AI と Notebooks API が有効になっている Google Cloud アカウント
-
起動スクリプトと Teradata Jupyter 拡張パッケージを保存するための Google クラウド ストレージ
Vertex AI Google Cloud環境を構築する
新しいNotebookインスタンスを作成するときに、起動スクリプトを指定できます。このスクリプトはインスタンスの作成後に 1 回だけ実行され、Teradata Jupyter 拡張機能パッケージをインストールし、新しいユーザー管理のノートブック インスタンスに GitHub リポジトリのクローンを作成します。
-
Teradata Jupyter拡張パッケージをダウンロードする
-
Vantage Modules for Jupyterページ にアクセスする- サインインして、Teradata Linuxバージョンのパッケージをダウンロードする。
-
-
Google Cloud Storage Bucketを作成する
-
プロジェクトに関連した名前でバケットを作成する(例: teradata_jupyter)でバケットを作成する。
-
バケット名がグローバルに一意であることを確認する。たとえば、teradata_jupyter という名前がすでに使用されている場合、後続のユーザーはその名前を使用できません。
-
![新しいバケット](../../_images/vantagecloud-lake/vantage-lake-demo-jupyter-google-cloud-vertex-ai/bucket.png)
-
解凍された Jupyter 拡張機能パッケージを Google Cloud Storage バケットにファイルとしてアップロードする。
-
次の起動スクリプトを作成し、
startup.sh
としてローカルマシンに保存する。
以下は、Google Cloud Storage バケットから Teradata Jupyter 拡張機能パッケージを取得し、Teradata SQL カーネル、拡張機能をインストールし、lake-demos リポジトリのクローンを作成するスクリプトの例です。
gsutil cp コマンドの teradata_jupyter を忘れずに置き換えてください。 |
#! /bin/bash
cd /home/jupyter
mkdir teradata
cd teradata
gsutil cp gs://teradata_jupyter/* .
unzip teradatasql*.zip
# Install Teradata kernel
cp teradatakernel /usr/local/bin
jupyter kernelspec install ./teradatasql --prefix=/opt/conda
# Install Teradata extensions
pip install --find-links . teradata_preferences_prebuilt
pip install --find-links . teradata_connection_manager_prebuilt
pip install --find-links . teradata_sqlhighlighter_prebuilt
pip install --find-links . teradata_resultset_renderer_prebuilt
pip install --find-links . teradata_database_explorer_prebuilt
# PIP install the Teradata Python library
pip install teradataml==17.20.00.04
# Install Teradata R library (optional, uncomment this line only if you use an environment that supports R)
#Rscript -e "install.packages('tdplyr',repos=c('https://r-repo.teradata.com','https://cloud.r-project.org'))"
# Clone the Teradata lake-demos repository
su - jupyter -c "git clone https://github.com/Teradata/lake-demos.git"
-
このスクリプトをファイルとしてGoogle Cloudストレージバケットにアップロードする
![バケットにアップロードされたファイル](../../_images/vantagecloud-lake/vantage-lake-demo-jupyter-google-cloud-vertex-ai/upload.png)
ユーザー管理ノートブック インスタンスを開始する
-
頂点AIワークベンチにアクセスする
-
Google Cloud コンソールの Vertex AI Workbench に戻る。
-
詳細オプションを使用するか、https://notebook.new/で直接、新しいユーザー管理ノートブックを作成する。
-
-
Details(詳細)で、ノートブックに名前を付け、リージョンを選択して続行する。
![ノートブック環境の詳細](../../_images/vantagecloud-lake/vantage-lake-demo-jupyter-google-cloud-vertex-ai/detailsenv.png)
-
Environment(環境)で Browse(参照) を選択して、Google Cloud Bucketからstartup.shスクリプトを選択する。
![スタートアップスクリプトを選択する](../../_images/vantagecloud-lake/vantage-lake-demo-jupyter-google-cloud-vertex-ai/startupscript.png)
-
「Create (作成)」を選択してノートブックを開始する。Notebookの作成が完了するまで、数分かかる場合があります。完了したら、「OPEN JUPYTERLAB」をクリックします。
![ノートブックをアクティブ化](../../_images/vantagecloud-lake/vantage-lake-demo-jupyter-google-cloud-vertex-ai/activenotebook.png)
接続を許可するには、VantageCloud Lake 環境でこの IP をホワイトリストに登録する必要があります。このソリューションは試用環境に適しています。実稼働環境の場合、VPC、サブネット、セキュリティ グループの構成を構成し、ホワイトリストに登録する必要がある場合があります。 |
-
JupyterLab で、Python カーネルを含むノートブックを開き、次のコマンドを実行してノートブック インスタンスの IP アドレスを見つけます。
![python3 kernel](../../_images/vantagecloud-lake/vantage-lake-demo-jupyter-google-cloud-vertex-ai/python3.png)
import requests
def get_public_ip():
try:
response = requests.get('https://api.ipify.org')
return response.text
except requests.RequestException as e:
return "Error: " + str(e)
my_public_ip = get_public_ip()
print("My Public IP is:", my_public_ip)
vars.jsonを編集する
ノートブックの lake-demos
ディレクトリに移動します。
![ノートブックランチャー](../../_images/vantagecloud-lake/vantage-lake-demo-jupyter-google-cloud-vertex-ai/notebooklauncher.png)
vars.jsonを右クリックして、エディタでファイルを開きます。
![vars.json](../../_images/vantagecloud-lake/vantage-lake-demo-jupyter-google-cloud-vertex-ai/openvars.png)
*https://github.com/Teradata/lake-demos/blob/main/vars.json[vars.json file]*ファイルを編集して、デモを実行するために必要な認証情報を含めます。
変数 |
値 |
"host" |
VantageCloud Lakeの環境から得られるPublic IP値 |
"UES_URI" |
VantageCloud Lake 環境からの Open Analytics |
dbc" |
VantageCloud Lake 環境のマスター パスワード |
Public IPアドレスとOpen Analyticsエンドポイントを取得するには、次の 手順 に従います。
vars.json ファイルのパスワードを変更します。サンプル vars.json では、すべてのユーザーのパスワードがデフォルトで「password」に設定されていることがわかります。これはサンプル ファイルの問題にすぎず、これらのパスワードをすべて変更する必要があります。 フィールドを強力なパスワードに設定し、必要に応じて保護し、他のパスワード管理のベスト プラクティスに従ってください。 |
デモを実行する
0_Demo_Environment_Setup.ipynb 内のすべてのセルを実行して、環境をセットアップします。続いて 1_Demo_Setup_Base_Data.ipynb を実行して、デモに必要な基本データをロードします。
デモ ノートブックの詳細については、GitHubの Teradata Lake demos ページを参照してください。
まとめ
このクイックスタート ガイドでは、VantageCloud Lake の Teradata Jupyter Notebook Demos を実行するように Google Cloud Vertex AI Workbench Notebooks を構成しました。