Imagen

Google Cloud Vertex AI で VantageCloud Lake の Teradata Jupyter Notebook デモを実行する方法

概要

このクイックスタートでは、Google Cloud の AI/ML プラットフォームである Vertex AI で Teradata Jupyter Notebook Demos for VantageCloud Lake を実行する方法について説明します。

前提条件

Vertex AI Google Cloud環境を構築する

新しいNotebookインスタンスを作成するときに、起動スクリプトを指定できます。このスクリプトはインスタンスの作成後に 1 回だけ実行され、Teradata Jupyter 拡張機能パッケージをインストールし、新しいユーザー管理のノートブック インスタンスに GitHub リポジトリのクローンを作成します。

  • Teradata Jupyter拡張パッケージをダウンロードする

  • Google Cloud Storage Bucketを作成する

    • プロジェクトに関連した名前でバケットを作成する(例: teradata_jupyter)でバケットを作成する。

    • バケット名がグローバルに一意であることを確認する。たとえば、teradata_jupyter という名前がすでに使用されている場合、後続のユーザーはその名前を使用できません。

新しいバケット
  • 解凍された Jupyter 拡張機能パッケージを Google Cloud Storage バケットにファイルとしてアップロードする。

  • 次の起動スクリプトを作成し、startup.sh としてローカルマシンに保存する。

以下は、Google Cloud Storage バケットから Teradata Jupyter 拡張機能パッケージを取得し、Teradata SQL カーネル、拡張機能をインストールし、lake-demos リポジトリのクローンを作成するスクリプトの例です。

gsutil cp コマンドの teradata_jupyter を忘れずに置き換えてください。

#! /bin/bash

cd /home/jupyter
mkdir teradata
cd teradata
gsutil cp gs://teradata_jupyter/* .
unzip teradatasql*.zip

# Install Teradata kernel
cp teradatakernel /usr/local/bin

jupyter kernelspec install ./teradatasql --prefix=/opt/conda

# Install Teradata extensions
pip install --find-links . teradata_preferences_prebuilt
pip install --find-links . teradata_connection_manager_prebuilt
pip install --find-links . teradata_sqlhighlighter_prebuilt
pip install --find-links . teradata_resultset_renderer_prebuilt
pip install --find-links . teradata_database_explorer_prebuilt

# PIP install the Teradata Python library
pip install teradataml==17.20.00.04

# Install Teradata R library (optional, uncomment this line only if you use an environment that supports R)
#Rscript -e "install.packages('tdplyr',repos=c('https://r-repo.teradata.com','https://cloud.r-project.org'))"

# Clone the Teradata lake-demos repository
su - jupyter -c "git clone https://github.com/Teradata/lake-demos.git"
  • このスクリプトをファイルとしてGoogle Cloudストレージバケットにアップロードする

バケットにアップロードされたファイル

ユーザー管理ノートブック インスタンスを開始する

  • 頂点AIワークベンチにアクセスする

    • Google Cloud コンソールの Vertex AI Workbench に戻る。

    • 詳細オプションを使用するか、https://notebook.new/で直接、新しいユーザー管理ノートブックを作成する。

  • Details(詳細)で、ノートブックに名前を付け、リージョンを選択して続行する。

ノートブック環境の詳細
  • Environment(環境)で Browse(参照) を選択して、Google Cloud Bucketからstartup.shスクリプトを選択する。

スタートアップスクリプトを選択する
  • 「Create (作成)」を選択してノートブックを開始する。Notebookの作成が完了するまで、数分かかる場合があります。完了したら、「OPEN JUPYTERLAB」をクリックします。

ノートブックをアクティブ化

接続を許可するには、VantageCloud Lake 環境でこの IP をホワイトリストに登録する必要があります。このソリューションは試用環境に適しています。実稼働環境の場合、VPC、サブネット、セキュリティ グループの構成を構成し、ホワイトリストに登録する必要がある場合があります。

  • JupyterLab で、Python カーネルを含むノートブックを開き、次のコマンドを実行してノートブック インスタンスの IP アドレスを見つけます。

python3 kernel
import requests
def get_public_ip():
    try:
        response = requests.get('https://api.ipify.org')
        return response.text
    except requests.RequestException as e:
        return "Error: " + str(e)
my_public_ip = get_public_ip()
print("My Public IP is:", my_public_ip)

VantageCloud Lakeを構成する

  • VantageCloud Lake環境で、[設定]の下にノートブックインスタンスのIPアドレスを追加します。

JupyterLabを開始する

vars.jsonを編集する

ノートブックの lake-demos ディレクトリに移動します。

ノートブックランチャー

vars.jsonを右クリックして、エディタでファイルを開きます。

vars.json

*https://github.com/Teradata/lake-demos/blob/main/vars.json[vars.json file]*ファイルを編集して、デモを実行するために必要な認証情報を含めます。

変数

"host"

VantageCloud Lakeの環境から得られるPublic IP値

"UES_URI"

VantageCloud Lake 環境からの Open Analytics

dbc"

VantageCloud Lake 環境のマスター パスワード

Public IPアドレスとOpen Analyticsエンドポイントを取得するには、次の 手順 に従います。

vars.json ファイルのパスワードを変更します。サンプル vars.json では、すべてのユーザーのパスワードがデフォルトで「password」に設定されていることがわかります。これはサンプル ファイルの問題にすぎず、これらのパスワードをすべて変更する必要があります。 フィールドを強力なパスワードに設定し、必要に応じて保護し、他のパスワード管理のベスト プラクティスに従ってください。

デモを実行する

0_Demo_Environment_Setup.ipynb 内のすべてのセルを実行して、環境をセットアップします。続いて 1_Demo_Setup_Base_Data.ipynb を実行して、デモに必要な基本データをロードします。

デモ ノートブックの詳細については、GitHubの Teradata Lake demos ページを参照してください。

まとめ

このクイックスタート ガイドでは、VantageCloud Lake の Teradata Jupyter Notebook Demos を実行するように Google Cloud Vertex AI Workbench Notebooks を構成しました。

このページは役に立ちましたか?