Teradata AI Unlimitedを使用してJupyterLabでサンプルワークロードを実行する
この製品はプレビュー版であり、変更される可能性があります。このサービスの詳細について興味がある場合は、Teradata サポートにお問い合わせください。 |
概要
このドキュメントでは、JupyterLab を使用して以下のことを行うための簡単なワークフローについて説明します。
-
オンデマンドでスケーラブルなコンピューティングをデプロイメントする
-
外部データソースに接続する
-
ワークロードの実行する
-
計算を中断する
始める前に
-
Teradata AI Unlimited Workspaces と JupyterLab をデプロイして構成します。Dockerを使用した Teradata AI Unlimited Workspaceサービスのデプロイとセットアップ と Dockerを使用した Teradata AI Unlimited インターフェースのデプロイ を参照してください。
-
以下をコピーして保持します。
-
コンソールからの CSP 環境変数。環境変数 を参照してください。
-
ワークスペースサービスからのAPIキー。
-
最初のワークロードを実行する
マジックコマンドの詳細については、%help
または %help <command>
を実行してください。詳細については、Teradata AI Unlimited JupyterLab マジック コマンド リファレンス を参照してください。
-
URL: http://localhost:8888 を使用して JupyterLab に接続し、プロンプトが表示されたらトークンを入力します。
-
APIキーを使用してワークスペースサービスに接続します。
%workspaces_config host=<ip_or_hostname>, apikey=<API_Key>, withtls=F
-
新しいプロジェクトを作成します。
現在、Teradata AI Unlimited は AWS と Azure をサポートしています。 %project_create project=<Project_Name>, env=<CSP>, team=<Project_Team>
-
(オプション) CSP 信頼証明を保存するための認証オブジェクトを作成します。
ACCESS_KEY_ID
、SECRET_ACCESS_KEY
、およびREGION
を実際の値に置き換えます。%project_auth_create name=<Auth_Name>, project=<Project_Name>, key=<ACCESS_KEY_ID>, secret=<SECRET_ACCESS_KEy>, region=<REGION>
-
プロジェクトのエンジンをデプロイします。
<Project_Name> を任意の名前に置き換えます。サイズパラメータ値には、small、medium、large、またはextralargeを指定できます。デフォルトのサイズはsmallです。
%project_engine_deploy name=<Project_Name>, size=<Size_of_Engine>
デプロイのプロセスが完了するまでに数分かかります。デプロイメントが成功すると、パスワードが生成されます。
-
プロジェクトとの接続を確立します。
%connect <Project_Name>
接続が確立されると、インターフェースによってパスワードの入力が求められます。前のステップで生成されたパスワードを入力します。
-
サンプルワークロードを実行します。
選択したデータベースに SalesCenter または SalesDemo という名前のテーブルがないことを確認してください。 -
販売センターのデータを格納するテーブルを作成します。
まず、テーブルがすでに存在する場合は削除します。テーブルが存在しない場合、コマンドは失敗します。
DROP TABLE SalesCenter; CREATE MULTISET TABLE SalesCenter ,NO FALLBACK , NO BEFORE JOURNAL, NO AFTER JOURNAL, CHECKSUM = DEFAULT, DEFAULT MERGEBLOCKRATIO ( Sales_Center_id INTEGER NOT NULL, Sales_Center_Name VARCHAR(255) CHARACTER SET LATIN NOT CASESPECIFIC) NO PRIMARY INDEX ;
-
%dataload
マジックコマンドを使用して、データをSalesCenterテーブルにロードします。%dataload DATABASE=<Project_Name>, TABLE=SalesCenter, FILEPATH=notebooks/sql/data/salescenter.csv
salescenter.csv ファイルが見つかりませんか? GitHub Demo:Charting and Visualization Data からファイルをダウンロードします。 データが挿入されたことを確認します。
SELECT * FROM SalesCenter ORDER BY 1
-
販売デモ データを含むテーブルを作成します。
DROP TABLE SalesDemo; CREATE MULTISET TABLE SalesDemo ,NO FALLBACK , NO BEFORE JOURNAL, NO AFTER JOURNAL, CHECKSUM = DEFAULT, DEFAULT MERGEBLOCKRATIO ( Sales_Center_ID INTEGER NOT NULL, UNITS DECIMAL(15,4), SALES DECIMAL(15,2), COST DECIMAL(15,2)) NO PRIMARY INDEX ;
-
`%dataload`マジック コマンドを使用して、SalesDemo テーブルにデータをロードします。
%dataload DATABASE=<Project_Name>, TABLE=SalesDemo, FILEPATH=notebooks/sql/data/salesdemo.csv
salesdemo.csv ファイルが見つかりませんか? GitHub Demo:Charting and Visualization Data からファイルをダウンロードします。 販売デモ データが正常に挿入されたことを確認します。
SELECT * FROM SalesDemo ORDER BY sales
接続のナビゲータを開き、テーブルが作成されたことを確認します。テーブルで行カウントを実行して、データがロードされたことを確認します。
-
チャートマジックを使用して、結果を視覚化します。
チャートにX軸とY軸を提供しま。
%chart sales_center_name, sales, title=Sales Data
-
テーブルをドロップします。
DROP TABLE SalesCenter; DROP TABLE SalesDemo;
-
-
プロジェクトのメタデータとオブジェクト定義を GitHub リポジトリにバックアップします。
%project_backup project=<Project_Name>
-
エンジンを停止します。
%project_engine_suspend project=<Project_Name>
おめでとうございます!JupyterLab で最初のユースケースが正常に実行されました。
次のステップ
-
高度なユースケースを探索することに興味がありますか? 近日公開! GitHub リンクについては、このスペースを引き続き監視してください。
-
JupyterLab で利用できるマジック コマンドについて学びます。 Teradata AI Unlimited JupyterLab マジック コマンド リファレンス を参照してください。
ご質問がある場合、またはさらにサポートが必要な場合は、コミュニティ フォーラムにアクセスしてサポートを受け、他のコミュニティ メンバーと交流してください。 |