Imagen

Teradata AI Unlimitedを使用してJupyterLabでサンプルワークロードを実行する

この製品はプレビュー版であり、変更される可能性があります。このサービスの詳細について興味がある場合は、Teradata サポートにお問い合わせください。

概要

このドキュメントでは、JupyterLab を使用して以下のことを行うための簡単なワークフローについて説明します。

  • オンデマンドでスケーラブルなコンピューティングをデプロイメントする

  • 外部データソースに接続する

  • ワークロードの実行する

  • 計算を中断する

始める前に

最初のワークロードを実行する

マジックコマンドの詳細については、%help または %help <command> を実行してください。詳細については、Teradata AI Unlimited JupyterLab マジック コマンド リファレンス を参照してください。

  1. URL: http://localhost:8888 を使用して JupyterLab に接続し、プロンプトが表示されたらトークンを入力します。

  2. APIキーを使用してワークスペースサービスに接続します。

    %workspaces_config host=<ip_or_hostname>, apikey=<API_Key>, withtls=F
  3. 新しいプロジェクトを作成します。

    現在、Teradata AI Unlimited は AWS と Azure をサポートしています。
    %project_create project=<Project_Name>, env=<CSP>, team=<Project_Team>
  4. (オプション) CSP 信頼証明を保存するための認証オブジェクトを作成します。

    ACCESS_KEY_IDSECRET_ACCESS_KEY、および REGION を実際の値に置き換えます。

    %project_auth_create name=<Auth_Name>, project=<Project_Name>, key=<ACCESS_KEY_ID>, secret=<SECRET_ACCESS_KEy>, region=<REGION>
  5. プロジェクトのエンジンをデプロイします。

    <Project_Name> を任意の名前に置き換えます。サイズパラメータ値には、small、medium、large、またはextralargeを指定できます。デフォルトのサイズはsmallです。

    %project_engine_deploy name=<Project_Name>, size=<Size_of_Engine>

    デプロイのプロセスが完了するまでに数分かかります。デプロイメントが成功すると、パスワードが生成されます。

  6. プロジェクトとの接続を確立します。

    %connect <Project_Name>

    接続が確立されると、インターフェースによってパスワードの入力が求められます。前のステップで生成されたパスワードを入力します。

  7. サンプルワークロードを実行します。

    選択したデータベースに SalesCenter または SalesDemo という名前のテーブルがないことを確認してください。
    1. 販売センターのデータを格納するテーブルを作成します。

      まず、テーブルがすでに存在する場合は削除します。テーブルが存在しない場合、コマンドは失敗します。

      DROP TABLE SalesCenter;
      CREATE MULTISET TABLE SalesCenter ,NO FALLBACK ,
           NO BEFORE JOURNAL,
           NO AFTER JOURNAL,
           CHECKSUM = DEFAULT,
           DEFAULT MERGEBLOCKRATIO
           (
            Sales_Center_id INTEGER NOT NULL,
            Sales_Center_Name VARCHAR(255) CHARACTER SET LATIN NOT CASESPECIFIC)
      NO PRIMARY INDEX ;
    2. %dataload マジックコマンドを使用して、データをSalesCenterテーブルにロードします。

      %dataload DATABASE=<Project_Name>, TABLE=SalesCenter, FILEPATH=notebooks/sql/data/salescenter.csv
      salescenter.csv ファイルが見つかりませんか? GitHub Demo:Charting and Visualization Data からファイルをダウンロードします。

      データが挿入されたことを確認します。

      SELECT * FROM SalesCenter ORDER BY 1
    3. 販売デモ データを含むテーブルを作成します。

      DROP TABLE SalesDemo;
      CREATE MULTISET TABLE SalesDemo ,NO FALLBACK ,
           NO BEFORE JOURNAL,
           NO AFTER JOURNAL,
           CHECKSUM = DEFAULT,
           DEFAULT MERGEBLOCKRATIO
           (
            Sales_Center_ID INTEGER NOT NULL,
            UNITS DECIMAL(15,4),
            SALES DECIMAL(15,2),
            COST DECIMAL(15,2))
      NO PRIMARY INDEX ;
    4. `%dataload`マジック コマンドを使用して、SalesDemo テーブルにデータをロードします。

      %dataload DATABASE=<Project_Name>, TABLE=SalesDemo, FILEPATH=notebooks/sql/data/salesdemo.csv
      salesdemo.csv ファイルが見つかりませんか? GitHub Demo:Charting and Visualization Data からファイルをダウンロードします。

      販売デモ データが正常に挿入されたことを確認します。

      SELECT * FROM SalesDemo ORDER BY sales

      接続のナビゲータを開き、テーブルが作成されたことを確認します。テーブルで行カウントを実行して、データがロードされたことを確認します。

    5. チャートマジックを使用して、結果を視覚化します。

      チャートにX軸とY軸を提供しま。

      %chart sales_center_name, sales, title=Sales Data
    6. テーブルをドロップします。

      DROP TABLE SalesCenter;
      DROP TABLE SalesDemo;
  8. プロジェクトのメタデータとオブジェクト定義を GitHub リポジトリにバックアップします。

    %project_backup project=<Project_Name>
  9. エンジンを停止します。

    %project_engine_suspend project=<Project_Name>

おめでとうございます!JupyterLab で最初のユースケースが正常に実行されました。

次のステップ

ご質問がある場合、またはさらにサポートが必要な場合は、コミュニティ フォーラムにアクセスしてサポートを受け、他のコミュニティ メンバーと交流してください。
このページは役に立ちましたか?