Imagen

Teradata Vantage エンジンのアーキテクチャと概念

概要

今回は、Teradata Vantage エンジン アーキテクチャの基礎となる概念について説明します。VantageCloud Lake のプライマリ クラスタを含む Vantage のすべてのエディションは、同じエンジンを利用します。

Teradataのアーキテクチャは、超並列処理(MPP)、シェアードナッシングアーキテクチャを中心に設計されており、高性能なデータ処理と分析を可能にします。MPP アーキテクチャは、ワークロードを複数の vproc または仮想プロセッサに分散します。クエリー処理が行われる仮想プロセッサは、一般にアクセス モジュール プロセッサ (AMP) と呼ばれます。各 AMP は他の AMP から分離されており、クエリーを並行して処理するため、Teradata は大量のデータを迅速に処理できます。

Teradata Vantage エンジンの主要なアーキテクチャ構成要素には、Parsing Engine (PE)、BYNET、アクセス モジュール プロセッサ (AMP)、および仮想ディスク (Vdisk) が含まれます。 Vdisk は、エンタープライズ プラットフォームの AMP に割り当てられ、VantageCloud Lake 環境の場合はプライマリ クラスタに割り当てられます。

Teradata Vantage の主要なアーキテクチャ構成要素

Teradata Vantage エンジンの アーキテクチャ構成要素

Teradata Vantage エンジンは、以下の構成要素で構成されています。

Parsing Engine (PE)

SQL クエリーが Teradata で実行されると、まずParsing Engineに到達します。Parsing Engineの機能は以下のとおりです。

  • 個々のユーザー セッション (最大 120) を管理します。

  • SQL クエリーで使用されているオブジェクトが存在するかどうかを確認します。

  • ユーザーが SQL クエリーで使用されるオブジェクトに対して必要な権限を持っているかどうかを確認します。

  • SQL クエリーを解析して最適化します。

  • SQL クエリーを実行するための実行プランを準備し、それを対応する AMP に渡します。

  • AMP から応答を受信し、それを要求元のクライアントに送り返します。

BYNET

BYNET は構成要素通信を可能にするシステムです。BYNET システムは、高速双方向ブロードキャスト、マルチキャスト、ポイント ツー ポイント通信およびマージ機能を提供します。マルチ AMP クエリーの調整、複数の AMP からのデータの読み取り、輻輳を防ぐためのメッセージ フローの調整、プラットフォームのスループットの処理という 3 つの主要な機能を実行します。BYNET のこれらの機能により、Vantage は非常にスケーラブルになり、超並列処理 (MPP) 機能が有効になります。

Parallel Database Extension (PDE)

並列データベース拡張機能 (PDE) は、オペレーティング システムと Teradata Vantage データベースの間に位置する中間ソフトウェア層です。PDE により、MPP システムは BYNET や共有ディスクなどの機能を使用できるようになります。これにより、Teradata Vantage データベースの速度と線形スケーラビリティを実現する並列処理が促進されます。

Access Module Processor (AMP)

AMP は、データの保存と取得を行います。各AMPは、データが格納される独自の仮想ディスク(Vdisk)セットに関連付けられており、他のAMPはシェアードナッシングアーキテクチャに従ってそのコンテンツにアクセスできません。AMP の機能は以下のとおりです。

  • Vantage の Block File System ソフトウェアを使用してストレージにアクセスする

  • ロックを管理する

  • 行の並べ替え

  • 列の集約

  • 結合処理

  • 出力変換

  • ディスク領の管理

  • アカウンティング

  • リカバリ処理

VantageCore IntelliFlex、VantageCore VMware、VantageCloud Enterprise、および VantageCloud Lake の場合のプライマリ クラスタの AMP は、データをブロック ファイル システム (BFS) 形式で Vdisk に保存します。VantageCloud Lake 上のコンピューティング クラスタおよびコンピューティング ワーカー ノードの AMP には BFS がなく、オブジェクト ファイル システム (OFS) を使用してオブジェクト ストレージ内のデータにのみアクセスできます。

仮想ディスク (Vdisks)

これらは、AMP が所有するストレージ容量の単位です。仮想ディスクは、ユーザー データ (テーブル内の行) を保持するために使用されます。仮想ディスクは、ディスク上の物理スペースにマップされます。

ノード

Teradata システムのコンテキストでは、ノードはデータベース ソフトウェアのハードウェア プラットフォームとして機能する個々のサーバーを表します。これは、単一のオペレーティング システムの制御下でデータベース操作が実行される処理ユニットとして機能します。Teradata をクラウドにデプロイすると、同じ MPP、シェアードナッシング アーキテクチャに従いますが、物理ノードは仮想マシン (VM) に置き換えられます。

Teradata Vantage のアーキテクチャと概念

以下の概念は Teradata Vantage に適用されます

直線的な成長と拡張性

Teradata は、直線的に拡張可能な RDBMS です。ワークロードとデータ量が増加するにつれて、サーバーやノードなどのハードウェア リソースを追加すると、パフォーマンスと容量も比例して増加します。線形スケーラビリティにより、スループットを低下させることなくワークロードを増加できます。

Teradata Parallelism (並列処理)

Teradata の並列処理とは、複数のノードまたは構成要素間で同時にデータとクエリーの並列処理を実行する Teradata Database の固有の機能を指します。

  • Teradata の各Parsing Engine (PE) には、最大 120 のセッションを同時に処理する機能があります。

  • Teradata の BYNET により、後続のタスクのデータ再配置を含む、すべてのメッセージ アクティビティの並列処理が可能になります。

  • Teradata のすべてのアクセス モジュール プロセッサ (AMP) は、並行して連携して受信リクエストに対応できます。

  • 各 AMP は複数のリクエストを同時に処理できるため、効率的な並列処理が可能になります。

Teradata Parallelism (並列処理)

Teradata Retrieval Architecture (取得アーキテクチャ)

Teradata Retrieval Architecture (取得アーキテクチャ)に含まれる主な手順は以下のとおりです。

  1. Parsing Engineは、1 つ以上の行を取得するリクエストを送信する。

  2. BYNETは、処理のために関連するAMPを活性化する。

  3. AMPは、並列アクセスを介して、目的の行を同時に見つけて検索する。

  4. BYNET は、取得した行をParsing Engineに返す。

  5. 次に、Parsing Engineは、リクエスト元のクライアント アプリケーションに行を返す。

Teradata Retrieval Architecture (取得アーキテクチャ)

Teradata Data Distribution (データ分散)

Teradata の MPP アーキテクチャでは、データを分散および取得する効率的な手段が必要であり、これをハッシュ パーティショニングを使用して行います。Vantage のほとんどのテーブルは、ハッシュを使用して行のプライマリ インデックス (PI) の値に基づいてテーブルのデータをブロック ファイル システム (BFS) のディスク記憶装置に分散し、テーブル全体をスキャンしたり、インデックスを使用してデータにアクセスしたりする場合があります。このアプローチにより、スケーラブルなパフォーマンスと効率的なデータ アクセスが保証されます。

  • プライマリ インデックスが一意である場合、テーブル内の行はハッシュ パーティション化によって自動的に均等に分散されます。

  • 指定されたプライマリ インデックス列はハッシュされ、同じ値に対して一貫したハッシュ コードが生成されます。

  • 再編成、再パーティション化、またはスペース管理は必要ありません。

  • 通常、各 AMP にはすべてのテーブルの行が含まれており、効率的なデータ アクセスと処理が保証されます。

Teradata Data Distribution (データ分散)

まとめ

この記事では、Parsing Engines (PE)、BYNET、Access Module Processors (AMP)、Virtual Disk (Vdisk)などのTeradata Vantageの主要なアーキテクチャ コンポーネント、Parallel Database Extension(PDE)、Nodeなどのその他のアーキテクチャ コンポーネント、および線形拡張と拡張性、並列処理、データ取得、データ分散などのTeradata Vantageの基本的な概念について説明しました。

このページは役に立ちましたか?