優れたビジネス インテリジェンス (BI) により、組織は信頼できるソースから取得したデータを照会し、その回答を使用して業界における競争力を獲得することができます。 効果的な BI を実現するための最初のステップは、適切に設計されたウェアハウスです。 データウェアハウスの設計とは、分析レポートやデータ分析をサポートする、複数のソースからのデータを統合するソリューションを構築するプロセスです。 データウェアハウスの設計が不十分だと、不正確なソースデータを取得・利用することになり、組織の生産性や成長に悪影響を及ぼす可能性があります。 このブログ記事では、要件収集から実装までのデータウェアハウス設計プロセスの概要を説明します。
要件収集
要件収集は、データウェアハウス設計プロセスのステップ 1 です。 要件収集段階の目標は、データウェアハウスの実装を成功させるための基準を決定することです。 組織の長期的なビジネス戦略は、現在のビジネスおよび技術的な要件と同様に重要であるべきです。 ユーザー分析およびレポート要件は、ハードウェア、開発、テスト、実装、およびユーザートレーニングと同様に特定されなければなりません。
ビジネスおよび技術戦略が決定されると、次のステップは、組織がデータウェアハウスをバックアップする方法と、システムが故障した場合に復旧する方法に対処することです。 要件を収集しながら災害復旧計画を策定することで、組織はデータウェアハウスに対する直接的および間接的な脅威に迅速に対応できるようになります。
物理環境の設定
ビジネス要件が設定されると、次のステップはデータウェアハウスの物理環境を決定することです。 最低でも、開発、テスト、および本番用に、別々の物理アプリケーションおよびデータベース サーバー、ならびに別々の ETL/ELT、OLAP、キューブ、およびレポート プロセスが設定されている必要があります。 別々の物理環境を構築することで、すべての変更を本番環境に移行する前にテストでき、本番環境を停止することなく開発およびテストが可能です。また、データの整合性が疑われる場合、ITスタッフは本番環境に悪影響を与えることなく問題を調査することができます。 このプロセスはデータモデリングとして知られています。 データウェアハウス設計のこの段階では、データソースが特定されます。 元のデータがどこに存在し、そのデータが利用可能であるかを知ることは、プロジェクトの成功に欠かせません。 データ ソースが特定されると、データ ウェアハウス チームは、確立された要件に基づいて、論理的および物理的な構造の構築を開始することができます。 データモデリング段階でデータソースを特定することで、ETLの開発時間を短縮できる可能性があります。 ETLの目標は、品質を犠牲にすることなく、最適化されたロード速度を提供することです。 8092>
OLAP キューブ設計
On-Line Analytical Processing (OLAP) は、アドホック ユーザー クエリと多次元分析のためのインフラストラクチャを提供するアンサー エンジンです。 OLAP設計の仕様は、データを照会する人から来るべきです。 OLAPキューブのディメンションとメジャーを指定する文書は、データウェアハウスの設計プロセスの初期に入手する必要があります。 OLAP設計の3つの重要な要素は次のとおりです。
- グループ化メジャー – 収益、顧客数、顧客が購入した製品数、または平均購入額など、分析したい数値です。
- Dimension – 地理的な地域、月、または四半期など、分析のためにメジャーを保存する場所。
- Granularity – OLAP データセットに含める最小レベルの詳細。
開発中に、OLAP キューブのプロセスを最適化することを確認します。 データウェアハウスは通常、毎晩優先的に実行されるわけではなく、データウェアハウスが更新されると、OLAP キューブを更新する時間はほとんど残されていません。 どちらかを適時に更新しないと、システム性能の低下につながる可能性があります。 8092>
フロントエンド開発
この時点で、ビジネス要件が把握され、物理環境が完成し、データモデルが決定し、ETL プロセスが文書化されています。 次のステップは、ユーザーがデータウェアハウスにアクセスする方法について作業することです。 フロントエンドの開発は、ユーザーがデータにアクセスして分析したり、レポートを実行したりする方法です。 フロントエンドを社内で構築するか、市販の製品を購入するか、多くの選択肢があります。 デスクトップ、ラップトップ、タブレット、または電話など、あらゆるデバイスからのデータへの安全なアクセスが第一に考慮されるべきです。 ツールは、企業レベルのレポート要件が変化したときに、開発チームがバックエンド構造を変更できるようにする必要があります。 また、必要に応じてユーザーがレポートをカスタマイズできるグラフィカル・ユーザー・インターフェース(GUI)を提供する必要があります。 8092>
レポート開発
ほとんどのエンド ユーザーにとって、データ ウェアハウスとの唯一の接点は、彼らが作成するレポートを通してです。 フロントエンド開発のセクションで述べたように、ユーザーがレポート基準を迅速かつ効率的に選択できることは、データ ウェアハウスのレポート生成に不可欠な機能です。 配信オプションも考慮すべき事項のひとつです。 ユーザーは、安全なWebインターフェイスでレポートを受信するだけでなく、電子メールの添付ファイルやスプレッドシートとしてレポートを送信することを希望したり、必要としたりする場合があります。 データのフローと可視性を制御することも、レポート開発で対処しなければならないもう一つの側面です。 特定のデータセグメントにアクセスできるユーザーグループを作成することで、データのセキュリティと制御を実現することができます。 レポートは、最初の導入後にも変化していくものであり、またそうでなければなりません。 よく設計されたデータウェアハウスは、データウェアハウスシステムをほとんど変更することなく、新しいレポート要求を処理できるはずです。
パフォーマンスチューニング
この記事の前半で、開発とテストの環境を別々に作成することをお勧めしました。 そうすることで、組織は現在の本番環境を中断することなく、ETL、クエリ処理、およびレポート配信に関するシステム パフォーマンスのチューニングを行うことができます。 開発で作成したパフォーマンス強化が本番環境でも機能するように、開発およびテスト環境、ハードウェア、およびアプリケーションが本番環境を模倣していることを確認してください。 テストまたは品質保証は、データウェアハウスチームが最初のロールアウトの前に問題を明らかにして対処することができるため、省略してはならないステップです。 テスト段階を完了しないと、実装の遅延やデータウェアハウスプロジェクトの終了につながる可能性があります。 システムを一度に全員に公開するか、時期をずらして公開するかは、エンドユーザーの数と彼らがデータウェアハウスシステムにどのようにアクセスするかによって決定されます。 システム導入のもう一つの重要な側面は、エンドユーザーのトレーニングです。 データウェアハウス チームと開発者が GUI をいかに「直感的」であると考えても、実際のエンド ユーザーがツールを使いにくいと感じたり、データウェアハウスをレポートや分析に使用する利点を理解していなければ、そのようなことは起こらないでしょう。 各ステップには、良い面、悪い面、そして醜い面が見受けられます。 しかし、組織が最初に健全な要件を開発するために時間をかければ、プロセスの後続のステップはより論理的に流れ、データウェアハウスの実装を成功に導くことができます。