MEGAZONEブログ
Optimizing your workloads to adopt next-gen storage instances
次世代ストレージ・インスタンスを採用するためのワークロードの最適化
Pulisher : AI & Data Analytics Center ソン・スルギ
Description:高性能NVMeストレージを搭載したAmazon EC2インスタンスの紹介と、ローカルインスタンスストレージを使用する方法と理由、そしてインスタンスにデータが保持される方法についての紹介セッション
はじめに
データを処理する過程でComputing Resourceの性能がどのように、どのくらいの影響を与えるかについての理解を深めることで、適切なSPECのResourceを割り当てることで、作業性能とコストを最適化する方法について説明するセッションです。
セッションの概要紹介
ローカルに接続された高性能NVMeストレージを備えたAmazon EC2インスタンスについて学び、ローカルインスタンスストレージを使用する方法や理由、そしてこれらのインスタンスでデータがどのように保持されるかについて、さまざまな方法で議論します。このセッションでは、パフォーマンスプロファイルがリアルタイムのデータベース、検索、分析ワークロードにどのように役立つか、そしてこれらのインスタンスでコストを最適化する方法を学びます。
リアルタイムシステムの特性とリアルタイムデータ処理 ### リアルタイムシステムの特性とリアルタイムデータ処理
・リアルタイムシステムは、可能な限り予測可能で一貫した動作が行われるように構築する必要があります。
・作業が特定の時間内に完了する必要があり、必要に応じて性能が拡張可能でなければなりません。
・このような特性を満たすためには、規模に応じた一貫した性能を発揮できる環境が必要です。
・また、低遅延時間、高頻度の読み取り/書き込み、低遅延時間変動性のための対応開発が必要です。
インスタンスタイプ選択によるコスト最適化パターン
・インスタンスごとに目的が異なるため、正確な現状分析が必要であり、分析された現状に応じて適切なインスタンスを選択する必要があります。
・Iインスタンスは短い待ち時間で最適化されており、リアルタイムの待ち時間に敏感な関係型DBやNoSQL DB、リアルタイム分析、検索エンジンなどに適しています。
・C,M,Rディスクインスタンスはコンピューティングとメモリに最適化されており、データベースやウェブ、アプリ、キャッシュなどの用途に適しています。
価格とパフォーマンスを最適化する方法
・1対1のマッピングパターンは、要素間が1対1でマッピングされる方式で、リソース間の一貫した性能を維持することができます。
・縮小アプローチは、不要なリソースを減らし、必要以上のリソースが存在する場合、適切なサイズにインスタンスサイズを縮小します。
・ノードサイズを縮小してコストを削減する方法もあり、小さな規模のインスタンスに移転したり、複数の小さなノードを使用することでノードサイズを縮小しました。
・最後に、時間によってノードサイズを同時に調整する方法で、ワークロードが増加するとノードサイズを増加させて性能を維持し、減少するとノードサイズを縮小してコストを削減します。
最終的な注意点
・ワークロードに適したインスタンスを決定するためには、インスタンスタイプ間のメモリとCPUの比率の違いと、ディスク密度によるコストの変化を理解する必要があります。
・特に、Graviton BaysインスタンスとX86インスタンス間のメモリとCPUの比率の違いを理解し、どちらの比率が作業に適しているかを検討する必要があります。
・ディスク密度の高いワークロードの場合、テラバイトあたりのコストを下げるために、CPUとディスクの比率が高いインスタンスの方が費用対効果が高い場合があります。
・何よりも重要なのは、実際の事例から特定のワークロードに適したインスタンスタイプを学び、その特性を考慮してインスタンスを選択することです。
セッションを終えて
ワークロードに応じた適切なインスタンスを決定するのに必要な様々な要素があり、これまで具体的に知らなかった細かい部分まで考慮できることを確認することができました。
プロジェクトを遂行し、通常選択していたインスタンス仕様がありますが、上記の要素を全て考慮せずに進めたケースが多数存在するため、今後、上記の要素を反映して最適なインスタンス選択のための資料として活用できることが期待されます。