MEGAZONEブログ
Amazon CloudWatchおよびAWS X-Rayのハンズオン
Hands-on experience with Amazon CloudWatch and AWS X-Ray
Pulisher : Strategic Tech Center チャン・セジョン
Description : AWSの代表的なモニタリングサービスであるCloudWatchとAWS X-Rayのハンズオンセッション。
はじめに
普段からAWSのモニタリングに興味があり、今回の re:InventでAWSの代表的なモニタリングサービスであるCloudWatchとAWS X-Rayのセッションがあり、迷わず申し込みました。
ハンズオン方式なので、直接体験しながらAWSモニタリングに関する技術を深く学びたいと思います。
セッションの概略紹介
このセッションでは、CloudWatchとX-Rayを使用してAWSサービスを監視する方法を学び、最も一般的なユースケースを直接体験し、利用可能な最新の機能について学び、実装する方法を学びます。
それでは、observabilityとは何か、CloudWatchの機能を学び、このWorkshopを始めましょう。
observabilityとはとても簡単です。症状を発見してその症状に調査して修正することを言います。
はい、この簡単なことだけすればサービス運営する時心配がないのに…。言うほど簡単なことではないですが、それでもこのような部分が自然に習慣化され、自動化の部分も考えてみるといいと思います。
observabilityの3つの構成要素について説明します。Log情報とCloudWatch MetricとAWS X-Rayを通じたTrace情報が必要です。この3つの情報で私たちは警告を与えることができるアラームなどをかけることができ、原因分析と対策の方向性を知ることができます。
ユーザーが外部から観測できるOutside-in戦略とbackend applicationから観測できるInside-out戦略があります。どう見てもユーザー立場、管理者立場で見るのと似たような感じです。
私たちはこの2つの戦略を全て考慮して問題を観測することができるようにしなければなりません。
CloudWatch Metrics Insightsは非常に強力な機能を持っています。高性能の照会クエリを使って欲しい結果を照会することができます。CPU、Memory、EC2インスタンスの状態などの情報を知ることができます。
ALBのRequest Count、Latencyもここで簡単に情報を照会することができます。
CloudWatchの異常検知機能を実行すると、マシンラーニングアルゴリズムを通じて、過去のデータを基に予想される未来のメトリックに対する統計数値も知ることができます。未来の統計データを無条件に盲信してはいけませんが、それでももしかしたら発生する問題について事前認識される場合があるかもしれないので、軽く見てはいけません。
CloudWatch Logsには各種のLogsを入れることができますが、Live Trail機能を使うとリアルタイムで落ちるログをすぐに確認することができます。
やはり過ぎてから後で探すより、リアルタイムですぐに見る方が問題認識や対処に便利だと思います。
AWS CloudWatchはout-of-the-boxというすぐに使える推奨アラームを提供するというヒントを教えてくれます。AWS CLIやIaC方式でも設定できるようにガイドも提供しているそうです。 参考にしておけば、いつか使うことがあるかもしれません。
さて、いよいよ待ちに待ったハンズオンワークショップの実行順序が残りました。 AWSで実習するアカウントをサポートし、そのセッションで学ぶべき部分だけを早く進めることができるように基本的なAWSインフラ及びリソースが生成されています。 基本的なことはAWSがやってくれたので、残りのセッションの前段で話したことをHand-On方式で学んでみます。
セッションを終えて
セッション時間が足りず、セッション終了後に提供されたAWSアカウントにはアクセスできず、Hand-Onの過程を盛り込めなかったのが非常に残念ですが、このセッションを通じて直接CloudWatch MetricのAlarmの設定と実際の顧客社で運営する時は使っていなかったCloudWatch Logs Live Trailは良い経験になったようです。
顧客社で3rd PartyソリューションではなくAWSサービスだけでロギングやモニタリングをする場合、便利なセッションになったようです。