MEGAZONEブログ
AWS re:Invent 2024 セッションレポート #AES304|Amazon SageMakerでPlanet Labsの衛星データからインサイトを生み出す
Generate insights from Planet Labs satellite data with Amazon SageMaker
セッション概要
- タイトル:Generate insights from Planet Labs satellite data with Amazon SageMaker
- 日付:2024年12月3日(火)
- Venue:MGM Grand | Level 1 | Grand 113
- スピーカー:
- Chris Wise(Solution Architect, AWS)
- Matthew Lydon(Solutions Architect, Amazon Web Services (AWS))
- 業界:
- Aerospace & Satellite
- Agriculture
- 概要:Planet Labsは、毎日200機以上の衛星を運用しており、そのデータは農業、林業、政府部門などで作物予測や災害監視などに活用されています。本ワークショップでは、Planet Insights Platformのデータを使用してAmazon SageMaker Studio Labでモデリングする方法を学び、衛星データを通じて産業イノベーションを加速する事例を紹介します。
はじめに
今回のセッションは、衛星データを活用した地理空間分析と、Amazon SageMakerを活用したデータ処理と分析方法について深く見ていた時間でした。を解決するためのインサイトを提供します。 今回のセッションは、特に衛星データに基づいて効率的なデータサイエンスワークフローを構築し、これにより環境変化、災害管理、都市開発などの分野で価値を生み出す方法に焦点を当てました。
Planet Labsの衛星データは高解像度で提供され、農業、都市計画、環境保護、災害対応など、さまざまな産業分野で活用されています。これらのデータは、Amazon SageMakerなどのクラウドベースのツールを介して効率的に処理および分析され、分析結果は意思決定プロセスを支援するために利用されます。
特にこのセッションでは、GeoJSONフォーマットを活用して関心のある地域のデータを選択的に収集し、PlanetScope衛星が提供するデータの精製と分析プロセスを詳細に紹介しました。また、Amazon SageMakerを使用してデータ処理と機械学習分析を実行し、時系列変化の検出や特定のオブジェクト認識などの高度な分析機能がどのように機能するかを実践的に学びました。
AGENDA
今回のセッションで取り上げた主な内容は次のとおりです。
- 地理空間データの概念と活用法
- GeoJSONフォーマットとAPIによるデータの取得と収集方法
- Amazon SageMakerとJupyterLabを活用したデータ分析と機械学習ワークフロー
これにより、データサイエンスと衛星データ分析の融合が実際の問題の解決にどのように貢献できるかについての洞察を得ることができました。
Planet LabsとPlanetScope衛星の紹介
Planet Labsは、衛星データを活用した革新的なソリューションを提供する大手企業であり、特にPlanetScope衛星群を通じて地球全体を毎日スキャンして最新のデータを提供します。この衛星群は200以上のCubeSatで構成されており、それぞれの衛星は約5kg程度の大きさに設計され、製作コストを削減するだけでなく、発射と運営においても高い効率性を誇ります。
PlanetScope衛星は極軌道に沿って1日約27,000kmを移動し、地球のすべての陸地を毎日スキャンします。これにより、気象条件、都市拡張、農業生産性など、さまざまな分野で利用可能な高解像度画像を提供します。特に、衛星データは気象変動や大気条件による品質低下が発生する可能性があるため、データの精製や補正が重要な作業として認識する必要があります。
Planet Labsは、APIベースのデータ検索サービスを提供し、ユーザーが関心のある地域の最新データを選択的に収集できるようにします。これは、分析対象地域が膨大な場合や特定の関心領域の変化のみを集中的に監視する必要がある場合に非常に効果的です。
GeoJSONを利用したデータ検索
GeoJSONは、衛星データの検索とフィルタリングに使用されるフォーマットで、ユーザーが関心のある地域の地理情報を定義できるシンプルで直感的なツールです。 GeoJSONは、ポイント、ライン、ポリゴンなどの形式で特定の地域を定義し、それに基づいてAPIを介してデータを取得できます。
今回のセッションでは、JupyterLabノートブック環境でGeoJSONフォーマットを活用し、特定地域のデータを選択的に検索する実践を行いました。例えば、洪水被害地域を分析するために、特定の川流域を多角形の形で定義し、その地域の最新の画像をAPIを介して呼び出す方法を紹介しました。
GeoJSONフォーマットは、データ科学者が関心のある地域のデータを効率的に抽出するのに役立ちます。これにより、大量の衛星データの中でも分析に必要なデータのみを選択的に抽出することができ、データ処理と分析時間を大幅に短縮するのに役立ちます。
Amazon SageMakerを使用したデータ処理
Amazon SageMakerは、衛星データの分析と可視化に不可欠なクラウドプラットフォームであり、JupyterLabノートブック環境でデータ処理と機械学習を実行できます。 SageMakerは、データ収集、精製、分析、機械学習モデルのトレーニング、展開まで、ワークフロー全体を統合的にサポートします。
このセッションでは、衛星データがSageMaker環境にインポートされるプロセスと、それを処理して分析するためのステップを紹介しました。 GeoJSONで収集したデータをSageMakerにインポートして整理およびフィルタリングした後、機械学習モデルを使用してオブジェクト認識と変更検出を実行しました。
例えば、特定地域の洪水前後のデータを比較分析し、変化する水位と浸水地域を可視化する事例を紹介した。 SageMakerは、データ分析と予測作業を簡単かつ効率的に実行できる環境を提供し、データ科学者の作業効率を大幅に向上させます。
衛星データの多層解析
Planet Labsの衛星データは、単一の画像を超えて多層分析を通じて環境の変化を理解する上で重要な役割を果たします。例えば、特定地域の土壌状態、水資源の変化、都市拡大などを時系列データを活用して分析する方法も紹介されています。
PlanetScope衛星を通じて毎日収集されるデータは、特定の地域の気候と地理的変化の推移を追跡するのに役立ちます。たとえば、干ばつによって川の流域が縮小したり、洪水によって浸水した地域の範囲を分析して、環境変化の予測と対応策を確立したりできます。
これらの分析結果は、環境政策を確立したり、資源を効率的に配分したりするために利用され、衛星データが環境問題解決に実質的に寄与することができる方法を提示します。
衛星データアプリケーションケース
Planet Labsの衛星データは、農業、都市開発、災害管理など、さまざまな分野で実践的な問題解決をサポートしています。農業分野では、作物の成長状況を監視し、病害虫被害地域を迅速に特定し、栽培戦略を最適化することができます。
災害管理では、洪水、山火事、台風などの自然災害が発生した場合に被害地域を迅速に分析し、救援活動と資源配分を支援します。
セッションでは、これらのケースに基づいて、衛星データをAWSクラウドと組み合わせたときに、より効率的で正確な分析が可能になるプロセスについて説明しました。
まとめ
このセッションでは、Planet Labsの衛星データをGeoJSONとAmazon SageMakerを使用して処理および分析するプロセスを学びました。 GeoJSONを使用した関心領域のフィルタリング、SageMaker Studio Labによるデータ分析と機械学習の適用、衛星データの多層活用事例などが紹介されました。
地理空間データと衛星データを活用したデータ科学の活用方法が確認できました。特に、GeoJSONを使用したデータフィルタリングとSageMakerによる分析ワークフローは、データ科学者が複雑な問題を効率的に解決できる方法を示しています。
衛星データは、単純な画像を超えてさまざまなトラブルシューティングに重要な役割を果たすことができることがわかりました。特に、GeoJSONとSageMakerを活用したデータ処理と分析プロセスは、衛星データの実質的な利用可能性を最大化するのに役立ちました。
記事 │MEGAZONECLOUD Cloud Technology Center(CTC) Global PreSales Engineer Team