MEGAZONEブログ
Keynote
re:Invent2024
AWS re:Invent 2024 <12/4 Keynote最新アップデート情報速報> 随時更新
現地時間12/4(火)8時30分より、Dr. SwamiによるKeynoteが開催されております!
例年、ここでAI周りのサービスのアップデートが多くあるので、注目です!
最新アップデート情報を紹介です!!
スピーカー
Dr. Swami Sivasubramanian
Amazon SageMaker Hyperpod flexible plans
- トレーニングプランを作成して、自動的にキャパシティやクラスタを設定
- トレーニング プランを作成して購入すると、SageMaker はインフラストラクチャを自動的にプロビジョニングし、手動による介入を必要とせずにこれらのコンピューティング リソースでトレーニング ワークロードを実行可能
- https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-sagemaker-hyperpod-flexible-training-plans/
Amazon SageMaker Hyperpod task governaonce
- コンピューティングリソースの自動化
- Gen AI タスクの優先順位付けと管理を自動化することでコンピューティング リソースの利用率を最大化
- コンピューティング リソースの割り当てを完全に可視化して制御できるため、最も重要なタスクが優先され、コンピューティング リソースの使用率が最大化され、モデル開発コストが最大 40% 削減される
- https://aws.amazon.com/about-aws/whats-new/2024/12/task-governance-amazon-sagemaker-hyperpod/
AI apps from AWS partners now available in Amazon SageMaker
- サードパーティアプリをSageMakerにデプロイ可能
- https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-sagemaker-partner-ai-apps/
poolside
- poolsideは、ソフトウェア開発ワークフロー向けに設計された本当に素晴らしいスタートアップで、そのアシスタントは Malibu とpointモデルでカバー、
- コード生成、テスト、ドキュメント作成、その他の開発タスクに優れている
Amazon Bedrock stability.ai Luma
Amazon Bedrock Marketplace
- https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-marketplace-100-models-bedrock/
- Amazon Bedrock の業界をリードするサーバーレスモデルに加えて、100 を超える公開されている独自の基盤モデル (FM) へのアクセスを生成 AI 開発者に提供
- これらのモデルを SageMaker エンドポイントにデプロイし、必要なインスタンス数とインスタンスタイプを選択できる
- 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (パリ)、南米 (サンパウロ) でサポート
Amazon Bedrock supports prompt caching
- プロンプトキャッシュは、複数の API 呼び出しにわたって頻繁に使用されるプロンプトをキャッシュすることで、サポートされているモデルのコストを最大 90%、レイテンシーを最大 85% 削減でが期待。
- 長いシステムプロンプトやモデルの応答を導く一般的な例など、繰り返し入力をキャッシュしてコンテキストの再処理を回避可能
- https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-preview-prompt-caching/
Amazon Bedrock Intelligent Prompt Routing
- モデルファミリー内のさまざまな基本モデルにプロンプトをルーティングし、応答の品質とコストを最適化する
- 高度なプロンプト マッチングとモデル理解の手法を使用して、各リクエストに対する各モデルのパフォーマンスを予測し、各リクエストを、最も低いコストで目的の応答を返す可能性が最も高いと予測されるモデルに動的にルーティングする
- 2 つのプロンプト ルーターから選択して、Claude Sonnet 3.5 と Claude Haiku の間、または Llama 3.1 8B と Llama 3.1 70B の間でリクエストをルーティング可能
- https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-intelligent-prompt-routing-preview/
Amazon Kendra generative AI Index
- 組織がインテリジェントな検索エクスペリエンスと検索拡張生成 (RAG) システムを構築して、生成 AI アプリケーションを強化できるようにする AI を利用した検索サービス
- RAG とインテリジェント検索用の新しいインデックスである GenAI Index を使用可能
- Kendra GenAI Index を使用すると、最新の情報検索テクノロジーとセマンティックモデルを活用した、すぐに使用できる高い検索精度が得られます。
- 米国東部 (バージニア北部) および米国西部 (オレゴン) リージョンで利用可能
- https://aws.amazon.com/about-aws/whats-new/2024/12/genai-index-amazon-kendra/
Amazon Bedrock Knowledge Bases supports structured data retrieval
- データソースから構造化データを取得するための自然言語クエリをサポート
- まざまな構造化データソースと非構造化データソースからコンテキスト情報にアクセスして組み込むことができるカスタム生成 AI アプリケーションを構築するためのエンドツーエンドの管理ワークフローを提供
- 高度な自然言語処理を使用して、自然言語クエリを SQL クエリに変換できるため、ユーザーはデータを移動したり前処理したりすることなく、ソースから直接データを取得できる。
- https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-knowledge-bases-structured-data-retrieval/
Amazon Bedrock Knowledge Bases now supports GraphRAG
- RAG テクニックとグラフデータを組み合わせて、より包括的で関連性が高く説明可能な応答を提供することで、Generative AI アプリケーションを強化する。
- Amazon Bedrock Knowledge Bases は、企業のデータソースからコンテキスト情報を組み込むことで、高精度で低レイテンシーのカスタム Generative AI アプリケーションを作成するための、完全に管理されたエンドツーエンドの Retrieval-Augmented Generation (RAG) ワークフローを提供
- https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-knowledge-bases-graphrag-preview/
Amazon Bedrock Data Automation
- 開発者がドキュメント、画像、動画、音声などの非構造化マルチモーダルコンテンツから貴重な洞察を自動生成し、GenAI ベースのアプリケーションを構築できるようになる。
- 開発者は開発時間と労力を削減し、インテリジェントなドキュメント処理、メディア分析、その他のマルチモーダルデータ中心の自動化ソリューションを簡単に構築可能
- https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-data-automation-available-preview/
Amazon Bedrock Guardrails Multimodal toxicity detection
Amazon Q Developer is now available SageMaker Canvas
Amazon Q in QuickSight Scenarios
AWS Education Equity Initiative
今回もAI周りでサービスアップデートがたくさんありました!
本当にどんどんこれまで手間がかかっていた部分が、全てAIに置き換わっていくんだと
若干の焦りとともに、感動しております。
まだプレビュー中のものも多いですが、実際に体験してみたいですね!
以上、速報でした!