MEGAZONE

MEGAZONEブログ

AWS re:Invent 2024 <12/4 Keynote最新アップデート情報速報> 随時更新
Keynote re:Invent2024

AWS re:Invent 2024 <12/4 Keynote最新アップデート情報速報> 随時更新

現地時間12/4(火)8時30分より、Dr. SwamiによるKeynoteが開催されております!
例年、ここでAI周りのサービスのアップデートが多くあるので、注目です!
最新アップデート情報を紹介です!!

Dr. Swami Sivasubramanian

  • コンピューティングリソースの自動化
  • Gen AI タスクの優先順位付けと管理を自動化することでコンピューティング リソースの利用率を最大化
  • コンピューティング リソースの割り当てを完全に可視化して制御できるため、最も重要なタスクが優先され、コンピューティング リソースの使用率が最大化され、モデル開発コストが最大 40% 削減される
  • https://aws.amazon.com/about-aws/whats-new/2024/12/task-governance-amazon-sagemaker-hyperpod/
  • poolsideは、ソフトウェア開発ワークフロー向けに設計された本当に素晴らしいスタートアップで、そのアシスタントは Malibu とpointモデルでカバー、
  • コード生成、テスト、ドキュメント作成、その他の開発タスクに優れている
  • https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-marketplace-100-models-bedrock/
  • Amazon Bedrock の業界をリードするサーバーレスモデルに加えて、100 を超える公開されている独自の基盤モデル (FM) へのアクセスを生成 AI 開発者に提供
  • これらのモデルを SageMaker エンドポイントにデプロイし、必要なインスタンス数とインスタンスタイプを選択できる
  • 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (パリ)、南米 (サンパウロ) でサポート
  • プロンプトキャッシュは、複数の API 呼び出しにわたって頻繁に使用されるプロンプトをキャッシュすることで、サポートされているモデルのコストを最大 90%、レイテンシーを最大 85% 削減でが期待。
  • 長いシステムプロンプトやモデルの応答を導く一般的な例など、繰り返し入力をキャッシュしてコンテキストの再処理を回避可能
  • https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-preview-prompt-caching/
  • モデルファミリー内のさまざまな基本モデルにプロンプ​​トをルーティングし、応答の品質とコストを最適化する
  • 高度なプロンプト マッチングとモデル理解の手法を使用して、各リクエストに対する各モデルのパフォーマンスを予測し、各リクエストを、最も低いコストで目的の応答を返す可能性が最も高いと予測されるモデルに動的にルーティングする
  • 2 つのプロンプト ルーターから選択して、Claude Sonnet 3.5 と Claude Haiku の間、または Llama 3.1 8B と Llama 3.1 70B の間でリクエストをルーティング可能
  • https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-intelligent-prompt-routing-preview/
  • 組織がインテリジェントな検索エクスペリエンスと検索拡張生成 (RAG) システムを構築して、生成 AI アプリケーションを強化できるようにする AI を利用した検索サービス
  • RAG とインテリジェント検索用の新しいインデックスである GenAI Index を使用可能
  • Kendra GenAI Index を使用すると、最新の情報検索テクノロジーとセマンティックモデルを活用した、すぐに使用できる高い検索精度が得られます。
  • 米国東部 (バージニア北部) および米国西部 (オレゴン) リージョンで利用可能
  • https://aws.amazon.com/about-aws/whats-new/2024/12/genai-index-amazon-kendra/
  • データソースから構造化データを取得するための自然言語クエリをサポート
  • まざまな構造化データソースと非構造化データソースからコンテキスト情報にアクセスして組み込むことができるカスタム生成 AI アプリケーションを構築するためのエンドツーエンドの管理ワークフローを提供
  • 高度な自然言語処理を使用して、自然言語クエリを SQL クエリに変換できるため、ユーザーはデータを移動したり前処理したりすることなく、ソースから直接データを取得できる。
  • https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-knowledge-bases-structured-data-retrieval/
  • RAG テクニックとグラフデータを組み合わせて、より包括的で関連性が高く説明可能な応答を提供することで、Generative AI アプリケーションを強化する。
  • Amazon Bedrock Knowledge Bases は、企業のデータソースからコンテキスト情報を組み込むことで、高精度で低レイテンシーのカスタム Generative AI アプリケーションを作成するための、完全に管理されたエンドツーエンドの Retrieval-Augmented Generation (RAG) ワークフローを提供
  • https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-knowledge-bases-graphrag-preview/
  • 開発者がドキュメント、画像、動画、音声などの非構造化マルチモーダルコンテンツから貴重な洞察を自動生成し、GenAI ベースのアプリケーションを構築できるようになる。
  • 開発者は開発時間と労力を削減し、インテリジェントなドキュメント処理、メディア分析、その他のマルチモーダルデータ中心の自動化ソリューションを簡単に構築可能
  • https://aws.amazon.com/about-aws/whats-new/2024/12/amazon-bedrock-data-automation-available-preview/

今回もAI周りでサービスアップデートがたくさんありました!
本当にどんどんこれまで手間がかかっていた部分が、全てAIに置き換わっていくんだと
若干の焦りとともに、感動しております。

まだプレビュー中のものも多いですが、実際に体験してみたいですね!
以上、速報でした!

ブログ一覧

この記事の読者はこんな記事も読んでいます