|
10月に発生したAmazon Web Services(AWS)の大規模障害について、Amazonが技術的な原因を公表しました。影響を受けたのは「Signal」「Snapchat」「Duolingo」などの著名アプリを含む約2,000のサービスで、世界中のユーザーから800万件を超える障害報告が寄せられいます。今回の障害では、AWSの中核的なデータベースサービス「DynamoDB」のDNS(ドメインネームシステム)自動管理機能に潜んでいたバグがトリガーとなったようです。
この自動化バグは、米国東部リージョンで空のDNSレコードが生成されたことにより、DynamoDBがアクセス不能となったのが発端でした。通常であれば自動修復されるはずの仕組みが機能せず、最終的に手動での修正対応が必要になったという点で、信頼性の高いはずの「自動化」に設計上の弱点があったことが露呈しました。現在AWSは関連する自動化機能を一時的に停止し、再発防止策を実施中です。
インターネットに接続して温度や角度を調整するスマートベッド「Eight Sleep」は、アプリがAWSを通じて制御されていたため、ユーザーがベッド操作を一切できない状態に陥りました。同社はその後、Bluetooth経由で制御可能なオフラインモードのアップデートを配布し、対策に追われています。こうした実例は、IoT機器の可用性がクラウド障害によって簡単に揺らぐというリスクを強調しています。
専門家からは、インターネットの設計理念である分散性が失われつつあることへの懸念も出ています。現在、クラウド市場の大部分はAWS、Azure、Google Cloudの3社で占められており、障害が発生すればその影響は即座にグローバルへ波及します。利便性とコスト面でのメリットの裏で、単一障害点(SPOF)に依存する構造が、社会全体のITインフラにとってのリスクとなっているかもしれません。
記事元:https://www.theguardian.com/technology/2025/oct/24/amazon-reveals-cause-of-aws-outage
|