【比推】11月18日、Cloudflareがダウンした。この問題はかなり大きなもので、CDN、安全サービス、Workers KV、Turnstile、Accessなどの多くの製品が全てダウンした。彼ら自身が言うには、これは2019年以来最もひどい失敗だ。最初、チームはDDoS攻撃を受けたと思っていましたが、調査しているうちに原因が内部の人間のミスだと判明しました:データベースの権限を変更した結果、生成された設定ファイルにバグがあり、コアプロキシシステムがダウンしてしまいました。最終的には古い設定にロールバックして救済し、北京時間の19日午前1時06分にようやく全面的に復旧しました。公式ブログの振り返りレポートは非常に誠実に書かれており、「受け入れられない」と直接認め、システムのレジリエンス改造を加速する必要があると述べています。私たちのように彼らのサービスを使ってプロジェクトを行っている者にとって、このレベルのインフラ障害は確かに長く記憶に留めておくべきです——どんなに優れた供給者でも内部の操作ミスで失敗する可能性があり、マルチクラウド展開や緊急対策は事前に準備しておく必要があります。
Cloudflare史上最严重のダウンタイムの振り返り:攻撃を受けたのではなく、自らの設定変更で問題が発生した
【比推】11月18日、Cloudflareがダウンした。この問題はかなり大きなもので、CDN、安全サービス、Workers KV、Turnstile、Accessなどの多くの製品が全てダウンした。彼ら自身が言うには、これは2019年以来最もひどい失敗だ。
最初、チームはDDoS攻撃を受けたと思っていましたが、調査しているうちに原因が内部の人間のミスだと判明しました:データベースの権限を変更した結果、生成された設定ファイルにバグがあり、コアプロキシシステムがダウンしてしまいました。最終的には古い設定にロールバックして救済し、北京時間の19日午前1時06分にようやく全面的に復旧しました。
公式ブログの振り返りレポートは非常に誠実に書かれており、「受け入れられない」と直接認め、システムのレジリエンス改造を加速する必要があると述べています。私たちのように彼らのサービスを使ってプロジェクトを行っている者にとって、このレベルのインフラ障害は確かに長く記憶に留めておくべきです——どんなに優れた供給者でも内部の操作ミスで失敗する可能性があり、マルチクラウド展開や緊急対策は事前に準備しておく必要があります。