Phân tích sự cố ngừng hoạt động nghiêm trọng nhất trong lịch sử Cloudflare: Không phải bị tấn công, mà là do chính mình thay đổi cấu hình dẫn đến sự cố.
【比推】Vào ngày 18 tháng 11, Cloudflare đã bị sập, sự việc này đã gây ra một cơn bão lớn - CDN, dịch vụ an ninh, Workers KV, Turnstile, Access và một loạt các sản phẩm khác đều gặp sự cố, họ tự nói rằng đây là lần sập mạnh nhất kể từ năm 2019.
Ban đầu, đội ngũ còn nghĩ rằng bị tấn công DDoS, nhưng sau một hồi kiểm tra, họ phát hiện ra rằng chính mình đã gây ra rắc rối: quyền truy cập cơ sở dữ liệu đã được điều chỉnh, kết quả là tệp cấu hình được tạo ra có lỗi, dẫn đến việc hệ thống đại lý cốt lõi bị sập. Cuối cùng, họ đã phải dựa vào việc khôi phục lại cấu hình cũ để cứu vãn tình hình, đến 1 giờ 06 phút sáng ngày 19 theo giờ Bắc Kinh mới hoàn toàn hồi phục.
Báo cáo hồi tưởng trên blog chính thức được viết rất chân thành, thẳng thắn thừa nhận “không thể chấp nhận”, nói rằng sẽ tăng tốc cải tạo độ bền của hệ thống. Đối với chúng ta, những người đang sử dụng dịch vụ của họ để chạy dự án, sự cố cơ sở hạ tầng ở cấp độ này thật sự cần phải ghi nhớ - ngay cả nhà cung cấp mạnh mẽ nhất cũng có thể gặp sự cố do sai sót trong hoạt động nội bộ, nên việc triển khai đám mây và kế hoạch ứng phó vẫn cần phải chuẩn bị trước.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
18 thích
Phần thưởng
18
6
Đăng lại
Retweed
Bình luận
0/400
FlashLoanPrince
· 10giờ trước
Rollback cứu mạng thật quá thực tế
Xem bản gốcTrả lời0
JustHodlIt
· 21giờ trước
Lại nâng cấp thất bại rồi
Xem bản gốcTrả lời0
NotFinancialAdvice
· 11-19 02:06
Tự mình báo ứng ở đời.
Xem bản gốcTrả lời0
Lonely_Validator
· 11-19 02:03
Cái này là do kỹ sư gánh vác.
Xem bản gốcTrả lời0
TokenAlchemist
· 11-19 02:02
Chi phí của sự sai lầm quá lớn.
Xem bản gốcTrả lời0
AllInDaddy
· 11-19 01:39
Không có gì ngạc nhiên khi dự án không thành công.
Phân tích sự cố ngừng hoạt động nghiêm trọng nhất trong lịch sử Cloudflare: Không phải bị tấn công, mà là do chính mình thay đổi cấu hình dẫn đến sự cố.
【比推】Vào ngày 18 tháng 11, Cloudflare đã bị sập, sự việc này đã gây ra một cơn bão lớn - CDN, dịch vụ an ninh, Workers KV, Turnstile, Access và một loạt các sản phẩm khác đều gặp sự cố, họ tự nói rằng đây là lần sập mạnh nhất kể từ năm 2019.
Ban đầu, đội ngũ còn nghĩ rằng bị tấn công DDoS, nhưng sau một hồi kiểm tra, họ phát hiện ra rằng chính mình đã gây ra rắc rối: quyền truy cập cơ sở dữ liệu đã được điều chỉnh, kết quả là tệp cấu hình được tạo ra có lỗi, dẫn đến việc hệ thống đại lý cốt lõi bị sập. Cuối cùng, họ đã phải dựa vào việc khôi phục lại cấu hình cũ để cứu vãn tình hình, đến 1 giờ 06 phút sáng ngày 19 theo giờ Bắc Kinh mới hoàn toàn hồi phục.
Báo cáo hồi tưởng trên blog chính thức được viết rất chân thành, thẳng thắn thừa nhận “không thể chấp nhận”, nói rằng sẽ tăng tốc cải tạo độ bền của hệ thống. Đối với chúng ta, những người đang sử dụng dịch vụ của họ để chạy dự án, sự cố cơ sở hạ tầng ở cấp độ này thật sự cần phải ghi nhớ - ngay cả nhà cung cấp mạnh mẽ nhất cũng có thể gặp sự cố do sai sót trong hoạt động nội bộ, nên việc triển khai đám mây và kế hoạch ứng phó vẫn cần phải chuẩn bị trước.