Quét để tải ứng dụng Gate
qrCode
Thêm tùy chọn tải xuống
Không cần nhắc lại hôm nay

Cloudflare sự cố "cúp điện kỹ thuật số" toàn cầu: báo cáo chính thức tiết lộ chi tiết sự cố vào ngày 18 tháng 11

Hàng triệu trang web và dịch vụ toàn cầu đã gặp sự cố kết nối vào lúc 06:58 UTC ngày 18 tháng 11 năm 2025, nguyên nhân chủ yếu xuất phát từ lỗi nội bộ của nhà cung cấp hạ tầng mạng Cloudflare. Công ty này đã phát hành báo cáo đầy đủ về sự cố vào chiều hôm đó, minh bạch giải thích cách sự cố kỹ thuật này xảy ra, cách xử lý và các biện pháp phòng ngừa trong tương lai.

Vấn đề bùng phát: Dịch vụ ở nhiều nơi trên thế giới bị tê liệt

Cloudflare đã gặp sự cố vào lúc 06:58 UTC (khoảng 14:00 giờ Đài Loan) ngày 18 tháng 11, khiến nhiều trang web sử dụng dịch vụ CDN và DNS của Cloudflare, bao gồm các nền tảng thương mại lớn, phương tiện truyền thông và ứng dụng web, không thể truy cập bình thường. Sự gián đoạn này kéo dài gần 40 phút, khiến một số khu vực không thể tải trang web hoàn toàn, người dùng cũng không thể tương tác trơn tru với API và máy chủ backend.

Công ty chỉ ra rằng sự cố này thuộc về sự gián đoạn ở cấp độ mạng, ảnh hưởng đến cơ sở hạ tầng dịch vụ toàn cầu của họ, chứ không phải là vấn đề của một trung tâm dữ liệu hay khu vực đơn lẻ.

Nguồn gốc vấn đề: Lỗi cấu hình BGP gây ra thảm họa

Cloudflare giải thích thêm rằng sự gián đoạn lần này bắt nguồn từ lỗi trong việc thay đổi cấu hình Giao thức Cổng Biên (BGP). BGP là một trong những giao thức cốt lõi điều khiển lưu lượng Internet, được sử dụng để cho mạng toàn cầu biết cách định tuyến đến một điểm đến nào đó.

Mục đích ban đầu là để cập nhật chính sách phát sóng định tuyến nội bộ, nâng cao hiệu suất cơ sở hạ tầng, nhưng do lỗi thiết lập khi đẩy thủ công, một số tiền tố IP của Cloudflare không còn có thể được truy cập bởi các ISP khác thông qua BGP, tương đương với việc “biến mất” các tuyến đường dịch vụ này trên Internet.

Lỗi này không được phát hiện kịp thời trong công cụ triển khai tự động nội bộ, vì vậy nó đã được phát tán rộng rãi đến nhiều khu vực trước khi ảnh hưởng xuất hiện.

Khởi động khôi phục khẩn cấp: Hủy bỏ cài đặt sai một cách nhanh chóng

Nhóm kỹ sư của Cloudflare đã phát hiện ra bất thường chỉ vài phút sau khi sự cố xảy ra và ngay lập tức khởi động quy trình phục hồi. Họ bắt đầu rút lại các thiết lập chính sách BGP sai khoảng 07:15 UTC và hoàn tất phục hồi vào 07:28 UTC, hầu hết các dịch vụ cũng đã hoạt động bình thường vào thời điểm đó.

Tổng thể mà nói, sự gián đoạn này kéo dài khoảng 30 đến 40 phút, theo thời gian biểu do Cloudflare cung cấp, dịch vụ đã hoàn toàn phục hồi vào lúc 07:28 UTC.

Tại sao tự động hóa và cơ chế bảo vệ không thể ngăn chặn vấn đề?

Cloudflare thừa nhận rằng lỗi này cho thấy quy trình triển khai nội bộ của họ vẫn còn có không gian cải thiện. Quy trình tự động hóa trước đây có “cơ chế bảo mật” để ngăn chặn các quảng bá BGP sai, nhưng lần cập nhật này được thực hiện ở mức cài đặt hệ thống thấp hơn, không nằm trong phạm vi bảo vệ đó.

Ngoài ra, sự thay đổi này lẽ ra chỉ nên áp dụng cho các phân đoạn mạng thử nghiệm cụ thể, nhưng lại vô tình ảnh hưởng đến phạm vi môi trường sản xuất chính. Họ đã bắt tay vào việc sửa chữa định nghĩa phạm vi của hệ thống triển khai và tăng cường khả năng phát hiện tự động các chính sách sai.

Cloudflare cam kết cải tiến trong tương lai

Cloudflare cho biết sẽ thực hiện các biện pháp sau để tránh sự cố tương tự xảy ra lần nữa:

Tăng cường cơ chế xác minh đối với các cài đặt liên quan đến BGP, tránh phát sóng định tuyến không mong đợi;

Rõ ràng phân biệt quyền thiết lập môi trường thử nghiệm và sản xuất;

Tăng cường hệ thống cảnh báo tự động, có khả năng phản ứng với lưu lượng mạng bất thường trong vòng giây.

Tăng cường giám sát quy trình kiểm tra và thao tác thủ công trong các thay đổi nội bộ.

Công ty cũng nhấn mạnh rằng họ sẽ tiếp tục nâng cao tính minh bạch, trong tương lai nếu có bất kỳ sự cố nào, họ cũng sẽ nhanh chóng công khai thông tin liên quan để duy trì lòng tin của người dùng.

Trách nhiệm và thách thức của các ông lớn công nghệ

Cloudflare là một trong những nhà cung cấp hạ tầng mạng lớn nhất toàn cầu, cung cấp dịch vụ bao gồm CDN, DNS, bảo mật mạng và bảo vệ DDoS cùng nhiều thành phần mạng quan trọng khác. Một lỗi cấu hình BGP có thể dẫn đến “cúp điện kỹ thuật số” toàn cầu. Sự kiện này mặc dù đã được xử lý nhanh chóng, nhưng vẫn làm nổi bật những rủi ro và thách thức do sự tập trung cao độ của hạ tầng Internet.

Bài viết này Cloudflare toàn cầu “cúp điện số”: Báo cáo chính thức tiết lộ chi tiết sự cố ngày 18 tháng 11 lần đầu xuất hiện trên Chain News ABMedia.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)