Quét để tải ứng dụng Gate
qrCode
Thêm tùy chọn tải xuống
Không cần nhắc lại hôm nay

Sự cố ngừng hoạt động của Cloudflare: Kiểm tra thực tế của câu chuyện phi tập trung

Tác giả: Wenser, Odaily 星球日报

Tiêu đề gốc: Cloudflare sập, nghiền nát bộ lọc phi tập trung của Web3


Tối qua, nhà cung cấp dịch vụ hạ tầng internet lớn nhất thế giới Cloudflare đã xảy ra sự cố ngưng hoạt động liên tục trong vài giờ, dẫn đến hàng loạt trang web toàn cầu, bao gồm cả X và OpenAI, bị tê liệt, nhiều trang web chính thức của các dự án tiền điện tử cũng không thoát khỏi tình trạng này.

Hôm nay, Cloudflare đã phát hành tuyên bố chính thức rằng: “Sự cố ngừng hoạt động quy mô lớn này không phải là do tấn công mạng từ bên ngoài, mà là do một cấu hình lỗi phát sinh sau khi điều chỉnh quyền truy cập cơ sở dữ liệu, dẫn đến sự cố hệ thống proxy chính, gây ra sự gián đoạn cho nhiều sản phẩm bao gồm CDN, dịch vụ bảo mật, Workers KV, Turnstile, Access, đây là sự cố nghiêm trọng nhất kể từ năm 2019.”

Điều quan trọng hơn là sự kiện này lại một lần nữa làm sáng tỏ một thực tế: ngay cả mạng lưới blockchain phi tập trung cũng vẫn khó có thể thoát khỏi sự phụ thuộc vào cơ sở hạ tầng Internet tập trung. Odaily sẽ tóm tắt và phân tích sự kiện này trong phần dưới đây.

Cloudflare: Jerusalem của Internet toàn cầu đã thất thủ, 1/5 Internet ngưng hoạt động

Trước khi nói về sự cố ngừng hoạt động ngày hôm qua, chúng ta cần tìm hiểu lý do tại sao Cloudflare lại quan trọng đối với internet.

Theo thông tin từ trang web của Cloudflare, 20% các trang web trên toàn cầu được Cloudflare cung cấp dịch vụ bảo mật; họ chặn tới 234 tỷ mối đe dọa mạng mỗi ngày. Ngoài ra, thông tin trên trang web cho thấy, 30% trong số 1000 công ty giàu có nhất thế giới dựa vào các dịch vụ liên quan do Cloudflare cung cấp, trong đó có những công ty nổi tiếng như X (Twitter), OpenAI, cũng như nền tảng thương mại điện tử Shopify, tập đoàn truyền thông Thomson Reuters, công ty cung cấp tài liệu truyền thông Canva, và nhà phát triển trò chơi của trò chơi điện tử LOL là Riot Games. Sản phẩm cộng đồng mà các game thủ quen thuộc, Discord, cũng là một “khách hàng mẫu” của Cloudflare.

Ngoài ra, Cloudflare cũng là tuyến phòng thủ an ninh và mạng phân phối nội dung (CDN) cho nhiều trang web độc lập và doanh nghiệp. Khi nó gặp sự cố, giống như một vụ tai nạn giao thông trên xa lộ toàn cầu dẫn đến tắc nghẽn giao thông, người dùng internet không thể vượt qua nó để kết nối với máy chủ chính của trang web. Thậm chí còn khó tin hơn, do các kỹ sư chính thức ban đầu đã nhầm tưởng rằng họ đang đối mặt với một cuộc tấn công DDOS, nên ngay cả trang web Downdetector, nơi kiểm tra trạng thái trang web cũng không thể truy cập trong một thời gian, tạo ra một hiện tượng mạng “Tôi bị sập, nhưng tôi không thể phát hiện ra mình bị sập”. Sự cố sập này kéo dài hơn 3 giờ và việc phục hồi hoàn toàn mất hơn 5 giờ, phạm vi ảnh hưởng và sức phá hoại của nó đã khiến nhiều người gọi đây là “sự cố hạ tầng internet nghiêm trọng nhất từ đầu năm 2025 đến nay”.

Sáng nay, Cloudflare đã phát hành báo cáo phân tích sự cố ngừng hoạt động, cho biết sự cố ngừng hoạt động quy mô lớn xảy ra vào ngày 18 tháng 11 không phải do tấn công mạng bên ngoài, mà là do một lỗi cấu hình được tạo ra sau khi điều chỉnh quyền truy cập cơ sở dữ liệu dẫn đến sự cố hệ thống proxy chính, gây ra sự gián đoạn cho nhiều sản phẩm bao gồm CDN, dịch vụ bảo mật, Workers KV, Turnstile và Access. Đây là sự cố nghiêm trọng nhất kể từ năm 2019. Ban đầu, đội ngũ đã nhầm lẫn với tấn công DDoS, cuối cùng đã khôi phục bằng cách quay trở lại cấu hình cũ, các dịch vụ liên quan đã được khôi phục hoàn toàn vào lúc 01:06 sáng theo giờ Bắc Kinh ngày 19 tháng 11.

Đối mặt với “sự cố nội bộ” như vậy, CTO của Cloudflare, Dane Knecht, đã thẳng thắn trên X: “Chúng tôi đã thất vọng về niềm tin của khách hàng và cả cộng đồng internet rộng lớn hơn; đây không phải là một cuộc tấn công, mà là một vấn đề phát sinh sau khi chúng tôi thực hiện thay đổi cấu hình định kỳ nội bộ; bất kỳ sự gián đoạn nào cũng đều không thể chấp nhận được, và chúng tôi sẽ nỗ lực hết mình để lấy lại niềm tin này.”

Cần lưu ý rằng đây không phải là lần đầu tiên Cloudflare khiến internet “dừng hoạt động tập thể”, nhưng đây là lần nghiêm trọng nhất trong gần 6 năm qua.

Năm 2013, lỗi cấu hình BGP đã khiến toàn bộ mạng lưới Cloudflare “biến mất” khỏi Internet, tất cả DNS và dịch vụ bị gián đoạn khoảng 1 giờ;

Năm 2019, khi cập nhật quy tắc quản lý WAF, một biểu thức chính quy thảm khốc đã gây ra việc quay ngược CPU theo cấp số nhân trên toàn cầu, khiến một nửa internet gặp lỗi 502/503 trong vòng 30 phút, đây cũng là sự cố nội bộ nghiêm trọng nhất theo tuyên bố của Cloudflare dẫn đến sự sập hệ thống.

Năm 2020, một lỗi do cạn kiệt CPU trong quá trình triển khai mã thông thường đã bị phóng đại, dẫn đến việc CPU của các nút biên toàn cầu tăng vọt lên 100%, lưu lượng giảm gần 50%, kéo dài khoảng 30 phút;

Năm 2022, khi thay đổi cấu hình của mạng xương sống, đã xảy ra lỗi khiến 19 trung tâm dữ liệu có lưu lượng cao bị ngắt kết nối đồng thời, dẫn đến hơn 50% lưu lượng truy cập của các trang web trên toàn cầu bị gián đoạn trong gần 1 giờ 40 phút;

Năm 2023, một trung tâm dữ liệu lõi đơn ở Portland, Mỹ đã bị mất điện hoàn toàn (mất điện lưới + tất cả các máy phát điện đều thất bại), dẫn đến việc Dashboard/API và dịch vụ phân tích không khả dụng trên diện rộng;

Vào tháng 6 năm nay, sự cố hạ tầng lưu trữ bên thứ ba đã dẫn đến việc giảm cấp toàn cầu Workers KV, ảnh hưởng đến nhiều sản phẩm như Workers, R2, Zero Trust trong 2 giờ 28 phút.

Những lần ngừng hoạt động liên tiếp khiến chúng ta không khỏi suy nghĩ về một vấn đề lâu nay bị “narrative Web3”, “công nghệ blockchain”, “mạng lưới phi tập trung” né tránh: Liệu mạng lưới phi tập trung có thật sự có thể thay thế được cơ sở hạ tầng tập trung như Cloudflare hay không?

Cloudflare không có “phiên bản Web3 thay thế”: mạng lưới blockchain phi tập trung không thể tách rời khỏi dịch vụ cơ sở hạ tầng tập trung

Câu trả lời chắc chắn là phủ định.

Trong quá khứ, mỗi khi internet gặp sự cố với dịch vụ trung tâm, thị trường tiền điện tử thường bị nhấn chìm bởi tiếng nói “dịch vụ trung tâm không đáng tin cậy”, “mạng phi tập trung mới là tương lai”; vào tháng 7 năm nay, khi mạng Ethereum kỷ niệm 10 năm hoạt động ổn định, Vitalik còn cảm thán về lợi thế độc đáo của mạng phi tập trung với việc “Ethereum chưa bao giờ bị ngừng hoạt động hay đình trệ”. Tuy nhiên, từ thực tế, những xây dựng cơ sở hạ tầng internet như Cloudflare gần như không có “sự thay thế” trong cơ sở hạ tầng Web3 hiện tại. Dưới đây là thông tin so sánh liên quan do Grok 4.1 tổng hợp:

Sự thật tàn khốc và thực tế hơn là: phần lớn các dự án Web3 thực sự phụ thuộc vào dịch vụ của Cloudflare để hoạt động.

  • Frontend được lưu trữ trên Vercel/Netlify (nền tảng Cloudflare)
  • Node RPC được bảo vệ bởi Cloudflare Gateway
  • Trang web như trang chính thức, tài liệu, kết nối ví phụ thuộc vào Cloudflare

Không ngoa khi nói rằng nếu không có Cloudflare, 90% các dự án Web3 sẽ rơi vào trạng thái ngừng hoạt động.

Meme tuy muộn nhưng vẫn đến: Nhân viên mới của Cloudflare bị đổ lỗi? Chỉ là dân mạng đùa giỡn

Trong sự cố sập hệ thống của Cloudflare, một điều khá thú vị khác là một meme cũ đã xuất hiện sau sự việc - một người dùng đã đăng bài nói rằng anh ta đã thực hiện một số “cập nhật nhỏ” trong ngày đầu tiên làm việc tại Cloudflare, sau đó mọi người cũng bắt đầu “chuyến hành trình chơi đùa với meme” của riêng mình, thậm chí còn chế ra một “thể loại vào làm việc tại Cloudflare” -

  • “Ngày đầu vào làm ở Cloudflare, sếp bảo tôi đi xem phòng máy chủ, chúc tôi may mắn!”
  • “Ngày đầu tiên tại Cloudflare thật tuyệt vời, tôi đã được thăng chức rồi!”

Tất nhiên, đây chỉ là một trò đùa, người dùng trên đã từng đăng một tweet Meme về “gia nhập Amazon Cloud”. Nhưng từ những nội dung đùa giỡn này, chúng ta cũng không khó nhận ra: người dùng mạng đã không còn ngạc nhiên trước sự ngừng hoạt động của cơ sở hạ tầng tập trung, và trong tình huống như vậy, ngoài việc đùa giỡn và chờ đợi, không còn cách nào khác.

Kết luận: Mạng lưới phi tập trung và dịch vụ tập trung không phải là sự lựa chọn giữa hai, mà là sự kết hợp

Cuối bài viết, chúng tôi phải thừa nhận rằng - về hiệu suất, chi phí, an toàn và dễ sử dụng, các giải pháp dịch vụ Internet tập trung vẫn đang dẫn đầu xa, và việc để cơ sở hạ tầng phi tập trung và mạng blockchain hoàn toàn thay thế dịch vụ tập trung, để xử lý dữ liệu quy mô lớn và lưu lượng dịch vụ đám mây của các trang web AI như X, Spotify, OpenAI, không khác gì một giấc mơ viển vông.

Các sự cố ngừng hoạt động của Cloudflare không thể trở thành cơ hội cho việc áp dụng quy mô lớn mạng phi tập trung, nhưng lại có thể khiến chúng ta suy ngẫm: Sự khác biệt và lợi thế độc đáo của cơ sở hạ tầng phi tập trung Web3 thực sự nằm ở đâu?

Một số ông lớn trung tâm hóa vẫn đang nắm giữ cổ họng của internet, và chúng ta còn một chặng đường dài để có được một hệ sinh thái mạng thực sự phi tập trung. Trong tương lai gần có thể thấy được trong 5-10 năm tới, mạng phi tập trung và dịch vụ trung tâm hóa vẫn là một bộ đôi kết hợp, chứ không phải là sự lựa chọn giữa hai.

Chỉ có điều, lần sau khi Cloudflare gặp sự cố, có lẽ chúng ta có thể bớt đi sự hả hê “dịch vụ tập trung cũng không hữu ích” và nhiều hơn một chút suy nghĩ “chúng ta khi nào mới thực sự không cần phải phụ thuộc vào nó”.


ETH-2.34%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)