Bagaimana satu pembaruan basis data dapat melumpuhkan 20% internet global

11 November 18 Tanggal Peringatan Gangguan: Ketika Cloudflare Mengalami Gangguan, Siapa yang Membayar Biaya Infrastruktur?

Pada pukul 06:20 waktu Timur AS, sekitar 20% lalu lintas internet global secara mendadak berhenti. Sebuah penyesuaian izin basis data rutin memicu rangkaian reaksi berantai yang menyebabkan gangguan besar pada layanan inti yang mendukung operasi internet modern.

Ini bukan serangan hacker, juga bukan ancaman eksternal. Akar masalahnya hanyalah sebuah file konfigurasi yang volumenya membengkak melebihi batas default sistem setelah ukurannya berlipat ganda.

Bencana Dimulai dari Satu Query Basis Data

Timeline kejadian sangat jelas dan kejam:

UTC 11:05 — Cloudflare melakukan pembaruan izin pada klaster basis data ClickHouse, bertujuan meningkatkan keamanan dan keandalan.

UTC 11:28 — Perubahan menyebar ke lingkungan pengguna, muncul catatan error pertama.

UTC 11:48 — Halaman status resmi mengakui gangguan.

UTC 17:06 — Layanan sepenuhnya pulih, durasi lebih dari 5 jam.

Kebenaran di Tingkat Teknis

Inti masalahnya terletak pada kelalaian sederhana: query basis data yang bertanggung jawab untuk menghasilkan file konfigurasi perlindungan robot Cloudflare tidak menyertakan filter “nama basis data”.

Ini menyebabkan sistem mengembalikan entri duplikat—satu dari basis data default, satu lagi dari basis data penyimpanan dasar r0. Ukuran file konfigurasi pun membengkak dua kali lipat, dari sekitar 60 fitur menjadi lebih dari 200.

Cloudflare sebelumnya menetapkan batas keras 200 fitur untuk alokasi memori awal, dan insinyur menganggap “ini jauh di atas kebutuhan nyata saat ini”. Hingga kejadian tak terduga, margin keamanan yang tampaknya longgar ini langsung runtuh.

File yang melebihi batas memicu batas tersebut, dan kode Rust langsung melempar error: “thread fl2_worker_thread panicked: called Result::unwrap() on an Err value”

Sistem perlindungan robot adalah inti dari lapisan kontrol jaringan Cloudflare. Ketika gagal, sistem pemeriksaan kesehatan yang mengarahkan load balancer “server mana yang berfungsi normal” juga ikut gagal.

Yang paling ironis, file konfigurasi ini dibuat ulang setiap 5 menit. Selama query dijalankan di node klaster yang diperbarui, data error akan muncul. Akibatnya, jaringan Cloudflare berulang kali beralih antara “normal” dan “gangguan”—kadang memuat dokumen yang benar, kadang memuat dokumen yang salah.

“Pengulangan gangguan” ini membuat insinyur mengira sedang diserang serangan DDoS besar-besaran. Karena error internal biasanya tidak menyebabkan siklus pemulihan-gagal ini secara periodik.

Akhirnya, setelah semua node ClickHouse selesai diperbarui, setiap file yang dihasilkan tetap salah. Tanpa sinyal sistem yang akurat, sistem perlindungan secara default masuk ke “mode konservatif”, menganggap sebagian besar server tidak sehat. Lalu lintas internet terus mengalir ke node edge Cloudflare, tetapi tidak dapat diarahkan dengan benar.

Saat-saat Sunyi di Jaringan Global

Platform Web2 lumpuh total

  • X platform menerima 9.706 laporan gangguan
  • ChatGPT berhenti merespons di tengah percakapan
  • Spotify streaming terputus
  • Uber dan platform pengantaran mengalami gangguan fungsi
  • Pemain game mengalami disconnect paksa
  • Bahkan mesin pemesanan otomatis McDonald’s menampilkan layar error

Tidak Ada yang Kebal di Dunia Kripto

Antarmuka web dari bursa utama mengalami crash, pengguna menghadapi halaman login dan antarmuka transaksi yang tidak bisa dimuat.

Browser blockchain (seperti Etherscan, Arbiscan) langsung down.

Platform analisis data (DeFiLlama) mengalami error server secara intermittent.

Penyedia hardware wallet mengeluarkan pengumuman, menurunnya ketersediaan layanan.

Satu-satunya “Pengecualian”: Protokol Blockchain itu sendiri

Dilaporkan, bursa utama tidak mengalami gangguan frontend, transaksi di chain berjalan normal. Blockchain tetap berfungsi sepenuhnya, tanpa tanda-tanda gangguan konsensus.

Ini mengungkapkan kontradiksi tajam: jika blockchain masih menghasilkan blok, tetapi tidak ada yang bisa mengaksesnya, apakah cryptocurrency benar-benar “online”?

Peran Cloudflare dalam Lalu Lintas Internet Global

Cloudflare tidak menghosting situs web, juga bukan penyedia layanan cloud server. Perannya adalah sebagai “perantara”—antara pengguna dan jaringan.

Data inti:

  • Melayani 24 juta situs web
  • Memiliki edge node di 120 negara dan 330 kota
  • Mengelola sekitar 20% lalu lintas internet global
  • Menguasai 82% pangsa pasar perlindungan DDoS
  • Total bandwidth edge node mencapai 449 Tbps

Ketika “perantara” ini gagal, semua layanan yang bergantung di belakangnya juga menjadi “tidak dapat diakses”.

CEO Cloudflare Matthew Prince dalam pernyataan resmi menyatakan: “Ini adalah gangguan paling parah sejak Cloudflare didirikan pada 2019… Dalam lebih dari 6 tahun, kami belum pernah mengalami gangguan yang menyebabkan sebagian besar lalu lintas inti internet tidak bisa lewat jaringan kami.”

4 Gangguan Besar dalam 18 Bulan: Mengapa Industri Belum Berubah?

Juli 2024 — Kerentanan pembaruan keamanan CrowdStrike menyebabkan sistem TI global lumpuh (penerbangan dibatalkan, rumah sakit tertunda, layanan keuangan terhenti)

20 Oktober 2025 — Gangguan AWS selama 15 jam, layanan DynamoDB di wilayah Timur AS terganggu, menyebabkan banyak jaringan blockchain offline

29 Oktober 2025 — Masalah sinkronisasi konfigurasi Azure Microsoft, layanan Microsoft 365 dan Xbox Live lumpuh

18 November 2025 — Gangguan Cloudflare, sekitar 20% lalu lintas internet global terdampak

Risiko model kontraktor tunggal

AWS menguasai sekitar 30% pasar infrastruktur cloud global, Microsoft Azure 20%, Google Cloud 13%. Ketiga perusahaan ini mengendalikan lebih dari 60% infrastruktur yang mendukung internet modern.

Industri kripto seharusnya adalah solusi “desentralisasi”, namun kini terpaksa bergantung pada penyedia infrastruktur paling sentral ini.

Saat terjadi gangguan, satu-satunya “strategi pemulihan bencana” adalah: menunggu. Menunggu Cloudflare memperbaiki, AWS pulih, Azure mengeluarkan patch.

“Decentralisasi” Palsu: Layer Protokol Tidak Sama dengan Layer Akses

Industri kripto pernah menggambarkan visi:

Keuangan desentralisasi, mata uang anti sensor, sistem tanpa kepercayaan, tanpa titik kegagalan tunggal, kode adalah hukum

Realitas 18 November adalah: satu gangguan pagi hari membuat sebagian besar layanan kripto berhenti selama berjam-jam.

Dari sisi teknis: tidak ada protokol blockchain yang dilaporkan mengalami gangguan.

Dari sisi penggunaan: antarmuka transaksi crash, browser lumpuh, platform data down, layar penuh error 500.

Pengguna tidak bisa mengakses blockchain “desentralisasi” yang seharusnya mereka miliki. Protokol tetap berfungsi normal—asalkan mereka bisa "mengakses"nya.

Mengapa industri masih memilih “kemudahan” daripada “prinsip”?

Membangun infrastruktur desentralisasi sendiri berarti: membeli hardware mahal, menjamin pasokan listrik stabil, memelihara bandwidth khusus, menyewa ahli keamanan, melakukan redundansi geografis, membangun sistem cadangan, memantau 24 jam.

Sementara menggunakan Cloudflare cukup dengan: klik tombol, masukkan data kartu kredit, selesai dalam beberapa menit.

Start-up mengejar “peluncuran cepat”, investor menuntut “efisiensi modal”—semua memilih “kemudahan”, bukan “kemampuan tahan gangguan”.

Hingga saat “kemudahan” tidak lagi terasa mudah.

Mengapa solusi desentralisasi “tidak populer” meskipun ada?

Penyimpanan desentralisasi (seperti Arweave), pengiriman file terdistribusi (IPFS), komputasi desentralisasi (Akash), hosting desentralisasi (Filecoin) memang ada.

Namun, tantangannya meliputi:

  • Performa lebih rendah dari solusi terpusat, pengguna langsung merasakan latensi
  • Adopsi sangat rendah, proses penggunaan rumit
  • Biaya seringkali lebih tinggi dari menyewa infrastruktur dari tiga penyedia cloud utama

Membangun infrastruktur desentralisasi yang benar sangat sulit, jauh di atas bayangan.

Sebagian besar proyek hanya mengumbar “desentralisasi” di mulut, jarang benar-benar terealisasi. Memilih solusi terpusat selalu lebih sederhana dan murah—sampai terjadi gangguan.

Tantangan Regulasi Baru

Dalam 30 hari, tiga gangguan besar telah menarik perhatian tinggi dari regulator:

  • Apakah perusahaan ini termasuk “institusi sistemik penting”?
  • Apakah layanan backbone jaringan harus diatur seperti “perusahaan utilitas”?
  • Risiko apa yang muncul saat “besar sampai tidak bisa bangkrut” digabungkan dengan infrastruktur teknologi?
  • Cloudflare mengendalikan 20% lalu lintas internet global, apakah ini monopoli?

Departemen Keuangan AS sedang mendorong embedding kredensial identitas ke dalam smart contract, mewajibkan setiap interaksi DeFi melalui KYC. Saat infrastruktur berikutnya gagal, pengguna tidak hanya kehilangan hak transaksi—tapi juga kemampuan membuktikan identitas mereka di sistem keuangan.

Gangguan selama 3 jam bisa berubah menjadi 3 jam “tidak bisa melewati verifikasi manusia-mesin”—hanya karena layanan verifikasi berjalan di infrastruktur yang sudah lumpuh.

Dari “Kemudahan” ke “Kewajiban”: Kapan Titik Balik Terjadi?

18 November, industri kripto tidak “gagal”— blockchain sendiri berfungsi dengan sempurna.

Yang benar-benar “gagal” adalah penipuan kolektif industri terhadap diri sendiri:

  • Mengira bisa membangun “aplikasi tak terblokir” di atas infrastruktur yang bisa lumpuh
  • Mengira saat tiga perusahaan mengendalikan “akses”, “anti sensor” masih bermakna
  • Mengira saat satu file konfigurasi Cloudflare bisa menentukan apakah jutaan orang bisa bertransaksi, “desentralisasi” masih relevan

Kemampuan infrastruktur menahan gangguan bukanlah “tambahan opsional”, melainkan “fondasi utama”—tanpanya, semua fungsi lain tidak akan berarti.

Gangguan berikutnya sudah dalam proses—mungkin dari AWS, mungkin dari Azure, mungkin dari Google Cloud, atau bahkan gangguan kedua Cloudflare. Bisa bulan depan, bisa minggu depan.

Memilih solusi terpusat tetap lebih murah, lebih cepat, dan lebih praktis—sampai akhirnya tidak lagi.

Ketika konfigurasi Cloudflare berikutnya memicu celah tersembunyi di layanan penting, kita akan menyaksikan lagi scene yang sudah akrab: layar penuh error 500, transaksi berhenti total, blockchain berjalan normal tapi tidak bisa diakses, perusahaan berjanji “akan lebih baik lain kali” tapi tak pernah menepati.

Inilah dilema industri saat ini: semuanya tidak akan berubah, karena “kemudahan” selalu mampu mengalahkan “pencegahan risiko”—sampai suatu hari “kemudahan” itu menanggung biaya yang tak lagi bisa diabaikan.

AR5,24%
FIL4,14%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)