Claude Kode 500.000 baris kode bocor semua terorganisir, apa inti sebenarnya dari AI Agent?

BlockBeatNews

51,2 万 baris kode, 1.906 berkas, source map 59,8 MB. Pada dini hari tanggal 31 Maret, Chaofan Shou dari Solayer Labs menemukan bahwa produk andalan Anthropic, Claude Code, mengekspos seluruh kode sumber ke repositori npm publik. Dalam beberapa jam, kodenya dicerminkan ke GitHub, dan jumlah fork melampaui 41.000.

Ini bukan kesalahan pertama Anthropic. Saat Claude Code pertama kali dirilis pada Februari 2025, kebocoran source map yang sama juga pernah terjadi. Kali ini nomor versinya adalah v2.1.88, dengan penyebab kebocoran yang sama: alat build Bun secara default menghasilkan source map, sementara berkas ini tertinggal di dalam .npmignore.

Sebagian besar laporan membahas telur kejutan dalam kebocoran, seperti sistem hewan peliharaan virtual dan “mode penyamaran” yang membuat Claude anonim mengirimkan kode ke proyek open source. Namun masalah yang benar-benar layak dibedah adalah: mengapa model Claude yang sama bisa tampil sangat berbeda antara versi laman web dan Claude Code? Untuk apa sebenarnya 512.000 baris kode itu?

Model hanyalah puncak gunung es

Jawabannya tersimpan dalam struktur kode. Menurut analisis reverse terhadap kode yang bocor oleh komunitas GitHub, dari 512.000 baris TypeScript, hanya sekitar 8.000 baris kode yang secara langsung bertanggung jawab memanggil antarmuka model AI, atau 1,6% dari total.

Lalu 98,4% sisanya sedang mengerjakan apa? Dua modul terbesar adalah mesin kueri (46.000 baris) dan sistem alat (29.000 baris). Mesin kueri menangani pemanggilan LLM API, output streaming, orkestrasi cache, dan manajemen percakapan multi-babak. Sistem alat mendefinisikan sekitar 40 alat bawaan dan 50 perintah slash, membentuk arsitektur seperti plugin; setiap alat memiliki kontrol izin yang independen.

Selain itu ada juga 25.000 baris kode rendering UI terminal (salah satu berkas bernama print.ts panjangnya hingga 5.594 baris, dengan satu fungsi melintasi 3.167 baris), 20.000 baris kode keamanan dan kontrol izin (termasuk 23 pemeriksaan keamanan Bash yang diberi nomor dan 18 perintah bawaan Zsh yang disembunyikan), serta sistem orkestrasi multi-agen sebanyak 18.000 baris.

Peneliti riset machine learning Sebastian Raschka, setelah menganalisis kode yang bocor, menyatakan bahwa mengapa Claude Code lebih kuat daripada versi laman web untuk model yang sama tidak terletak pada modelnya sendiri, melainkan pada scaffolding perangkat lunak yang dibangun di sekeliling model, termasuk pemuatan konteks repositori, penjadwalan alat khusus, strategi cache, dan kolaborasi sub-agen. Ia bahkan berpendapat bahwa jika arsitektur rekayasa yang sama diterapkan ke model lain seperti DeepSeek atau Kimi, juga bisa memperoleh peningkatan kinerja pemrograman yang mendekati.

Perbandingan yang intuitif dapat membantu memahami kesenjangan ini. Anda mengetik satu pertanyaan di ChatGPT atau Claude versi web; setelah model memproses, ia mengembalikan jawaban, dan percakapan pun berakhir tanpa meninggalkan apa pun. Tetapi cara kerja Claude Code benar-benar berbeda: saat memulai, ia lebih dulu membaca berkas-berkas proyek Anda, memahami struktur basis kode Anda, dan mengingat preferensi yang Anda katakan sebelumnya seperti “jangan mock database dalam pengujian”. Ia dapat langsung menjalankan perintah di terminal Anda, mengedit berkas, dan menjalankan pengujian; saat menghadapi tugas yang kompleks, ia akan memecahnya menjadi beberapa sub-tugas lalu mendistribusikan ke sub-agen berbeda untuk diproses secara paralel. Dengan kata lain, AI versi web adalah jendela tanya-jawab, sedangkan Claude Code adalah kolaborator yang tinggal di komputer Anda.

Ada yang mengibaratkan arsitektur ini seperti sistem operasi: 42 alat bawaan setara dengan system call, sistem izin setara dengan manajemen pengguna, protokol MCP setara dengan driver perangkat, dan orkestrasi sub-agen setara dengan penjadwalan proses. Setiap alat secara default diberi label “tidak aman, dapat ditulis” saat keluar dari pabrik, kecuali pengembang secara aktif menyatakan bahwa alat tersebut aman. Alat untuk mengedit berkas akan memaksa pemeriksaan apakah Anda sudah membaca berkas itu terlebih dahulu; jika belum membaca, Anda tidak diizinkan untuk mengubahnya. Ini bukan sekadar sebuah chatbot yang menempelkan beberapa alat, melainkan lingkungan eksekusi yang menggunakan LLM sebagai inti, dengan mekanisme keamanan yang lengkap.

Ini berarti satu hal: pagar kompetisi produk AI mungkin tidak berada pada lapisan model, melainkan pada lapisan rekayasa.

Setiap kali cache tertembus, biaya naik 10 kali

Di dalam kode yang bocor ada berkas bernama promptCacheBreakDetection.ts yang melacak 14 vektor yang berpotensi menyebabkan prompt cache tidak valid. Mengapa insinyur Anthropic harus menghabiskan begitu banyak upaya untuk mencegah cache tertembus?

Lihat saja penetapan harga resmi Anthropic untuk mengetahuinya. Misalnya, untuk Claude Opus 4.6, harga standar untuk input adalah 5 dolar per satu juta token, tetapi jika kena cache, harga baca hanya 0,5 dolar—lebih murah 90%. Sebaliknya, setiap kali cache tertembus, biaya penalaran harus berlipat 10.

Ini menjelaskan banyak keputusan arsitektur dalam kode yang bocor yang tampak seperti “over-engineering”. Saat Claude Code memulai, ia memuat current git branch, catatan commit terbaru, dan berkas CLAUDE.md sebagai konteks; konten statis ini dicache secara global, dipisahkan dengan penanda batas untuk konten dinamis, sehingga setiap percakapan tidak perlu memproses ulang konteks yang sudah ada. Di dalam kode juga ada mekanisme bernama sticky latches yang mencegah pergantian mode merusak cache yang sudah terbentuk. Sub-agen dirancang untuk menggunakan ulang cache milik proses induk, bukan membangun ulang jendela konteks mereka sendiri.

Ada detail yang layak diuraikan di sini. Pengguna alat pemrograman AI pasti tahu bahwa semakin panjang percakapan, semakin lambat respons AI, karena setiap putaran percakapan harus mengirim ulang seluruh riwayat sebelumnya ke model. Praktik umum adalah menghapus pesan lama untuk mengosongkan ruang, tetapi masalahnya adalah: menghapus pesan apa pun akan memutus kesinambungan cache, sehingga seluruh riwayat percakapan perlu diproses ulang; keterlambatan dan biaya pun melonjak sekaligus.

Di dalam kode yang bocor ada mekanisme bernama cache_edits yang caranya tidak benar-benar menghapus pesan, melainkan memberi tanda “lewati” pada pesan-pesan lama di level API. Model tidak melihat pesan-pesan ini lagi, tetapi kesinambungan cache tidak rusak. Artinya, untuk percakapan panjang yang berlangsung berjam-jam, setelah Anda membersihkan ratusan pesan lama, kecepatan respons pada putaran berikutnya hampir sama cepatnya dengan putaran pertama. Bagi pengguna biasa, ini adalah jawaban tingkat dasar tentang “mengapa Claude Code bisa mendukung percakapan tanpa batas tanpa jadi melambat”.

Berdasarkan data pemantauan internal yang bocor (dari komentar kode autoCompact.ts, yang menandai tanggal 10 Maret 2026), sebelum memperkenalkan batas kegagalan auto-kompres, Claude Code setiap hari membuang sekitar 250.000 kali panggilan API. Ada 1279 sesi pengguna yang mengalami lebih dari 50 kali kegagalan kompres beruntun; sesi paling parah mengalami kegagalan 3272 kali secara beruntun. Perbaikannya hanya menambah satu baris batas: MAX_CONSECUTIVE_AUTOCOMPACT_FAILURES = 3.

Jadi, untuk produk AI, biaya penalaran model mungkin bukan lapisan paling mahal; kegagalan manajemen cache-lah yang paling mahal.

44 sakelar, mengarah ke arah yang sama

Di dalam kode yang bocor tersimpan 44 feature flags—sakelar fitur yang sudah dikompilasi, tetapi tidak dirilis ke publik. Menurut analisis komunitas, flags ini dibagi menjadi lima kategori berdasarkan domain fungsional; yang paling padat adalah kategori “agen otonom” (12), yang mengarah ke sebuah sistem bernama KAIROS.

KAIROS dirujuk lebih dari 150 kali di dalam kode sumber; itu adalah mode daemon latar belakang yang menetap. Claude Code tidak lagi sekadar alat yang merespons ketika Anda memanggilnya secara manual, melainkan agen yang selalu berjalan di latar belakang, terus memantau, mencatat, dan bertindak secara proaktif pada waktu yang tepat. Syaratnya: tidak mengganggu pengguna; setiap operasi yang berpotensi memblokir pengguna lebih dari 15 detik akan ditunda eksekusinya.

KAIROS juga mengintegrasikan persepsi fokus terminal. Di dalam kode ada field terminalFocus yang mendeteksi secara real-time apakah pengguna sedang menatap jendela terminal. Saat Anda beralih ke browser atau aplikasi lain, agen menilai bahwa Anda “tidak berada di sana”, lalu beralih ke mode otonom, menjalankan tugas secara proaktif, mengirimkan kode langsung, dan tidak menunggu konfirmasi Anda. Saat Anda kembali ke terminal, agen langsung kembali ke mode kolaborasi: pertama melaporkan apa yang barusan dikerjakan, lalu meminta pendapat Anda. Tingkat otonomnya bukan sesuatu yang tetap, melainkan berfluktuasi mengikuti perhatian Anda secara real-time. Ini menyelesaikan masalah memalukan yang lama dihadapi alat AI: AI yang sepenuhnya otonom membuat orang tidak nyaman, sedangkan AI yang sepenuhnya pasif efisiensinya terlalu rendah. Pilihan KAIROS adalah membuat inisiatif AI menyesuaikan secara dinamis dengan perhatian pengguna; ketika Anda menatap, ia tetap “patuh”, ketika Anda pergi, ia mengerjakan sendiri.

Sistem sub lain dari KAIROS disebut autoDream: setelah mengumpulkan 5 sesi atau jeda 24 jam, agen akan menjalankan proses “refleksi” di latar belakang, dibagi menjadi empat langkah. Pertama, memindai memori yang sudah ada untuk memahami apa yang saat ini dikuasainya. Kedua, mengekstrak pengetahuan baru dari log percakapan. Lalu, menggabungkan pengetahuan baru dan lama, memperbaiki kontradiksi, serta menghapus duplikasi. Terakhir, menyederhanakan indeks dan menghapus entri yang sudah ketinggalan. Desain ini meniru teori pemantapan memori dalam ilmu kognitif: manusia merapikan ingatan saat tidur, sementara KAIROS merapikan konteks proyek ketika pengguna pergi. Bagi pengguna biasa, ini berarti semakin lama Anda menggunakan Claude Code, semakin akurat pemahamannya tentang proyek Anda—bukan sekadar “mengingat apa yang Anda katakan”.

Kategori kedua adalah “anti-destilasi dan keamanan” (8 flags). Yang paling layak diperhatikan di antaranya adalah mekanisme fake_tools: ketika 4 kondisi sekaligus terpenuhi (flag saat kompilasi diaktifkan, entry CLI aktif, menggunakan API pihak pertama, dan GrowthBook remote switch bernilai true), Claude Code akan menyuntikkan definisi alat palsu ke dalam permintaan API, dengan tujuan mencemari dataset yang mungkin terekam dari aliran API dan digunakan untuk melatih model kompetitor. Ini adalah bentuk pertahanan baru dalam perlombaan persenjataan AI: bukan untuk mencegah Anda meniru, melainkan agar Anda meniru hal yang salah.

Selain itu, kode juga memunculkan kode nama model Capybara (dibagi menjadi tiga level: versi standar, versi fast, dan versi dengan jendela konteks jutaan), yang banyak diduga komunitas sebagai kode internal untuk seri Claude 5.

Telur kejutan: di 512.000 baris kode tersimpan seekor hewan peliharaan elektronik

Di sela-sela semua arsitektur rekayasa yang serius dan mekanisme keamanan, insinyur Anthropic diam-diam membangun satu set sistem hewan peliharaan virtual yang lengkap, dengan kode internal BUDDY.

Menurut kode yang bocor dan analisis komunitas, BUDDY adalah hewan peliharaan terminal yang bersifat拟物(penuh gaya replika), yang muncul dalam bentuk bubble ASCII di samping kolom input pengguna. Ia memiliki 18 spesies (termasuk capybara?—air buck? tidak, di sini: water豚, salamander? sebenarnya “salamander” dalam teks: water豚, amfibi seperti ibr?; sesuai teks: water豚、蝾螈、蘑菇、幽灵、龙, serta rangkaian organisme orisinal seperti Pebblecrab、Dustbunny、Mossfrog). Spesies-spesies tersebut dibagi menjadi lima level berdasarkan kelangkaan: biasa (60%), langka (25%), sangat langka (10%), epik (4%) dan legendaris (1%). Setiap spesies juga punya “varian bersinar” (shiny); Shiny Legendary Nebulynx yang paling langka muncul dengan probabilitas hanya satu per sepuluh ribu.

Setiap BUDDY memiliki lima atribut: DEBUGGING (debugging), PATIENCE (kesabaran), CHAOS (kekacauan), WISDOM (kebijaksanaan), dan SNARK (sindiran pedas). Mereka juga bisa memakai topi: opsinya termasuk mahkota, topi pesta, topi baling-baling (螺旋桨帽), halo (cincin cahaya), topi penyihir, bahkan ada juga bebek mini. Hash ID pengguna menentukan hewan peliharaan mana yang akan Anda tetaskan; Claude akan membuatkan nama dan kepribadiannya.

Menurut rencana peluncuran yang bocor, BUDDY awalnya dijadwalkan untuk memulai uji coba internal dari 1 April hingga 7 April, lalu peluncuran resmi pada bulan Mei, dimulai dari karyawan internal Anthropic.

512.000 baris kode, 98,4% untuk melakukan rekayasa kelas berat, tetapi pada akhirnya ada orang yang meluangkan waktu untuk membuat seekor kadal elektronik yang memakai topi baling-baling. Mungkin inilah satu baris kode paling manusiawi dalam kebocoran itu.

Klik untuk mengetahui Lowongan Layanan律动BlockBeats

Selamat bergabung dengan komunitas resmi律动 BlockBeats:

Grup langganan Telegram: https://t.me/theblockbeats

Grup komunitas Telegram: https://t.me/BlockBeats_App

Akun resmi Twitter: https://twitter.com/BlockBeatsAsia

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar