สาระสำคัญ
OpenAI ได้เปิดตัว EVMbench ระบบทดสอบมาตรฐานใหม่ที่พัฒนาร่วมกับ Paradigm เพื่อทดสอบว่าโมเดล AI ขั้นสูงสามารถตรวจจับ แก้ไข และใช้ช่องโหว่ในสมาร์ทคอนแทรกต์ของ Ethereum ได้อย่างไร
ผลลัพธ์เบื้องต้นเผยให้เห็น “ช่องว่างการโจมตี” ซึ่งโมเดลชั้นนำในปัจจุบันทำได้ดีกว่าการตรวจสอบและแก้ไขข้อผิดพลาดอย่างครอบคลุม — เน้นให้เห็นความก้าวหน้าของ AI อย่างรวดเร็วและความเสี่ยงที่กำลังเกิดขึ้น
EVMbench อาจเปลี่ยนแนวมาตรฐานด้านความปลอดภัยในคริปโต ช่วยให้สามารถตรวจสอบความปลอดภัยด้วย AI อย่างต่อเนื่องสำหรับทีม DeFi และให้ความมั่นใจระดับสถาบันในขณะที่ทรัพย์สินมูลค่าหลายพันล้านเคลื่อนเข้าสู่เครือข่าย
ในความร่วมมือครั้งสำคัญระหว่างปัญญาประดิษฐ์และเทคโนโลยีบล็อกเชน OpenAI ได้เปิดตัวอย่างเป็นทางการ EVMbench ซึ่งพัฒนาร่วมกับยักษ์ใหญ่ด้านการลงทุนในคริปโต Paradigm ระบบนี้ออกแบบมาเพื่อทดสอบอย่างเข้มงวดว่าเอเจนต์ AI สามารถระบุ ใช้ช่องโหว่ และแก้ไขจุดอ่อนในระบบนิเวศ Ethereum Virtual Machine (EVM) ได้อย่างไร
ด้วยมูลค่าทรัพย์สินคริปโตแบบเปิดที่มีมูลค่ากว่า 100 พันล้านดอลลาร์ ที่ถูกคุ้มครองโดยสมาร์ทคอนแทรกต์ ความเสี่ยงจึงไม่เคยสูงขนาดนี้มาก่อน EVMbench เป็นการเปลี่ยนแปลงเชิงรุกในการใช้ “โมเดลแนวหน้า” เพื่อป้องกัน DeFi จากภัยคุกคามทางไซเบอร์ที่ซับซ้อนขึ้นเรื่อย ๆ
แหล่งข้อมูล: openai
EVMbench ก้าวข้ามการวิเคราะห์โค้ดแบบคงที่โดยประเมินเอเจนต์ AI ในสามโหมดการทำงานที่มีความเสี่ยงสูงสุด กระบวนการนี้ “ตรวจจับ-แก้ไข-ใช้ช่องโหว่” จำลองการทำงานของนักวิจัยด้านความปลอดภัยระดับแนวหน้า
1. โหมดตรวจจับ (The Auditor): เอเจนต์สแกนรีโพซิทอรีโค้ดซับซ้อนเพื่อค้นหาข้อผิดพลาดที่ซ่อนอยู่ ความสำเร็จวัดจาก “การนึกถึง” — ความสามารถในการค้นหาปัญหา “ความจริงพื้นฐาน” — และรางวัลจากบั๊กบอนนี่
2. โหมดแก้ไข (The Engineer): เมื่อพบบั๊กแล้ว เอเจนต์ต้องเขียนโค้ดใหม่ ระบบจะใช้ชุดทดสอบอัตโนมัติเพื่อให้แน่ใจว่าการแก้ไขนั้นแก้ไขช่องโหว่โดยไม่ทำลายฟังก์ชันเดิมของคอนแทรกต์
3. โหมดโจมตี (The Adversary): ใน sandbox ที่ปลอดภัยและแยกออกจากกัน Anvil เอเจนต์พยายามดำเนินการโจมตีแบบ end-to-end เพื่อขโมยเงิน ซึ่งวัดความสามารถในการคิดเชิงรุกและการ “เชื่อมต่อ” ข้อผิดพลาดเล็กน้อยเข้าด้วยกันเป็นการละเมิดที่รุนแรง
แหล่งข้อมูล: openai
EVMbench ไม่ได้อิงกับปริศนาทางทฤษฎี แต่สร้างจากคลังข้อมูลที่คัดเลือกมาแล้วของ 120 ช่องโหว่ระดับรุนแรงสูง จาก 40 การตรวจสอบเชิงมืออาชีพ ข้อมูลส่วนใหญ่มาจากการแข่งขันตรวจสอบจริง (เช่น Code4rena) และกระบวนการด้านความปลอดภัยภายในของ Paradigm บนบล็อกเชน Tempo
โดยเน้นไปที่สมาร์ทคอนแทรกต์ที่เน้น “การชำระเงิน” เป็นหลัก ระบบจึงมั่นใจว่าโมเดล AI ได้รับการทดสอบในโค้ดที่จัดการกับเงินทุนหมุนเวียนหลายพันล้าน
การทดสอบภายในของ OpenAI เผยให้เห็นความสามารถของ AI ที่เร่งตัวขึ้นอย่างน่าตกใจ ในเวลาเพียงไม่กี่เดือน โมเดลชั้นนำพัฒนาจากการทำงานผิดพลาดพื้นฐาน ไปสู่การดำเนินการโจมตีซับซ้อนหลายขั้นตอน
“ช่องว่างการโจมตี”: ที่น่าสนใจคือ เอเจนต์ในปัจจุบันทำได้ดีกว่ามากในการ ใช้ช่องโหว่ (72.2%) มากกว่าการ ตรวจจับ หรือ แก้ไข นักวิจัยของ OpenAI สังเกตว่า เอเจนต์ทำได้ดีเมื่อได้รับเป้าหมายชัดเจน เช่น “ขโมยเงิน” แต่ต้องการการวิเคราะห์ที่ละเอียดขึ้นเพื่อรับมือกับงานที่ซับซ้อนและละเอียดอ่อน เช่น การตรวจสอบอย่างครอบคลุม
แหล่งข้อมูล: Openai
สำหรับระบบนิเวศคริปโตโดยรวม EVMbench ไม่ใช่แค่คะแนนวัดผล แต่เป็นตัวเร่งให้เกิด “ความปลอดภัยแบบซ้าย” ซึ่งเป็นการบูรณาการการตรวจสอบระดับสูงเข้าไปในกระบวนการเขียนโค้ด แทนที่จะรอการตรวจสอบหลังการปล่อยใช้งาน
ความปลอดภัยแบบเสรี: ทีม DeFi ขนาดเล็กที่ไม่สามารถจ้างตรวจสอบด้วยตนเองมูลค่า 200,000 ดอลลาร์ สามารถใช้เอเจนต์ AI ที่ได้รับการรับรองจาก EVMbench สำหรับการตรวจสอบโค้ดอย่างต่อเนื่องและแม่นยำสูง
ความพร้อมของสถาบัน: ขณะที่ยักษ์ใหญ่ด้านการเงินแบบดั้งเดิม เช่น Goldman Sachs และ Franklin Templeton ย้ายเข้าสู่เครือข่าย พวกเขาต้องการ “มาตรฐานทองคำ” ของการบริหารจัดการ AI ซึ่งระบบมาตรฐานนี้สามารถให้ได้
ความท้าทายแบบสองด้าน: ด้วยการเปิดซอร์สระบบนี้ OpenAI และ Paradigm จึงให้เครื่องมือแก่ “คนดี” ในการวัดและเอาชนะ “คนร้าย” พร้อมทั้งสร้างกรอบ “การเข้าถึงที่เชื่อถือได้สำหรับ Cyber” เพื่อเฝ้าระวังความเสี่ยงที่เกิดขึ้นใหม่
แม้ว่า EVMbench จะเป็นก้าวสำคัญที่ปฏิวัติวงการ แต่ในปัจจุบันยังจำกัดอยู่ในสภาพแวดล้อมแบบ deterministic และ sandbox คาดว่าเวอร์ชันในอนาคตจะรวมถึง ความขึ้นต่อกันหลายเครือข่าย และ MEV (Maximal Extractable Value) เพื่อจำลอง “Dark Forest” ของ mainnet Ethereum อย่างสมจริงมากขึ้น
ในขณะที่เอเจนต์ AI ก้าวจาก “เขียนโค้ด” ไปสู่ “รักษาเศรษฐกิจ” EVMbench จึงเป็นเครื่องชี้วัดสำคัญสำหรับอนาคตของการเงินแบบไร้ความเชื่อถือ
คำเตือน: ความคิดเห็นและการวิเคราะห์ในบทความนี้เป็นข้อมูลเพื่อการให้ข้อมูลเท่านั้น ไม่ใช่คำแนะนำด้านการเงิน รูปแบบทางเทคนิคและตัวชี้วัดที่กล่าวถึงอาจมีความผันผวนของตลาดและอาจไม่ให้ผลลัพธ์ตามคาด นักลงทุนควรระมัดระวัง ทำการวิจัยด้วยตนเอง และตัดสินใจตามความเสี่ยงที่ยอมรับได้ของตนเอง
เกี่ยวกับผู้เขียน: Nilesh Hembade เป็นผู้ก่อตั้งและหัวหน้าบรรณาธิการของ Coinsprobe ด้วยประสบการณ์มากกว่า 5 ปีในอุตสาหกรรมคริปโตและบล็อกเชน ตั้งแต่เปิดตัว Coinsprobe ในปี 2023 เขาให้ข้อมูลเชิงลึกรายวันผ่านการวิเคราะห์ตลาดเชิงลึก ข้อมูลบนเชน และการวิจัยเชิงเทคนิค