ในช่วงปีที่ผ่านมาเนื่องจากการตัดการเชื่อมต่อในการเล่าเรื่องเลเยอร์แอปพลิเคชันไม่สามารถจับคู่การเติบโตของโครงสร้างพื้นฐานได้พื้นที่ crypto จึงค่อยๆกลายเป็นการแข่งขันเพื่อแย่งชิงทรัพยากรความสนใจ จาก Silly Dragon ถึง Goat จาก Pump.fun ถึง Clanker ความไม่แน่นอนของความสนใจได้นําไปสู่วงจรของการคิดค้นใหม่อย่างต่อเนื่องในการต่อสู้ครั้งนี้ สิ่งที่เริ่มต้นด้วยรูปแบบการสร้างรายได้ที่สะดุดตาที่สุดได้พัฒนาอย่างรวดเร็วในรูปแบบแพลตฟอร์มที่รวมผู้แสวงหาความสนใจและผู้ให้บริการเข้าด้วยกันในที่สุดนําไปสู่รูปแบบชีวิตที่ใช้ซิลิกอนกลายเป็นผู้ให้บริการเนื้อหารายใหม่ ในบรรดาเหรียญมีมที่แปลกประหลาดมีหน่วยงานใหม่ได้เกิดขึ้นซึ่งช่วยให้นักลงทุนรายย่อยและ VCs บรรลุฉันทามติ: ตัวแทน AI
ในที่สุดความสนใจก็เป็นเกมที่ไม่มีผลรวมแม้ว่าการเก็งกําไรสามารถผลักดันการเติบโตอย่างรวดเร็วได้ ในบทความก่อนหน้านี้ของเราเกี่ยวกับ UNI เราได้ทบทวนจุดเริ่มต้นของยุคทองสุดท้ายของบล็อกเชนเมื่อการเติบโตอย่างรวดเร็วของ DeFi ถูกจุดประกายโดยการเปิดตัวการขุด LP ของ Compound Finance ในยุคนั้นการเข้าร่วมในกลุ่มการขุดหลายร้อยบางครั้งหลายพันแห่งที่มีผลตอบแทนใน APY หลายพันหรือหลายหมื่นเปอร์เซ็นต์เป็นรูปแบบดั้งเดิมที่สุดของการเก็งกําไรแบบ on-chain แม้ว่าผลลัพธ์จะเป็นการล่มสลายของหลายกลุ่มที่วุ่นวาย แต่การไหลบ่าเข้ามาของนักขุด "ตื่นทอง" ทําให้สภาพคล่องที่ไม่เคยมีมาก่อนในพื้นที่บล็อกเชน ในที่สุด DeFi ก็หลุดพ้นจากการเก็งกําไรที่บริสุทธิ์และเติบโตเป็นแนวดิ่งที่มั่นคงซึ่งตอบสนองความต้องการทางการเงินของผู้ใช้ในด้านต่างๆเช่นการชําระเงินการซื้อขายการเก็งกําไรและการปักหลัก ขณะนี้ตัวแทน AI กําลังอยู่ในช่วง "การเติบโตตามธรรมชาติ" ที่คล้ายกัน สิ่งที่เรากําลังสํารวจอยู่ตอนนี้คือวิธีที่ crypto สามารถรวม AI ได้ดีขึ้นและในที่สุดก็ยกระดับเลเยอร์แอปพลิเคชันให้สูงขึ้น
ในบทความก่อนหน้านี้ เราได้แนะนำโดยสั้น ๆ เกี่ยวกับต้นกำเนิดของ AI มีมผ่าน Truth Terminal และสำรวจศักยภาพในอนาคตของ AI Agents บทความนี้จะเน้นที่ AI Agents เอง
เริ่มจากคําจํากัดความของ AI Agent กันก่อน ในสาขา AI คําว่า "Agent" เป็นแนวคิดที่เก่ากว่าแต่ยังคงคลุมเครือโดยเน้นความเป็นอิสระเป็นหลัก กล่าวอีกนัยหนึ่ง AI ใด ๆ ที่สามารถรับรู้สภาพแวดล้อมและตัดสินใจแบบสะท้อนกลับถือเป็นตัวแทน วันนี้คําจํากัดความของ AI Agent ใกล้เคียงกับเอนทิตีอัจฉริยะซึ่งเป็นระบบที่ออกแบบมาเพื่อเลียนแบบกระบวนการตัดสินใจของมนุษย์ ระบบนี้ได้รับการยกย่องในสถาบันการศึกษาว่าเป็นแนวทางที่มีแนวโน้มมากที่สุดในการบรรลุ AGI (ปัญญาประดิษฐ์ทั่วไป)
ใน GPT เวอร์ชันแรกเราสามารถสัมผัสได้อย่างชัดเจนว่าโมเดลขนาดใหญ่นั้นเหมือนมนุษย์ แต่เมื่อตอบคําถามที่ซับซ้อนพวกเขามักจะให้คําตอบที่คลุมเครือหรือไม่ชัดเจน เหตุผลพื้นฐานสําหรับเรื่องนี้คือแบบจําลองเหล่านี้ขึ้นอยู่กับความน่าจะเป็นมากกว่าความเป็นเหตุเป็นผลและพวกเขาขาดความสามารถเหมือนมนุษย์เช่นการใช้เครื่องมือหน่วยความจําและการวางแผน ตัวแทน AI มีเป้าหมายที่จะจัดการกับช่องว่างเหล่านี้ ดังนั้นเพื่อสรุปในสูตร: AI Agent = LLM (Large Language Model) + Planning + Memory + Tools
โมเดลแบบพรอมต์เป็นเหมือนเวอร์ชันคงที่ของบุคคลซึ่งจะมีชีวิตขึ้นมาก็ต่อเมื่อเราป้อนข้อมูล ในทางตรงกันข้ามเป้าหมายของ AI Agent คือการเป็นเอนทิตีที่มีพลวัตและเหมือนมนุษย์มากขึ้น ปัจจุบัน AI Agents ส่วนใหญ่ในภาคสนามเป็นโมเดลที่ปรับแต่งอย่างละเอียดตามเวอร์ชัน Llama 70b หรือ 405b แบบโอเพนซอร์สของ Meta (พร้อมพารามิเตอร์ที่แตกต่างกัน) พร้อมกับหน่วยความจําและความสามารถในการใช้ API สําหรับการรวมเครื่องมือ ในพื้นที่อื่น ๆ พวกเขาอาจยังคงต้องการข้อมูลหรือความช่วยเหลือจากมนุษย์เช่นการโต้ตอบหรือการทํางานร่วมกับตัวแทน AI อื่น ๆ นี่คือเหตุผลที่ตัวแทน AI ส่วนใหญ่ในปัจจุบันมีอยู่ในรูปแบบของ KOL บนเครือข่ายสังคมออนไลน์เป็นหลัก ในการทําให้ AI Agent เหมือนมนุษย์มากขึ้นจําเป็นต้องรวมความสามารถในการวางแผนและการดําเนินการเข้าด้วยกันโดยห่วงโซ่ความคิดภายในกระบวนการวางแผนมีความสําคัญอย่างยิ่ง
แนวคิดของ Chain of Thought (CoT) ปรากฏตัวครั้งแรกในเอกสารปี 2022 ของ Google เรื่อง Chain-of-Thought Prompting Elicits Reasoning in Large Language Models เอกสารชี้ให้เห็นว่าด้วยการสร้างขั้นตอนการให้เหตุผลระดับกลางหลายขั้นตอนความสามารถในการให้เหตุผลของแบบจําลองสามารถปรับปรุงได้ช่วยให้เข้าใจและแก้ปัญหาที่ซับซ้อนได้ดีขึ้น
พรอมต์ CoT ทั่วไปประกอบด้วยสามส่วน: คําอธิบายงานพร้อมคําแนะนําที่ชัดเจนพื้นฐานเชิงตรรกะสําหรับงานที่มีรากฐานทางทฤษฎีหรือหลักการที่สนับสนุนโซลูชันและตัวอย่างเฉพาะของโซลูชัน วิธีการที่มีโครงสร้างนี้ช่วยให้แบบจําลองเข้าใจข้อกําหนดของงานและผ่านการให้เหตุผลเชิงตรรกะค่อยๆเข้าใกล้คําตอบปรับปรุงทั้งประสิทธิภาพและความแม่นยําของการแก้ปัญหา CoT เหมาะอย่างยิ่งสําหรับงานที่ต้องการการวิเคราะห์เชิงลึกและการให้เหตุผลหลายขั้นตอนเช่นการแก้ปัญหาทางคณิตศาสตร์หรือการเขียนรายงานโครงการ สําหรับงานที่ง่ายกว่า CoT อาจไม่แสดงข้อได้เปรียบที่ชัดเจน แต่สําหรับงานที่ซับซ้อนกว่านั้นสามารถปรับปรุงประสิทธิภาพของโมเดลได้อย่างมากโดยการลดอัตราข้อผิดพลาดผ่านกลยุทธ์การแก้ปัญหาทีละขั้นตอนซึ่งจะช่วยเพิ่มคุณภาพของงานให้เสร็จ
ในการสร้างตัวแทน AI CoT มีบทบาทสําคัญ ตัวแทน AI จําเป็นต้องเข้าใจข้อมูลที่ได้รับและตัดสินใจตามสมควร CoT ให้กระบวนการคิดตามคําสั่งที่ช่วยให้ตัวแทนประมวลผลและวิเคราะห์ข้อมูลอินพุตได้อย่างมีประสิทธิภาพเปลี่ยนการวิเคราะห์เป็นแนวทางที่นําไปปฏิบัติได้ วิธีนี้ไม่เพียง แต่เสริมสร้างความน่าเชื่อถือและประสิทธิภาพของการตัดสินใจของตัวแทน แต่ยังช่วยเพิ่มความโปร่งใสของกระบวนการตัดสินใจทําให้พฤติกรรมของตัวแทนสามารถคาดการณ์และตรวจสอบย้อนกลับได้มากขึ้น ด้วยการแบ่งงานออกเป็นขั้นตอนเล็ก ๆ CoT ช่วยให้ตัวแทนพิจารณาจุดตัดสินใจแต่ละจุดโดยละเอียดลดข้อผิดพลาดที่เกิดจากการโอเวอร์โหลดข้อมูลและทําให้กระบวนการตัดสินใจมีความโปร่งใสมากขึ้น ความโปร่งใสนี้ช่วยให้ผู้ใช้เข้าใจพื้นฐานของการตัดสินใจของตัวแทนได้ดีขึ้น ในการโต้ตอบกับสภาพแวดล้อม CoT ช่วยให้ตัวแทนสามารถเรียนรู้ข้อมูลใหม่อย่างต่อเนื่องและปรับกลยุทธ์พฤติกรรม
ในฐานะที่เป็นกลยุทธ์ที่มีประสิทธิภาพ CoT ไม่เพียง แต่ช่วยเพิ่มความสามารถในการให้เหตุผลของโมเดลภาษาขนาดใหญ่ แต่ยังมีบทบาทสําคัญในการสร้างตัวแทน AI ที่ชาญฉลาดและเชื่อถือได้มากขึ้น ด้วยการใช้ประโยชน์จาก CoT นักวิจัยและนักพัฒนาสามารถสร้างระบบอัจฉริยะที่สามารถปรับให้เข้ากับสภาพแวดล้อมที่ซับซ้อนและเป็นอิสระสูงได้มากขึ้น ในการใช้งานจริง CoT ได้แสดงข้อได้เปรียบที่เป็นเอกลักษณ์โดยเฉพาะอย่างยิ่งในการจัดการงานที่ซับซ้อน โดยการแบ่งงานออกเป็นชุดของขั้นตอนเล็ก ๆ ไม่เพียง แต่ช่วยเพิ่มความแม่นยําของการแก้ปัญหางาน แต่ยังช่วยเพิ่มความสามารถในการตีความและการควบคุมของแบบจําลอง แนวทางการแก้ปัญหาทีละขั้นตอนนี้สามารถลดข้อผิดพลาดที่เกิดจากข้อมูลที่มากเกินไปหรือซับซ้อนเกินไปเมื่อเผชิญกับงานที่ซับซ้อน ในเวลาเดียวกันวิธีนี้ยังช่วยเพิ่มความสามารถในการตรวจสอบย้อนกลับและการตรวจสอบความถูกต้องของโซลูชันทั้งหมด
หน้าที่หลักของ CoT อยู่ที่การบูรณาการการวางแผนการดําเนินการและการสังเกตเชื่อมช่องว่างระหว่างการใช้เหตุผลและการกระทํา แบบจําลองการคิดนี้ช่วยให้ AI Agent สามารถคิดค้นมาตรการตอบโต้ที่มีประสิทธิภาพเมื่อคาดการณ์ความผิดปกติที่อาจเกิดขึ้นและรวบรวมข้อมูลใหม่ในขณะที่โต้ตอบกับสภาพแวดล้อมภายนอกตรวจสอบการคาดการณ์ที่กําหนดไว้ล่วงหน้าและให้เหตุผลใหม่ CoT ทําหน้าที่เหมือนเครื่องยนต์ที่ทรงพลังของความแม่นยําและความเสถียรช่วยให้ AI Agent รักษาประสิทธิภาพสูงในสภาพแวดล้อมที่ซับซ้อน
วิธีใช้ Crypto ร่วมกับเทคโนโลยี AI อย่างแม่นยำได้อย่างไร? ในบทความปีที่แล้วฉันแนะนำว่าการกระจายพลังคำนวณและข้อมูลเป็นขั้นตอนสำคัญในการช่วยลดค่าใช้จ่ายของธุรกิจขนาดเล็กและนักพัฒนารายบุคคล ในปีนี้ ในการแยกประเภทรายละเอียดของ Crypto x AI ที่รวบรวมโดย Coinbase เราสามารถเห็นการแบ่งแยกที่เจาะจงมากขึ้น:
(1) ชั้นคำนวณ (เน้นการให้บริการทรัพยากร GPU สำหรับนักพัฒนา AI);
(2) ชั้นข้อมูล (เน้นการเข้าถึงแบบกระจาย การจัดการและการตรวจสอบท่อน้ำข้อมูล AI)
(3) ชั้น Middleware (แพลตฟอร์มหรือเครือข่ายที่สนับสนุนการพัฒนา การใช้งาน และการโฮสต์ของโมเดลหรือตัวแทน AI)
(4) ชั้นแอปพลิเคชัน (ผลิตภัณฑ์ที่ใช้กับผู้ใช้บนเชื่อมต่อระบบ AI บนเชื่อมต่อโซน ทั้ง B2B และ B2C)
แต่ละชั้นทั้งสี่นี้มีวิสัยทัศน์ที่ยิ่งใหญ่ซึ่งทั้งหมดนี้มีจุดมุ่งหมายเพื่อท้าทายการครอบงําของยักษ์ใหญ่ซิลิคอนวัลเลย์ในยุคต่อไปของอินเทอร์เน็ต อย่างที่ฉันพูดไปเมื่อปีที่แล้วเราจําเป็นต้องยอมรับว่ายักษ์ใหญ่ของ Silicon Valley ควบคุมพลังการประมวลผลและข้อมูลโดยเฉพาะหรือไม่? ภายใต้การผูกขาดของพวกเขาโมเดลขนาดใหญ่แบบปิดคือกล่องดําและวิทยาศาสตร์ซึ่งเป็นระบบความเชื่อที่เคารพนับถือมากที่สุดของมนุษยชาติในปัจจุบันจะพึ่งพาคําตอบที่ได้รับจากโมเดลขนาดใหญ่เหล่านี้ แต่ความจริงเหล่านี้จะตรวจสอบได้อย่างไร? ตามวิสัยทัศน์ของยักษ์ใหญ่ใน Silicon Valley เหล่านี้พลังที่ถือโดยตัวแทนอัจฉริยะอาจเกินจินตนาการของเราเช่นการมีอํานาจในการชําระเงินจากกระเป๋าเงินของคุณหรือควบคุมการเข้าถึงเทอร์มินัลของคุณ เราจะมั่นใจได้อย่างไรว่าไม่มีความผิดปกติเกิดขึ้น?
การกระจายอํานาจเป็นคําตอบเดียว แต่บางครั้งเราจําเป็นต้องพิจารณาอย่างสมเหตุสมผลว่ามีผู้ซื้อกี่รายสําหรับวิสัยทัศน์ที่ยิ่งใหญ่เหล่านี้ ในอดีตเราอาจมองข้ามความจําเป็นในการวนรอบเชิงพาณิชย์และใช้โทเค็นเพื่อเติมเต็มช่องว่างที่เกิดจากอุดมคติ อย่างไรก็ตามสถานการณ์ปัจจุบันมีความท้าทายมากขึ้น Crypto x AI ต้องออกแบบตามสถานการณ์จริง ตัวอย่างเช่นเราจะสร้างสมดุลระหว่างอุปทานที่ปลายทั้งสองด้านของเลเยอร์การประมวลผลในกรณีที่สูญเสียประสิทธิภาพและความไม่เสถียรและยังคงแข่งขันกับผู้ให้บริการคลาวด์แบบรวมศูนย์ได้อย่างไร โครงการชั้นข้อมูลจะมีผู้ใช้จริงกี่คน? เราจะตรวจสอบความถูกต้องและความถูกต้องของข้อมูลที่ให้ไว้ได้อย่างไร? ลูกค้าประเภทใดที่ต้องการข้อมูลนี้จริง ๆ ตรรกะเดียวกันนี้ใช้กับเลเยอร์อื่น ๆ ในยุคนี้เราไม่ต้องการความต้องการหลอกที่ถูกต้องมากมาย
ดังที่ฉันได้กล่าวไว้ในส่วนแรก Meme ได้พัฒนาอย่างรวดเร็วเป็นรูปแบบ SocialFi ที่เข้ากันได้กับ Web3 Friend.tech เป็น DApp ที่ยิงนัดแรกในแอปพลิเคชันโซเชียลรอบนี้ แต่น่าเสียดายที่มันล้มเหลวเนื่องจากการออกแบบโทเค็นที่เร่งรีบ ในทางกลับกัน Pump.fun ได้แสดงให้เห็นถึงความเป็นไปได้ของรูปแบบแพลตฟอร์มที่บริสุทธิ์โดยไม่มีโทเค็นหรือกฎใด ๆ ความต้องการของผู้แสวงหาความสนใจและผู้ให้บริการมาบรรจบกันบนแพลตฟอร์มนี้ซึ่งคุณสามารถโพสต์มีมสตรีมสดโทเค็นมิ้นท์ความคิดเห็นการค้าและทุกอย่างฟรี Pump.fun เรียกเก็บค่าบริการเท่านั้น โมเดลนี้โดยพื้นฐานแล้วเหมือนกับเศรษฐกิจความสนใจของแพลตฟอร์มโซเชียลมีเดียในปัจจุบันเช่น YouTube และ Instagram แต่มีรูปแบบรายได้ที่แตกต่างกันและการเล่นเกมที่เน้น Web3 มากขึ้น
ในทางกลับกัน Clanker ของ Base เป็นเรื่องราวความสําเร็จขั้นสูงสุดโดยได้รับประโยชน์จากระบบนิเวศแบบบูรณาการที่ออกแบบโดยแพลตฟอร์มเอง Base มี DApp ทางสังคมของตัวเองเป็นเครื่องมือเสริมสร้างลูปภายในที่สมบูรณ์ Meme Agent เป็นรูปแบบ 2.0 ของ Meme Coin ผู้คนมักจะไล่ตามความแปลกใหม่และตอนนี้ Pump.fun เป็นศูนย์กลางของความสนใจ จากมุมมองของแนวโน้มมันเป็นเพียงเรื่องของเวลาก่อนที่ความคิดที่แปลกประหลาดของสิ่งมีชีวิตที่ใช้ซิลิกอนจะเข้ามาแทนที่มส์ที่หยาบกว่าของสิ่งมีชีวิตที่ใช้คาร์บอน
ฉันได้กล่าวถึงฐานนับครั้งไม่ถ้วนด้วยแง่มุมที่แตกต่างกันในแต่ละครั้ง แต่สิ่งหนึ่งที่ยังคงชัดเจน: ฐานไม่เคยเป็นผู้เสนอญัตติแรก แต่ก็เป็นผู้ชนะมาโดยตลอด
จากมุมมองทางปฏิบัติ AI ตัวแทนน่าจะไม่ไปสู่การกระจายของตนเองในอนาคตที่เป็นไปได้ได้ง่าย ในฟิลด์ AI ทางเดิม การสร้างตัวแทน AI ไม่ใช่ปัญหาที่สามารถแก้ไขได้อย่างง่ายดายผ่านกระบวนการกระจายหรือโอเพนซอร์ส ตัวแทน AI ต้องเชื่อมต่อกับ API ต่าง ๆ เพื่อเข้าถึงเนื้อหา Web2 และต้นทุนในการดำเนินงานของพวกเขาสูง การออกแบบของ Chain of Thought (CoT) และการทำงานร่วมกันของตัวแทนหลายตัว ยังต้องการการกลายเป็นอย่างมาก โดยที่มีการกลายเป็นในระยะยาวจนกว่าเราจะพบรูปแบบการผสานที่เหมาะสม อาจเป็นบางสิ่งที่คล้ายกับ UNI แต่ในขณะนี้ฉันยังคงเชื่อว่าตัวแทน AI จะมีผลกระทบที่สำคัญต่อธุรกิจของเราอย่างมากเช่นเดียวกับที่ CEX อยู่ในภาคของเรา ไม่ถูกต้อง แต่มีความสำคัญอย่างมาก
เมื่อเดือนที่แล้ว Stanford & Microsoft ได้เผยแพร่ AI Agent Review ที่อธิบายการใช้งานของตัวแทน AI ในอุตสาหกรรมต่างๆ เช่น การดูแลสุขภาพ เครื่องจักรอัจฉริยะ และโลกเสมือนจริง ในภาคผนวกของบทความนี้มีกรณีทดลองมากมายที่ GPT-4V ในฐานะตัวแทน AI มีส่วนร่วมในการพัฒนาเกม AAA ระดับบนสุด
เราไม่ควรรีบรวมตัวเอเอไอเอเจนต์กับการกระจายอำนาจ สิ่งที่ฉันหวังคือชิ้นส่วนประกอบแรกที่เอเอไอเอเจนต์ทำเสร็จคือความสามารถในการสร้างขึ้นจากด้านล่างและความเร็ว มีหลายเรื่องที่เป็นเรื่องร้ายและโลกเสมือนที่ว่างเปล่าที่ต้องการการเติมเต็ม และเมื่อเวลาเหมาะสมมาถึง เราสามารถพิจารณาว่าจะทำอย่างไรเพื่อที่จะทำให้เอเอไอเอเจนต์กลายเป็น UNI ต่อไป
YBB เป็นกองทุน web3 ที่มุ่งมั่นที่จะระบุโครงการที่กำหนด Web3 และมีวิสัยทัศน์ที่จะสร้างที่อยู่ออนไลน์ที่ดีกว่าสำหรับผู้พักอาศัยบนอินเทอร์เน็ตทั้งหมด ก่อตั้งโดยกลุ่มผู้เชื่อมั่นในเทคโนโลยีบล็อกเชนที่มีการมีส่วนร่วมอย่างเต็มที่ในอุตสาหกรรมนี้ตั้งแต่ปี 2013 YBB ยินดีเสมอที่จะช่วยเหลือโครงการระยะแรกให้เติบโตจาก 0 ไปสู่ 1 เราให้ความสำคัญกับนวัตกรรมความมุ่งมั่นที่เป็นเองและผลิตภัณฑ์ที่ให้บริการต่อผู้ใช้ในขณะที่รู้จักศักยภาพของคริปโตและแอปพลิเคชันบล็อกเชน
ในช่วงปีที่ผ่านมาเนื่องจากการตัดการเชื่อมต่อในการเล่าเรื่องเลเยอร์แอปพลิเคชันไม่สามารถจับคู่การเติบโตของโครงสร้างพื้นฐานได้พื้นที่ crypto จึงค่อยๆกลายเป็นการแข่งขันเพื่อแย่งชิงทรัพยากรความสนใจ จาก Silly Dragon ถึง Goat จาก Pump.fun ถึง Clanker ความไม่แน่นอนของความสนใจได้นําไปสู่วงจรของการคิดค้นใหม่อย่างต่อเนื่องในการต่อสู้ครั้งนี้ สิ่งที่เริ่มต้นด้วยรูปแบบการสร้างรายได้ที่สะดุดตาที่สุดได้พัฒนาอย่างรวดเร็วในรูปแบบแพลตฟอร์มที่รวมผู้แสวงหาความสนใจและผู้ให้บริการเข้าด้วยกันในที่สุดนําไปสู่รูปแบบชีวิตที่ใช้ซิลิกอนกลายเป็นผู้ให้บริการเนื้อหารายใหม่ ในบรรดาเหรียญมีมที่แปลกประหลาดมีหน่วยงานใหม่ได้เกิดขึ้นซึ่งช่วยให้นักลงทุนรายย่อยและ VCs บรรลุฉันทามติ: ตัวแทน AI
ในที่สุดความสนใจก็เป็นเกมที่ไม่มีผลรวมแม้ว่าการเก็งกําไรสามารถผลักดันการเติบโตอย่างรวดเร็วได้ ในบทความก่อนหน้านี้ของเราเกี่ยวกับ UNI เราได้ทบทวนจุดเริ่มต้นของยุคทองสุดท้ายของบล็อกเชนเมื่อการเติบโตอย่างรวดเร็วของ DeFi ถูกจุดประกายโดยการเปิดตัวการขุด LP ของ Compound Finance ในยุคนั้นการเข้าร่วมในกลุ่มการขุดหลายร้อยบางครั้งหลายพันแห่งที่มีผลตอบแทนใน APY หลายพันหรือหลายหมื่นเปอร์เซ็นต์เป็นรูปแบบดั้งเดิมที่สุดของการเก็งกําไรแบบ on-chain แม้ว่าผลลัพธ์จะเป็นการล่มสลายของหลายกลุ่มที่วุ่นวาย แต่การไหลบ่าเข้ามาของนักขุด "ตื่นทอง" ทําให้สภาพคล่องที่ไม่เคยมีมาก่อนในพื้นที่บล็อกเชน ในที่สุด DeFi ก็หลุดพ้นจากการเก็งกําไรที่บริสุทธิ์และเติบโตเป็นแนวดิ่งที่มั่นคงซึ่งตอบสนองความต้องการทางการเงินของผู้ใช้ในด้านต่างๆเช่นการชําระเงินการซื้อขายการเก็งกําไรและการปักหลัก ขณะนี้ตัวแทน AI กําลังอยู่ในช่วง "การเติบโตตามธรรมชาติ" ที่คล้ายกัน สิ่งที่เรากําลังสํารวจอยู่ตอนนี้คือวิธีที่ crypto สามารถรวม AI ได้ดีขึ้นและในที่สุดก็ยกระดับเลเยอร์แอปพลิเคชันให้สูงขึ้น
ในบทความก่อนหน้านี้ เราได้แนะนำโดยสั้น ๆ เกี่ยวกับต้นกำเนิดของ AI มีมผ่าน Truth Terminal และสำรวจศักยภาพในอนาคตของ AI Agents บทความนี้จะเน้นที่ AI Agents เอง
เริ่มจากคําจํากัดความของ AI Agent กันก่อน ในสาขา AI คําว่า "Agent" เป็นแนวคิดที่เก่ากว่าแต่ยังคงคลุมเครือโดยเน้นความเป็นอิสระเป็นหลัก กล่าวอีกนัยหนึ่ง AI ใด ๆ ที่สามารถรับรู้สภาพแวดล้อมและตัดสินใจแบบสะท้อนกลับถือเป็นตัวแทน วันนี้คําจํากัดความของ AI Agent ใกล้เคียงกับเอนทิตีอัจฉริยะซึ่งเป็นระบบที่ออกแบบมาเพื่อเลียนแบบกระบวนการตัดสินใจของมนุษย์ ระบบนี้ได้รับการยกย่องในสถาบันการศึกษาว่าเป็นแนวทางที่มีแนวโน้มมากที่สุดในการบรรลุ AGI (ปัญญาประดิษฐ์ทั่วไป)
ใน GPT เวอร์ชันแรกเราสามารถสัมผัสได้อย่างชัดเจนว่าโมเดลขนาดใหญ่นั้นเหมือนมนุษย์ แต่เมื่อตอบคําถามที่ซับซ้อนพวกเขามักจะให้คําตอบที่คลุมเครือหรือไม่ชัดเจน เหตุผลพื้นฐานสําหรับเรื่องนี้คือแบบจําลองเหล่านี้ขึ้นอยู่กับความน่าจะเป็นมากกว่าความเป็นเหตุเป็นผลและพวกเขาขาดความสามารถเหมือนมนุษย์เช่นการใช้เครื่องมือหน่วยความจําและการวางแผน ตัวแทน AI มีเป้าหมายที่จะจัดการกับช่องว่างเหล่านี้ ดังนั้นเพื่อสรุปในสูตร: AI Agent = LLM (Large Language Model) + Planning + Memory + Tools
โมเดลแบบพรอมต์เป็นเหมือนเวอร์ชันคงที่ของบุคคลซึ่งจะมีชีวิตขึ้นมาก็ต่อเมื่อเราป้อนข้อมูล ในทางตรงกันข้ามเป้าหมายของ AI Agent คือการเป็นเอนทิตีที่มีพลวัตและเหมือนมนุษย์มากขึ้น ปัจจุบัน AI Agents ส่วนใหญ่ในภาคสนามเป็นโมเดลที่ปรับแต่งอย่างละเอียดตามเวอร์ชัน Llama 70b หรือ 405b แบบโอเพนซอร์สของ Meta (พร้อมพารามิเตอร์ที่แตกต่างกัน) พร้อมกับหน่วยความจําและความสามารถในการใช้ API สําหรับการรวมเครื่องมือ ในพื้นที่อื่น ๆ พวกเขาอาจยังคงต้องการข้อมูลหรือความช่วยเหลือจากมนุษย์เช่นการโต้ตอบหรือการทํางานร่วมกับตัวแทน AI อื่น ๆ นี่คือเหตุผลที่ตัวแทน AI ส่วนใหญ่ในปัจจุบันมีอยู่ในรูปแบบของ KOL บนเครือข่ายสังคมออนไลน์เป็นหลัก ในการทําให้ AI Agent เหมือนมนุษย์มากขึ้นจําเป็นต้องรวมความสามารถในการวางแผนและการดําเนินการเข้าด้วยกันโดยห่วงโซ่ความคิดภายในกระบวนการวางแผนมีความสําคัญอย่างยิ่ง
แนวคิดของ Chain of Thought (CoT) ปรากฏตัวครั้งแรกในเอกสารปี 2022 ของ Google เรื่อง Chain-of-Thought Prompting Elicits Reasoning in Large Language Models เอกสารชี้ให้เห็นว่าด้วยการสร้างขั้นตอนการให้เหตุผลระดับกลางหลายขั้นตอนความสามารถในการให้เหตุผลของแบบจําลองสามารถปรับปรุงได้ช่วยให้เข้าใจและแก้ปัญหาที่ซับซ้อนได้ดีขึ้น
พรอมต์ CoT ทั่วไปประกอบด้วยสามส่วน: คําอธิบายงานพร้อมคําแนะนําที่ชัดเจนพื้นฐานเชิงตรรกะสําหรับงานที่มีรากฐานทางทฤษฎีหรือหลักการที่สนับสนุนโซลูชันและตัวอย่างเฉพาะของโซลูชัน วิธีการที่มีโครงสร้างนี้ช่วยให้แบบจําลองเข้าใจข้อกําหนดของงานและผ่านการให้เหตุผลเชิงตรรกะค่อยๆเข้าใกล้คําตอบปรับปรุงทั้งประสิทธิภาพและความแม่นยําของการแก้ปัญหา CoT เหมาะอย่างยิ่งสําหรับงานที่ต้องการการวิเคราะห์เชิงลึกและการให้เหตุผลหลายขั้นตอนเช่นการแก้ปัญหาทางคณิตศาสตร์หรือการเขียนรายงานโครงการ สําหรับงานที่ง่ายกว่า CoT อาจไม่แสดงข้อได้เปรียบที่ชัดเจน แต่สําหรับงานที่ซับซ้อนกว่านั้นสามารถปรับปรุงประสิทธิภาพของโมเดลได้อย่างมากโดยการลดอัตราข้อผิดพลาดผ่านกลยุทธ์การแก้ปัญหาทีละขั้นตอนซึ่งจะช่วยเพิ่มคุณภาพของงานให้เสร็จ
ในการสร้างตัวแทน AI CoT มีบทบาทสําคัญ ตัวแทน AI จําเป็นต้องเข้าใจข้อมูลที่ได้รับและตัดสินใจตามสมควร CoT ให้กระบวนการคิดตามคําสั่งที่ช่วยให้ตัวแทนประมวลผลและวิเคราะห์ข้อมูลอินพุตได้อย่างมีประสิทธิภาพเปลี่ยนการวิเคราะห์เป็นแนวทางที่นําไปปฏิบัติได้ วิธีนี้ไม่เพียง แต่เสริมสร้างความน่าเชื่อถือและประสิทธิภาพของการตัดสินใจของตัวแทน แต่ยังช่วยเพิ่มความโปร่งใสของกระบวนการตัดสินใจทําให้พฤติกรรมของตัวแทนสามารถคาดการณ์และตรวจสอบย้อนกลับได้มากขึ้น ด้วยการแบ่งงานออกเป็นขั้นตอนเล็ก ๆ CoT ช่วยให้ตัวแทนพิจารณาจุดตัดสินใจแต่ละจุดโดยละเอียดลดข้อผิดพลาดที่เกิดจากการโอเวอร์โหลดข้อมูลและทําให้กระบวนการตัดสินใจมีความโปร่งใสมากขึ้น ความโปร่งใสนี้ช่วยให้ผู้ใช้เข้าใจพื้นฐานของการตัดสินใจของตัวแทนได้ดีขึ้น ในการโต้ตอบกับสภาพแวดล้อม CoT ช่วยให้ตัวแทนสามารถเรียนรู้ข้อมูลใหม่อย่างต่อเนื่องและปรับกลยุทธ์พฤติกรรม
ในฐานะที่เป็นกลยุทธ์ที่มีประสิทธิภาพ CoT ไม่เพียง แต่ช่วยเพิ่มความสามารถในการให้เหตุผลของโมเดลภาษาขนาดใหญ่ แต่ยังมีบทบาทสําคัญในการสร้างตัวแทน AI ที่ชาญฉลาดและเชื่อถือได้มากขึ้น ด้วยการใช้ประโยชน์จาก CoT นักวิจัยและนักพัฒนาสามารถสร้างระบบอัจฉริยะที่สามารถปรับให้เข้ากับสภาพแวดล้อมที่ซับซ้อนและเป็นอิสระสูงได้มากขึ้น ในการใช้งานจริง CoT ได้แสดงข้อได้เปรียบที่เป็นเอกลักษณ์โดยเฉพาะอย่างยิ่งในการจัดการงานที่ซับซ้อน โดยการแบ่งงานออกเป็นชุดของขั้นตอนเล็ก ๆ ไม่เพียง แต่ช่วยเพิ่มความแม่นยําของการแก้ปัญหางาน แต่ยังช่วยเพิ่มความสามารถในการตีความและการควบคุมของแบบจําลอง แนวทางการแก้ปัญหาทีละขั้นตอนนี้สามารถลดข้อผิดพลาดที่เกิดจากข้อมูลที่มากเกินไปหรือซับซ้อนเกินไปเมื่อเผชิญกับงานที่ซับซ้อน ในเวลาเดียวกันวิธีนี้ยังช่วยเพิ่มความสามารถในการตรวจสอบย้อนกลับและการตรวจสอบความถูกต้องของโซลูชันทั้งหมด
หน้าที่หลักของ CoT อยู่ที่การบูรณาการการวางแผนการดําเนินการและการสังเกตเชื่อมช่องว่างระหว่างการใช้เหตุผลและการกระทํา แบบจําลองการคิดนี้ช่วยให้ AI Agent สามารถคิดค้นมาตรการตอบโต้ที่มีประสิทธิภาพเมื่อคาดการณ์ความผิดปกติที่อาจเกิดขึ้นและรวบรวมข้อมูลใหม่ในขณะที่โต้ตอบกับสภาพแวดล้อมภายนอกตรวจสอบการคาดการณ์ที่กําหนดไว้ล่วงหน้าและให้เหตุผลใหม่ CoT ทําหน้าที่เหมือนเครื่องยนต์ที่ทรงพลังของความแม่นยําและความเสถียรช่วยให้ AI Agent รักษาประสิทธิภาพสูงในสภาพแวดล้อมที่ซับซ้อน
วิธีใช้ Crypto ร่วมกับเทคโนโลยี AI อย่างแม่นยำได้อย่างไร? ในบทความปีที่แล้วฉันแนะนำว่าการกระจายพลังคำนวณและข้อมูลเป็นขั้นตอนสำคัญในการช่วยลดค่าใช้จ่ายของธุรกิจขนาดเล็กและนักพัฒนารายบุคคล ในปีนี้ ในการแยกประเภทรายละเอียดของ Crypto x AI ที่รวบรวมโดย Coinbase เราสามารถเห็นการแบ่งแยกที่เจาะจงมากขึ้น:
(1) ชั้นคำนวณ (เน้นการให้บริการทรัพยากร GPU สำหรับนักพัฒนา AI);
(2) ชั้นข้อมูล (เน้นการเข้าถึงแบบกระจาย การจัดการและการตรวจสอบท่อน้ำข้อมูล AI)
(3) ชั้น Middleware (แพลตฟอร์มหรือเครือข่ายที่สนับสนุนการพัฒนา การใช้งาน และการโฮสต์ของโมเดลหรือตัวแทน AI)
(4) ชั้นแอปพลิเคชัน (ผลิตภัณฑ์ที่ใช้กับผู้ใช้บนเชื่อมต่อระบบ AI บนเชื่อมต่อโซน ทั้ง B2B และ B2C)
แต่ละชั้นทั้งสี่นี้มีวิสัยทัศน์ที่ยิ่งใหญ่ซึ่งทั้งหมดนี้มีจุดมุ่งหมายเพื่อท้าทายการครอบงําของยักษ์ใหญ่ซิลิคอนวัลเลย์ในยุคต่อไปของอินเทอร์เน็ต อย่างที่ฉันพูดไปเมื่อปีที่แล้วเราจําเป็นต้องยอมรับว่ายักษ์ใหญ่ของ Silicon Valley ควบคุมพลังการประมวลผลและข้อมูลโดยเฉพาะหรือไม่? ภายใต้การผูกขาดของพวกเขาโมเดลขนาดใหญ่แบบปิดคือกล่องดําและวิทยาศาสตร์ซึ่งเป็นระบบความเชื่อที่เคารพนับถือมากที่สุดของมนุษยชาติในปัจจุบันจะพึ่งพาคําตอบที่ได้รับจากโมเดลขนาดใหญ่เหล่านี้ แต่ความจริงเหล่านี้จะตรวจสอบได้อย่างไร? ตามวิสัยทัศน์ของยักษ์ใหญ่ใน Silicon Valley เหล่านี้พลังที่ถือโดยตัวแทนอัจฉริยะอาจเกินจินตนาการของเราเช่นการมีอํานาจในการชําระเงินจากกระเป๋าเงินของคุณหรือควบคุมการเข้าถึงเทอร์มินัลของคุณ เราจะมั่นใจได้อย่างไรว่าไม่มีความผิดปกติเกิดขึ้น?
การกระจายอํานาจเป็นคําตอบเดียว แต่บางครั้งเราจําเป็นต้องพิจารณาอย่างสมเหตุสมผลว่ามีผู้ซื้อกี่รายสําหรับวิสัยทัศน์ที่ยิ่งใหญ่เหล่านี้ ในอดีตเราอาจมองข้ามความจําเป็นในการวนรอบเชิงพาณิชย์และใช้โทเค็นเพื่อเติมเต็มช่องว่างที่เกิดจากอุดมคติ อย่างไรก็ตามสถานการณ์ปัจจุบันมีความท้าทายมากขึ้น Crypto x AI ต้องออกแบบตามสถานการณ์จริง ตัวอย่างเช่นเราจะสร้างสมดุลระหว่างอุปทานที่ปลายทั้งสองด้านของเลเยอร์การประมวลผลในกรณีที่สูญเสียประสิทธิภาพและความไม่เสถียรและยังคงแข่งขันกับผู้ให้บริการคลาวด์แบบรวมศูนย์ได้อย่างไร โครงการชั้นข้อมูลจะมีผู้ใช้จริงกี่คน? เราจะตรวจสอบความถูกต้องและความถูกต้องของข้อมูลที่ให้ไว้ได้อย่างไร? ลูกค้าประเภทใดที่ต้องการข้อมูลนี้จริง ๆ ตรรกะเดียวกันนี้ใช้กับเลเยอร์อื่น ๆ ในยุคนี้เราไม่ต้องการความต้องการหลอกที่ถูกต้องมากมาย
ดังที่ฉันได้กล่าวไว้ในส่วนแรก Meme ได้พัฒนาอย่างรวดเร็วเป็นรูปแบบ SocialFi ที่เข้ากันได้กับ Web3 Friend.tech เป็น DApp ที่ยิงนัดแรกในแอปพลิเคชันโซเชียลรอบนี้ แต่น่าเสียดายที่มันล้มเหลวเนื่องจากการออกแบบโทเค็นที่เร่งรีบ ในทางกลับกัน Pump.fun ได้แสดงให้เห็นถึงความเป็นไปได้ของรูปแบบแพลตฟอร์มที่บริสุทธิ์โดยไม่มีโทเค็นหรือกฎใด ๆ ความต้องการของผู้แสวงหาความสนใจและผู้ให้บริการมาบรรจบกันบนแพลตฟอร์มนี้ซึ่งคุณสามารถโพสต์มีมสตรีมสดโทเค็นมิ้นท์ความคิดเห็นการค้าและทุกอย่างฟรี Pump.fun เรียกเก็บค่าบริการเท่านั้น โมเดลนี้โดยพื้นฐานแล้วเหมือนกับเศรษฐกิจความสนใจของแพลตฟอร์มโซเชียลมีเดียในปัจจุบันเช่น YouTube และ Instagram แต่มีรูปแบบรายได้ที่แตกต่างกันและการเล่นเกมที่เน้น Web3 มากขึ้น
ในทางกลับกัน Clanker ของ Base เป็นเรื่องราวความสําเร็จขั้นสูงสุดโดยได้รับประโยชน์จากระบบนิเวศแบบบูรณาการที่ออกแบบโดยแพลตฟอร์มเอง Base มี DApp ทางสังคมของตัวเองเป็นเครื่องมือเสริมสร้างลูปภายในที่สมบูรณ์ Meme Agent เป็นรูปแบบ 2.0 ของ Meme Coin ผู้คนมักจะไล่ตามความแปลกใหม่และตอนนี้ Pump.fun เป็นศูนย์กลางของความสนใจ จากมุมมองของแนวโน้มมันเป็นเพียงเรื่องของเวลาก่อนที่ความคิดที่แปลกประหลาดของสิ่งมีชีวิตที่ใช้ซิลิกอนจะเข้ามาแทนที่มส์ที่หยาบกว่าของสิ่งมีชีวิตที่ใช้คาร์บอน
ฉันได้กล่าวถึงฐานนับครั้งไม่ถ้วนด้วยแง่มุมที่แตกต่างกันในแต่ละครั้ง แต่สิ่งหนึ่งที่ยังคงชัดเจน: ฐานไม่เคยเป็นผู้เสนอญัตติแรก แต่ก็เป็นผู้ชนะมาโดยตลอด
จากมุมมองทางปฏิบัติ AI ตัวแทนน่าจะไม่ไปสู่การกระจายของตนเองในอนาคตที่เป็นไปได้ได้ง่าย ในฟิลด์ AI ทางเดิม การสร้างตัวแทน AI ไม่ใช่ปัญหาที่สามารถแก้ไขได้อย่างง่ายดายผ่านกระบวนการกระจายหรือโอเพนซอร์ส ตัวแทน AI ต้องเชื่อมต่อกับ API ต่าง ๆ เพื่อเข้าถึงเนื้อหา Web2 และต้นทุนในการดำเนินงานของพวกเขาสูง การออกแบบของ Chain of Thought (CoT) และการทำงานร่วมกันของตัวแทนหลายตัว ยังต้องการการกลายเป็นอย่างมาก โดยที่มีการกลายเป็นในระยะยาวจนกว่าเราจะพบรูปแบบการผสานที่เหมาะสม อาจเป็นบางสิ่งที่คล้ายกับ UNI แต่ในขณะนี้ฉันยังคงเชื่อว่าตัวแทน AI จะมีผลกระทบที่สำคัญต่อธุรกิจของเราอย่างมากเช่นเดียวกับที่ CEX อยู่ในภาคของเรา ไม่ถูกต้อง แต่มีความสำคัญอย่างมาก
เมื่อเดือนที่แล้ว Stanford & Microsoft ได้เผยแพร่ AI Agent Review ที่อธิบายการใช้งานของตัวแทน AI ในอุตสาหกรรมต่างๆ เช่น การดูแลสุขภาพ เครื่องจักรอัจฉริยะ และโลกเสมือนจริง ในภาคผนวกของบทความนี้มีกรณีทดลองมากมายที่ GPT-4V ในฐานะตัวแทน AI มีส่วนร่วมในการพัฒนาเกม AAA ระดับบนสุด
เราไม่ควรรีบรวมตัวเอเอไอเอเจนต์กับการกระจายอำนาจ สิ่งที่ฉันหวังคือชิ้นส่วนประกอบแรกที่เอเอไอเอเจนต์ทำเสร็จคือความสามารถในการสร้างขึ้นจากด้านล่างและความเร็ว มีหลายเรื่องที่เป็นเรื่องร้ายและโลกเสมือนที่ว่างเปล่าที่ต้องการการเติมเต็ม และเมื่อเวลาเหมาะสมมาถึง เราสามารถพิจารณาว่าจะทำอย่างไรเพื่อที่จะทำให้เอเอไอเอเจนต์กลายเป็น UNI ต่อไป
YBB เป็นกองทุน web3 ที่มุ่งมั่นที่จะระบุโครงการที่กำหนด Web3 และมีวิสัยทัศน์ที่จะสร้างที่อยู่ออนไลน์ที่ดีกว่าสำหรับผู้พักอาศัยบนอินเทอร์เน็ตทั้งหมด ก่อตั้งโดยกลุ่มผู้เชื่อมั่นในเทคโนโลยีบล็อกเชนที่มีการมีส่วนร่วมอย่างเต็มที่ในอุตสาหกรรมนี้ตั้งแต่ปี 2013 YBB ยินดีเสมอที่จะช่วยเหลือโครงการระยะแรกให้เติบโตจาก 0 ไปสู่ 1 เราให้ความสำคัญกับนวัตกรรมความมุ่งมั่นที่เป็นเองและผลิตภัณฑ์ที่ให้บริการต่อผู้ใช้ในขณะที่รู้จักศักยภาพของคริปโตและแอปพลิเคชันบล็อกเชน