Gate 广场「创作者认证激励计划」优质创作者持续招募中!
立即加入,发布优质内容,参与活动即可瓜分月度 $10,000+ 创作奖励!
认证申请步骤:
1️⃣ 打开 App 首页底部【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】,提交申请等待审核
立即报名:https://www.gate.com/questionnaire/7159
豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000 丰厚奖励等你拿!
活动详情:https://www.gate.com/announcements/article/47889
EigenAI 在主网推出比特精确确定性 AI 推理
王荣财
2026年1月24日 00:07
EigenAI在GPU上实现了100%可复现的LLM输出,开销低于2%,实现了可验证的自主AI代理,用于交易和预测市场。
EigenCloud已在主网发布其EigenAI平台,声称解决了困扰自主AI系统的根本问题:你无法验证你无法复现的内容。
这里的技术成就意义重大。EigenAI在生产GPU上实现了位级精确的确定性推理——意味着相同的输入在10,000次测试中产生相同的输出——仅增加1.8%的延迟。对于构建处理真钱的AI代理的开发者来说,这非常重要。
为什么LLM的随机性会破坏金融应用
用相同的提示两次运行ChatGPT。答案不同。这不是bug——这是GPU上的浮点数学运算方式。内核调度、变量批处理和非结合性累加都引入微小的变化,最终导致不同的输出。
对于聊天机器人,没人注意。对于用你的资金执行的AI交易代理?对于决定$200 百万赌注胜负的预测市场预言机?不一致性变成了一个负担。
EigenCloud以Polymarket著名的“泽连斯基是否穿了西装?”市场为案例研究。在超过$200 百万的交易量中,出现了任意裁决的指控,最终不得不由人工治理介入。随着市场规模扩大,人工裁决无法跟上。一个AI裁判变得不可避免——但前提是这个裁判每次都能得出相同的裁决。
技术架构
在GPU上实现确定性需要控制每一层。A100和H100芯片由于架构差异在舍入方面产生不同结果。EigenAI的解决方案是:操作符和验证器必须使用相同的GPU SKU。他们的测试显示,在相同架构的运行中匹配率达100%,跨架构则为0%。
团队用自定义实现替代了标准的cuBLAS内核,采用warp同步规约和固定的线程排序。没有浮点原子操作。他们基于llama.cpp构建,因其代码体积小、可审计,禁用了动态图融合和其他引入变异的优化。
性能成本保持在标准cuBLAS吞吐量的95-98%。在不同H100节点上的跨主机测试产生了相同的SHA256哈希值。背景GPU负载引起的调度抖动压力测试?结果仍然完全一致。
通过经济学实现验证
EigenAI采用借鉴区块链rollup的乐观验证模型。操作员将加密结果发布到EigenDA,即项目的数据可用性层。结果默认接受,但在争议窗口期间可以提出质疑。
如果被质疑,验证者在可信执行环境中重新执行。由于执行是确定性的,验证变成二元:字节是否匹配?不匹配会触发抵押金的惩罚。操作员会亏钱;挑战者和验证者获得报酬。
这种经济设计旨在使作弊在挑战概率超过某个阈值时具有负期望值。
现在可以构建的内容
直接的应用包括:可复查和审计的预测市场裁决者、每个决策都可记录和挑战的交易代理,以及可以通过重新执行而非信任进行同行评审的研究工具。
更广泛的趋势是,企业对符合合规要求的确定性AI的兴趣日益增长。医疗、金融和法律等行业越来越需要概率系统无法保证的可复现性。
EigenAI的2%开销是否适用于高频应用,尚待观察。但对于管理大量资本的自主代理来说,证明执行完整性的能力可能值得付出性能上的代价。
完整白皮书详细介绍了正式的安全分析、内核设计规范和惩罚机制,供构建者参考。
图片来源:Shutterstock