人工智能研究机构OpenAI与加密投资及研究公司Paradigm近日共同推出了名为EVMbench的基准测试。该基准的核心目标是系统性地评估各类人工智能模型在处理以太坊虚拟机智能合约漏洞方面的能力。
EVMbench为AI智能体在区块链安全领域的表现提供了一个标准化的评估框架。通过该基准,研究人员可以量化比较不同模型在识别、理解乃至处理智能合约中潜在安全漏洞的准确性与效率。
这一工具的发布,标志着AI在代码安全与区块链技术交叉领域的研究进入了更注重量化评估的新阶段。它为开发更可靠、更擅长理解复杂代码逻辑的AI助手提供了重要的参考依据,有望推动AI在智能合约审计与安全增强方面的实际应用。


