论文 BlockKD3A:A Web3-Native Framework for Decentralized Collaborative AI and User-Generated Model Assets 被 ACM Transactions on Multimedia Computing, Communications, and Applications(CCF-B)接收,恭喜子昂!
论文主题内容介绍
随着 Web3 与生成式 AI 的融合,用户生成的模型资产(微调模型、LoRA 适配器、数据集、训练流水线等)越来越多地由开放社区协作产出。要让这些资产可流通、可交易,必须做到来源可验证、贡献可归属、跨组织协调可靠,同时数据不集中化。然而即便是算法稳健的方法(如 KD3A),在真实去中心化部署中仍普遍缺乏可审计的协调、故障韧性与可复现的产物谱系——节点频繁上下线、存在对抗行为、系统异构,使训练脆弱、结果难以审计、成本不透明。
为此,论文提出 BlockKD3A——一个链上/链下混合框架,把多源域适应算法 KD3A 工程化落地,核心思路是计算分层:把轻量、可审计的协调任务(参与登记、状态推进、贡献记录)放到链上,重计算(本地训练、知识投票、共识焦点估计、聚合)留在链下,模型产物以内容标识符(CID)锚定到 IPFS 并上链。框架提供三项系统保证:
- 可审计协调:智能合约记录训练状态、模型 CID 与基于 Consensus Focus(CF,共识焦点) 的贡献归属,使权重分配可被核验,且无需链上重计算。
- 可靠性:事务安全客户端 + 故障感知编排器,引入非负 CF 裁剪与 zero-CF 回退,支持部分参与、不因掉队节点而阻塞。
- 可复现性:内容寻址打包 + 统一遥测,将机器学习指标与区块链事件耦合记录,实现可预测的成本审计。
图 1. BlockKD3A 系统架构
实验结果
论文在 Office-Caltech10 与 DigitFive 两个多源域适应基准上,每个目标域运行 40 个 epoch,完成多次端到端部署。结果显示:
- 接近中心化的精度:Office-Caltech10 宏平均准确率 96.74%、DigitFive 89.40%,全面超越 FedAvg、FedProx、FedBN、SCAFFOLD 等联邦学习基线,并逼近中心化 KD3A 上界。
- 协调高效、成本可预测:多次部署的每笔 gas 都有界(125,972–298,405),全部实验总成本约 0.0054 ETH,成本随链上状态转移次数近似线性增长。
- 抗攻击鲁棒:在标签投毒与 Sybil 协同投毒下,CF 归属机制将攻击者权重压制为 0,目标模型仍稳定收敛(准确率保持 0.98 以上)。
图 2. Office-Caltech10 逐 epoch 准确率
BlockKD3A 弥合了去中心化 AI 算法与可靠系统部署之间的鸿沟,证明在保持可验证来源与稳定运行的同时,去中心化协作训练可达到接近中心化的精度,为可验证的用户生成模型资产提供了算法质量、可审计性与可持续经济性兼得的路径。
周子昂个人介绍
- 研究方向:去中心化协作学习、Web3 与可验证 AI 资产。