主讲人:张梦筱(奥克兰大学)
时间:2025年6月11日11:00 地点:数学院南楼N219
【报告摘要】随着数据在人工智能时代的核心地位日益凸显,数据市场作为连接数据所有者、数据中介与数据消费者的交易平台应运而生。早期的数据市场以查询结果或数据集为交易对象,但在实践中面临多重挑战:(1)如何在交易过程中有效保护数据隐私;(2)如何缓解数据所有者与数据消费者之间关于数据估值的信息不对称;(3)如何在预算受限的条件下获取高质量的查询结果。针对上述问题,我们提出了Single-Minded Query(SMQ)机制,通过逆向拍卖的方式筛选数据所有者,确保机制满足激励相容性、个体理性与预算可行性,并在一系列常见查询任务中实现了较高的准确性。随着市场的演化,交易对象逐步从原始数据扩展至以数据训练而成的模型,催生了模型市场。在模型市场中,机制设计面临新的挑战:(1)如何缓解数据所有者与模型消费者之间关于数据价值的信息不对称;(2)如何在不泄露原始数据的前提下评估其对模型性能的边际贡献;(3)如何在有限预算内选择性地采集数据,以训练出性能最优的模型。为应对这些挑战,我们提出了基于结构重要性的模型交易机制(SIMT),该机制在理论上保障激励相容性、个体理性与预算可行性。