6月9日下午,应高维数据分析科研团队邀请,新加坡国立大学的林振华教授到访统计与数据科学学院作题为“Neural Wasserstein Two-Sample Tests”的报告。报告由安百国教授主持。
报告聚焦高维数据背景下,传统检验方法(如MMD、ED)功效下降的问题,提出了一种结合投影Wasserstein距离、神经网络与样本分割的新型检验框架。该方法通过将高维数据投影到低维子空间,利用ReLU神经网络从拟合样本中学习最优判别方向,并在测试集上构造标准化的检验统计量。理论上,该统计量渐近服从标准正态分布,无需置换检验即可校准。进一步引入l1/ l0稀疏投影,可提升对坐标稀疏差异的检测能力。模拟实验表明,在维度高达500时,新方法在均值、方差、非高斯分布及相依结构变化等备择假设下,检验功效普遍优于MMD、KFDA等现有方法,且随维度增加表现稳健。
师生还就投影维度的选择、稀疏投影的现实解释等问题进行了交流。