2025年6月12日下午,由生物医学统计团队组织的Workshop活动在慎思楼222举办。本次活动邀请了四位在生物医学统计领域有着丰富研究经验和深厚学术造诣的专家学者,分别就随机试验中的统计推断、统计遗传学中的统计建模与计算问题进行了深入报告和讨论。本次活动吸引了众多师生的积极参与,现场气氛热烈,互动频繁。
中国科学院数学与系统科学研究院副研究员张维聚焦于随机试验存在多个响应的问题处理。她首先介绍当随机试验中存在多个响应时,如何对其进行复合来度量综合效应并给出相应解释十分关键。现有一种常见的策略是将复合响应定义为原始响应的加权平均,然而权重的选择往往依赖于主观,可能会引起争议。接着,她提出了一种用于分析具有多个响应的随机实验的逆回归策略,其核心思想是将治疗方式变量对响应做回归,并在完全随机化试验和分层随机化试验下分别进行分析。尽管这种策略简单,但它具有多个优点:检验响应的系数为0等同于检验治疗效应为0,即使逆回归被认为存在误设定;响应的系数为定义复合治疗效应的权重提供了选择;这种策略适用于各种类型的试验,并且在分析中可灵活地包含其他协变量。最后,她给出了家庭行为干预的I型糖尿病试验的实例分析说明该策略的实用性和有效性。
清华大学统计与数据科学系长聘副教授侯琳聚焦于跨种族遗传效应迁移与遗传风险预测问题。她首先介绍了统计遗传与基因组学中的科学问题,通过疾病基因推断、遗传风险预测、组学技术计算工具定量解析遗传因素对复杂疾病的作用机制。接着,她引入复杂性状的遗传相关性分析,说明该问题的难点在于高维度、复杂相关性、个体数据难获取。她介绍LOGODetect,一种强大高效的统计方法,通过扫描统计方法自动识别与多种表型一致关联的遗传区域,对不同研究间的样本重叠具有稳健性。最后,扩展LOGODetect以研究跨种群的遗传相关性分析,提出X-Wing方法应用于跨种群的多基因风险预测,取得了良好的效果。
北京理工大学数学与统计学院助理教授王晋娟讨论了变量独立性的非参数检验问题。她首先介绍了检验两组变量之间独立性的应用背景,虽然现有方法种类繁多,但对于一种能够在多种备择假设下实现高效率,并在不同场景中表现出稳健性的非参数检验仍存在很高需求。接着,她基于最小生成树提出了一种基于图的独立性检验框架,该框架将加权图和无权图引入独立性检验领域。具体程序包括两个步骤:每组变量依据距离矩阵构建最小生成树图;将图向量化并计算统计量。她还研究了统计量的渐近理论,并进行了大量数值模拟对比新方法与现有方法的表现,结果表明所提出的方法较为稳健,能够有效控制第一类错误率,并具有较高的检验功效。最后将新方法应用于两个真实数据集,展示了所提出框架的高效性。
北京信息科技大学理学院统计系李娜老师讨论了随机试验中比较多组治疗效果的协变量平衡问题。首先介绍临床试验中多组治疗效果的差异性推断通常需要假设样本具有代表性,受试者被随机分配到每个治疗组,并且组间分配差异极小。为了处理分配差异,前人提出了多种随机化方法,如完全随机化、再随机化、成对序贯随机化以及k-分序贯随机化(k-RSR)。她将其进行拓展,提出了多重k-分序贯随机化(Mk-RSR)用于处理多组分配差异。接着,她融合了序贯分组、分配权重差异化、综合马氏距离等思路,给出了Mk-RSR分析的步骤。理论结果表明新方法比现有方法更能达到最优值。最后,她还介绍了广泛的数值模拟和一个实例分析说明Mk-RSR的优越性,并给出一些拓展的思考。
通过四位专家的精彩报告,与会师生对生物医学统计的最新研究动态和技术方法有了更深入的了解。本次Workshop活动不仅为与会师生提供了一个学习和交流的平台,还促进了生物统计领域的学术交流与合作。