统计学

数理统计与统计计算 –理论统计

理论统计学是统计学的数学基础,它从数学特别是概率论的角度去研究统计学,为各种统计方法提供理论支持。理论统计学研究怎样有效地收集、整理和分析带有随机性的数据,对所研究的问题做出科学推断或预测,为决策和行动提供可靠的依据和建议。统计方法在自然科学、工程技术和社会经济等领域中有广泛的应用,特别是在当今大数据科学和人工智能技术迅猛发展之际,统计方法扮演着重要而独特的角色,是科学研究和工程实际的必备工具。因此,深入而系统地研究现代统计学的方法和理论, 不仅有重要的理论意义,而且有很高的应用价值。 该研究团队在经验似然方法与理论、不完全数据的统计方法与理论、高维复杂数据的降维方法与理论,以及将这些方法应用于实际问题分析等方面取得了系统而丰硕的研究成果,得到了国内外同行专家的高度认可和好评。

数理统计与统计计算 –统计计算

  统计计算方法是数据科学中的重要研究方法,它以数理统计、计算数学和计算机科学为基础,主要研究数据的生成、处理以及分析,在金融、生物、工程、经济等领域都有十分广泛的应用。近些年,随着计算机技术的快速发展以及统计方法的不断丰富,统计计算也得到了广泛的重视,产生了众多实用的统计计算方法,如随机数的生成、EM算法、Bootstrap方法、MCMC方法等等。这些方法,在各个领域中的数值模拟试验以及数据预处理等方面有着重要的应用,如利用随机数生成算法产生特定分布的随机数、利用EM算法处理缺损数据,截尾数据等所谓的不完全数据、利用Bootstrap方法对数据再抽样来研究一组数据的某统计量的分布特征等等。因此,统计计算在数据科学方面有着重要的理论意义以及应用价值。不断地有研究团队在该方向进行方法创新和拓展,产生了丰富的研究成果,深受各领域专家学者的重视。

生物医学统计 –计算生物学

计算生物学是利用算法、统计来解决分子生物学和基因组学中的基本测量问题、计算问题和统计推断问题的一门交叉研究学科。20世纪中期,随着蛋白质空间结构的解析和DNA双螺旋结构的发现,形成了以遗传信息载体核酸和生命功能执行者蛋白质为主要研究对象的分子生物学。而21世纪初人类基因组计划的完成,标志着生命科学研究进入了一个崭新的后基因组时代,其特征和标志包括:高通量生物技术的成熟应用、大型生物数据库的建立、从单个的组学(如基因组学、蛋白质组学等)到系统生物学的研究方法等。在分子生物学、生物信息学和系统生物学等研究领域迄今已取得的诸多成果都显示了统计学在生命科学研究中扮演着日益重要的角色。统计学在此领域的交叉研究,前景有两方面。一方面,统计学的现有方法和模型如统计推断,高维数据降维,试验设计,隐式马氏链,随机游动模型,统计学习被广泛地应用于分子生物学和基因组学。另一方面,新的分子测量技术和组学数据分析也对统计学的发展提供了新的空间。

我们的团队在DNA测序中的碱基辨识,RNA数据建模,系统生物学,酵母长寿机制、二型糖尿病发病机制、细胞演化路径推断与重构等都做出了有国际影响的科学基础工作。同时,也提出了盲-反问题,参数反卷积,调控推断,双重特征分析、结构型数据的统计检验、拓扑数据分析等新的统计问题和方法。

生物医学统计 –生物统计

  随着社会经济和科学技术的发展,现代生物、医学、遗传学等研究领域已经积累并仍在不断产生海量的数据,这些数据不仅数量庞大,而且十分复杂。具体表现为:变量维数高,如各种组学数据;结构复杂,如高度的非线性性和层结构;不完全,如临床试验中的缺失数据和删失数据等。对于生命科学、生物、医学、遗传学等领域出现的各种复杂数据,进行建型分析,并针对不同的模型研究有效的统计分析、推断方法及其理论具有重要的理论意义和很高的应用价值。该研究团队在关联分析,尤其是全基因组关联分析中的单位点检验、生物通路分析、稳健检验、多性状检验等统计量的构造和统计理论分布的建立;基于各种类型的生存数据(包括右删失、左截断、区间删失、误差数据、缺失数据)、纵向数据和复发事件数据,发展了一系列有特色的半参数、非参数建模分析和统计推断,以及这些理论和方法在其它相关领域的拓展和应用,取得了系统丰富的有创新性的研究成果。得到了国内外同行专家的认可和好评,研究成果处于国际先进水平。

工业与应用统计 -工业与应用统计

工业与应用统计是统计学中由实际问题驱动、依托数据与试验的一个重要研究方向,传统意义上主要包括过程控制、可靠性、实验设计及抽样检验四个方面,与质量与数据科学有着紧密的联系。近些年工业应用中产生的大数据为这一研究方向提供了机遇与挑战。该研究团队面向我国国防与航空航天工业的重大质量需求开展理论与应用相结合的研究,形成了具有自身研究特色的工业应用统计研究团队,尤其在不完全数据分析、系统可靠性统计、一致性量化控制、计算机实验的空间填充设计、不确定性量化、校准及优化等方向取得了一系列的理论和应用成果,在国际上产生了一定影响。