定量符号数据主成分分析方法及其应用研究

主讲人:陈梅玲(博士后)
时间:2015年10月15日上午12:00   地点:N210

【摘要】信息时代使全社会的数据量呈现爆炸性增长趋势,如何高效处理大规模数据并挖掘其蕴含的系统知识,成为当前人类面临的重大挑战。符号数据分析为处理和分析大规模数据提供了一种全新而有效的思想,在工程技术、经济管理、社会调查等领域都有很广泛的应用前景。虽然现有的符号数据分析领域已经存在大量关于主成分分析的研究工作,但是其理论研究仍存在许多不足,集中表现为以下两个方面:其一,现有方法对于不同类型的定量符号数据都是分开讨论,并且均要求数据表中每个单元的分布形式一致,并且;其二,定量符号数据的线性组合一直缺乏一种精确且统一的计算方法。鉴于此,本探讨了定量符号数据(区间数据、直方图数据、连续分布数据)之间的联系,并提出了统一的定量符号数据主成分分析方法。该方法与经典主成分分析方法,以及现有的区间数据、直方图数据、正态分布数据等符号数据的主成分分析方法具有很好的相容性。进一步采用仿真分析和案例研究来说明所提方法的准确性和有效性。