摘要:开源数据指在互联网等媒介可以公开获得的数据,包括搜索引擎、社交网络、论坛、博客和微博、各种专业与综合类网站等。开源数据目前已有大量的积累,如:新浪和腾讯两大微博每日产生的数据已超过TB级。这些不断累积,以几何量级激增的数据,反映了经济个体的偏好、行为和预期,及其在个体之间的传导演变和观点与行为模式的形成与演化。开源数据中所包含的关于经济行为的信息,与传统的经济统计数据相比有更直观的解释意义、更广泛的覆盖,而且其及时性更强。基于开源数据的宏观经济监测预警,以目前互联网上累计的数据为基础,突破传统基于经济统计数据或调查数据方法框架,实现更加准确和迅速的宏观经济趋势判断和拐点探测。目前我们基于经济新闻搜索引擎,设计了物价舆情指数、房地产景气舆情指数和物价舆情指数模型,在相应的预测预警实证中表现出较好的效果。