一、主要内容

一、主要内容

中心通过准大数据(指数据条目在百万以上,变量在千级以上,依靠专业软件工具能够进行运算和计算的数据集合)平台的建设,为学生提供最直观的大数据感受,让学生对真实、前沿的数据类型有所认识,提高学生的统计技能,同时增强现有心理学实验室的配置,以此为契机帮助学生顺利步入心理学科研道路。

为了满足预期所建设的数据库对其自身内容的成熟性、功能的全面性、地位的权威性的要求,我们在收集各类开源数据时,通过查阅国内外顶级期刊所使用的数据来源,并结合国内同行的提议,获取了18个社会科学研究常用开源数据,其中10个以中国社会为调研对象,6个来自美国、英国等其他国家,同时包括2个跨国调研数据。这18个来自不同国家和地区的开源数据以针对中国社会的调查为主,覆盖多个国际主流科研大国,其最早的数据可追溯至1873年,涉及的内容范围十分广泛,能够满足现代社会科学研究的各类基本数据需求。如CGSS中国综合社会调查、CSS中国社会状况综合调查、CFPS中国家庭动态跟踪调查、CHARLS中国健康与养老追踪调查、GSS美国综合社会调查、PSID美国家庭经济动态调查、World Value Survey世界价值观调查等。对这些开源数据进行收集、梳理、分析、汇总,并在后期通过数据库管理专业软件,如MySQL、SPSS Modeler等对上述各开源数据进行管理。

平台建设具体技术路线如图57-1所示。

图57-1 社会科学大数据库平台建设技术路线图