当前位置: 首页 首页栏目 列表信息

J-Seminar第一期|王成军副教授:当大数据遇上质性数据

发布于:2021-01-22 文章阅读数: 字体大小:【

       2020年10月21日中午,南京大学新闻传播学院新闻创新学术沙龙第1期在紫金楼429举行。本次学术沙龙的主讲嘉宾为南京大学新闻传播学院王成军副教授,讲座主题为"当大数据遇上质性数据"。众多师生聆听了此次分享,进行交流对话,本次活动由2020级博士生刘天宇主持。



     《科学在行动》一书指出,科学研究生产的逻辑之一是人类的知识是全局性的。但是由于局部个体的在地化,为了理解全局化的知识,人们需要构建计算中心,今天的互联网就是这样一个计算中心。王老师对科学研究演变的四个范式进行了总结,在经历原始社会的"实验科学范式"、以模型和归纳为特征的"理论科学范式"、以模仿仿真为特征的"计算科学范式"之后,目前科学研究正在转向第四范式——"数据密集型的科学发现范式"。数字时代的今天,大数据成为传统研究方法的补充,可以进一步增加人们提问和分析的价值。

       科学研究的核心的任务,就是通过有限的证据推出一般化结论。从定量角度来看,社会作为一个复杂的系统,其中影响人类行为的参数是无法穷尽的。王老师指出,为了理解复杂的社会问题,我们需要成为想法创造者(idea makers)。然而想法(idea)是没办法通过数据挖掘的形式自动获取的,此时质化研究就成为了更有效率的方式。通过田野和案例分析,我们可以更好地找到想法(idea),进一步探索相应方向的数据。很多有经验的大数据研究者往往会在无意识当中、自觉地进行案例分析。因而我们需要保持社会事实的直觉式理解,将定性研究逻辑贯穿整个研究过程。



       随后,王老师对科学研究方法进行了阐释。他指出,通过观察法会获得观察类的数据或者是痕迹的数据,目前很多大数据研究得到的就是这类行为数据。然而这种行为数据存在一定问题——缺乏构念效度(construct validity)。比如行为数据都是一些行为描述,无法很好的上升到概念;行为数据往往是互联网公司的副产品,缺乏内在变量设计等等。因为除了对现实观察之外,我们还需要通过语言进行交流提问,包含访谈、焦点小组、入户调查,电话调查等很多形式。在质性研究中,实验这种方式往往不被重视,王老师认为这一点是致命的。他认为,我们对于数据的相信,有可能是自我欺骗,因为没有随机控制实验的因果推断的逻辑贯穿其中。即使不做实验,我们还应该具有实验思维,减少单一维度的思考,在头脑里面多思考变量之间的交叉。

       计算方法可以从数据中得到一些关于人类行为的信号。王老师认为,对信号的诠释和理解更为重要,而这在定量研究中还没有被充分重视。比如研究两个概念之间关系,学者往往研究变量之间的强弱关系以及直接或间接作用。在因果推断研究中,对于信号背后的理解依然存在着更开放的可能性,尤其体现在计算过程中,在数据量变大、更多的异质性信号呈现之后。当信号很多,我们却缺乏对这种信号本身的理解时,这就构成了大的问题,此时质性方法就可以更好地诠释人类行为,比如文本分析中的主题模型、语义网络分析方式等等。

       在讲座最后,王老师就传统的研究方式和大数据研究如何结合、大数据如何帮助定性研究者们更好做研究等问题与师生共同交流。