计算社会科学时代需要什么教育学 ——兼与《计算教育学:内涵与进路》作者商榷
发布人:科研处  发布时间:2021-04-12   浏览次数:85

摘要:随着以大数据、人工智能为代表的信息技术的发展,计算教育学作为一个新兴的交叉研究领域受到国内外学者的关注。计算教育学研究教育的基本方式是数据分析与计算,但教育学是否与计算社会学一样同属于“可计算社会科学”值得认真讨论。大数据的化约、数据化处理方式与教育的整体性特质并不完全相容,教育活动或人的行为的数学化操作不具有自然科学的数学化操作那样的有效性和可行性。教育的特殊性以及教育主体的独特性决定了应用数据密集型计算方法所能发现的“新知识”不同于自然科学领域。对教育主体及教育系统各要素之间的互动过程,只能进行有限的、局部的、特定视角下的量化与计算。关于教育知识、教育规律的寻求和表达本质上是原理机制的研究和理论阐释,而不是数据分析。就该问题进行商榷并不表示笔者反对计算教育学作为一个新兴领域、新兴学科的出现,而是主张在学科交叉的样态下保持计算教育学清晰的研究边界和学科归属。从计算教育学赖以诞生的学科渊源来看,其学科归属更应该是计算科学和信息科学。

关键词:计算教育学;数据密集型科学研究范式;教育大数据;计算社会科学

作者简介:谭维智,曲阜师范大学中国教育大数据研究院常务副院长、教育学院教授(山东曲阜273165)

  当前,随着以大数据、人工智能为代表的信息技术的发展,数据与计算分析等逐渐成为描述自然现象和社会现象的主流方式,并即将进入一个“ 计算社会科学时代”[1]。在“万物皆数”、计算一切的潮流中,计算教育学作为一个新兴的交叉研究领域受到国内外学者的关注。目前,已有多项探讨“计算教育学”的内涵、立场、范式、体系、发展路径的研究成果发表。[2]这些成果中不乏一些具有前瞻性和启示意义的思想闪现。以《计算教育学:内涵与进路》(以下简称《计算教育学》)一文为例,作者提出了包括计算教育伦理、教育主体计算、教育情境计算、教育服务计算等相关内容的计算教育学的知识体系,以及计算教育学在教育评价、教育服务、教育治理、教育决策等方面的应用前景,这些都是饱含着智慧的、富有启发性的新观念、新思想。本文在探寻这些新范式、新理论、新技术的基础上,主要围绕教育活动、教育主体是否可以量化、是否可以进行数学化计算等问题进行哲学上的追问,并就计算教育学研究对象的设定、研究范式的选择、研究结论的表达以及学科属性等问题进行商榷,以期推进对这一研究的深入展开。

一、计算教育活动与教育问题何以可能

  《计算教育学》提出:“计算教育学是通过技术赋能,基于数据密集型的研究范式,解释信息时代的教育活动与问题,揭示教育复杂系统内在机制与运行规律的新兴交叉学科。”[3]数据密集型研究范式(或曰大数据范式)由美国计算机科学家格雷(Gray,J.)首先提出。格雷将其称为实验科学、理论科学和计算科学范式之后的第四范式,“新的研究模式是通过仪器收集数据或通过模拟方法产生数据,然后用软件进行处理,再将形成的信息和知识存储于计算机中”[4]。数据密集型研究范式“主要利用计算机、数据管理和统计分析工具对大数据进行分析,发现复杂现象背后隐含的模式,并从中获取知识”[5]。数据密集型研究范式的本质是数据驱动,其研究对象、研究结果都是“数据”,“这意味着数据已经成为整个科学研究的核心环节,‘数据—驱动’已经成为科学的主流形式,在科学模型中数据也将成为核心甚至唯一要素”[6]。数据密集型科学研究范式所计算与分析的对象是数据,是关于事物与现象的数据,而不是事物与现象本身。《计算教育学》一文认为计算教育学的主要研究对象为“信息时代的教育活动与问题”[7]。在这里我们看到了数据密集型科学范式与《计算教育学》一文对计算教育学研究对象的设置所存在的差异。也因此,计算教育学运用数据密集型科学研究范式进行教育研究,就必须进行研究对象的转换,将教育活动、教育问题转换为与数据密集型科学范式相匹配的数据。研究对象的精准设置是一切科学研究的起点。对此,我们有必要对计算教育学的研究对象的设定进行哲学上的追问:教育活动与教育问题能否被表征为抽象的数据?数据作为一种符号是否能够完全替代它所表征的本体成为研究对象?或者说,《计算教育学》一文对计算教育学研究对象的设置是否是适宜的?进一步地,应用数据密集型科学研究范式对教育活动、教育问题进行量化、计算的数学化操作是否是适宜的教育学研究范式?这是以教育活动和教育问题为研究对象的计算教育学所必须面对的问题。

  数据是数据密集型科学研究范式的基本质料,计算教育学是通过数据认知教育的,但是,“数据”并不是教育活动本身具备的本质特性,教育活动的数据特性完全是人为赋予的。数据可以代表自然科学领域的事实或现象,比如一公里、一小时、一米都是恒定的事实,但是在教育领域,我们很难用数据来表征人的心理现象和思维状态等内在世界。进行大数据抓取、挖掘、采集的计算机软件以及大数据的记录、清洗、分析方式都是人设计的。其中,不可避免地包含着设计人员的价值取向和对教育的种种认知。“数据”实际上是由人来赋值的,依此产生的数据并不真正具有可通约性。事物本身并无可客观测量的本有特质,“是测量工具与程序决定了测量对象的性质,而非测量本身客观自存着”[8]。教育大数据很大程度上只是各种传感器、智能设备捕捉到的教育活动的外部行为数据,它所表征的教育活动的特征主要是视觉感官经验可认证的属性。外显的行为数据天然地排斥人的内在特质,数据并非是最好的反映人的内在态度、意识的方式,“不论人们如何细心而谨慎地使用,实际具体表现的行为模式与特质之间必然有着落差”[9]。我们仅仅通过外显行为并不能有效获得人内在思维、思想意识、价值观的真相,数据并不能很好地定义教育中的人和教育现象。不同教育现象背后所反映的问题是不同的,看起来等值的数据并不真正等值。同样的教育现象在不同时候、不同背景下出现具有不同的意义和内涵,“单凭量化、测量,尤其是数学化的‘实证’作为,是不足以让我们有挖掘到深层意义的可能的,因为这涉及的是隐藏在行为与社会现象背后的意义性问题,绝非强调表象之量化研究策略所能触及”[10]。大数据在教育领域具有不同于金融、交通、商业等领域的特殊性,教育大数据还不具备皮特什(Pietsch,W.)等人所提出的“包含现象所有内容”[11]、“详尽无遗”[12]的本质特征。“不管测量多么精细或者考虑得多么周到,它本身所能触及的总是片面的、部分的。”[13]因此,教育大数据并不能完全等于它所表征的教育本体,教育大数据不能完全替代教育活动、教育问题成为教育学的研究对象,我们不能直接地将作为数据密集型计算分析对象的数据替换成教育活动和教育问题。简言之,计算教育学的研究对象是也只能是教育大数据,而非教育活动和教育问题。

  计算教育学研究教育的基本方式是数据分析与计算,教育学是否与计算社会学一样属于“可计算社会科学”是值得认真讨论的。传统的数据科学是用机械还原的方式将整体世界还原成小的单元再进行数据化测量,数据密集型科学研究是直接通过对数据的统计分析将整体世界拆分成一个个小的类型。就整体性的拆解而言,数据密集型计算的方法和传统数据科学的方式没有本质的差异。其区别仅仅在于传统数据科学还原的方式是基于单子论的,其拆分的最小单元仍然被认为具有整体的特征,或者整体的特征等于小单元的特征之和,小的单元的特性可以反映整体的特性;而数据密集型科学采用的统计分析方法是对组成整体的不同个体按照特征进行分类,通过对整体进行分解、拆零获取对整体的认知,本质上它“只不过是一种较为精致的分类功夫,或者说,基本上是一种理论或概念的方法而已”[14]。大数据的聚类、分类表面上是由计算机进行的科学化操作,但是如何进行分类、分类标准的说明则完全取决于研究者的主观经验。比如,我们按照关键词进行某个教育现象的聚类、分类,在决定使用哪些关键词的时候,选项是无穷的,最终决定选哪些完全是研究者的主观意志的反映,是一种人为的设定。用大数据的方法进行聚类、分类之后的不同类别并不必然具有整体的特性,个体类别的属性并不能完全反映整体的属性。任何计算都包含某种程度的化约和抽象,要对教育活动、教育问题进行数据化转换,这种转换需要进行化约、归一和去情境化,也就是将千差万别的教育现象进行分类,将具有个别性的、异质特征的现象“一”归结为同质的“一”。[15]这种化约、归一和去情境化处理,抹平了不同现象之间的差异,某些现象和性质必然被从所描述的数据中剔除。大数据的方法必然“包含某种程度的抽象化,即某些事物必然从数目的描述中被剔除”[16]。无论我们如何对各种分类进行拼接和加总,在类型之间总是会存在裂隙和盲区,这就导致我们很难通过对种种类型的属性的测量施以加总的方法来获得对整体的认知。

  教育是整体性的,具有不可分解、不可拆分的特质。首先,教育的对象是包含智力、情感、艺术、灵性、创造性、理性、非理性诸方面具有整全性、全面性的人。虽然教学内容可以分成不同的学科、不同的学习单元和知识点,但是进入任何一个学科领域的学习者都带着他所接受的全部教育。学习者以个人的全部身心进入一个独立的学科领域或某个被强拆出来的知识环节,而且这些学科知识也终将被融入他作为独立个体的不可再分的“整体”。人的成长不能不因某个年龄段而区分不同的培养任务或目标要求或成长路线,但是,居于任何一个学习阶段的人都是一个整全的人,即使一个人中途辍学、没有接受完整的由学校教育制度规划的教育过程,他仍然是一个整全的人,而不像在流水线上没有加工完成的“半成品”一样缺少些什么,即使缺少了些什么,也不是因为没有接受完完整的教育过程而导致的。流水线上的加工物只要有一个工序没有完成,也不会是一件“被完成”的产品。教育的过程和流程或环节并不像流水线那样每一道工序都不可或缺。同时,教育的过程不像流水线那样,可以分开生产不同的组件,并在最终一道工序中组装完成。教育中的每一道“工序”都可以是最终完成的工序,都不会产出半成品。学习者虽然可以按照德智体美劳这样的教育内容接受不同形式的教育,但是这些不同形式的教育完全不同于工业流水线上的加工流程。教育的内容也不是一个个的可以组成一个完整个体的独立的零件,貌似细分之后的教育内容也不是一道一道独立的工序,划分出来的不同学科、不同教育内容也不同于流水线上的组装程序,每个被细分之后的教育内容对于教育对象而言,都是一种整体推进,而不是仅仅加固了某一个方面或某一种品性,它们直接就是人的整体。简言之,教育活动不像工业生产那样可以细分为详细的工序或流程,而是一种整体性的活动。教育对象不像工业产品那样可以细分为更具体的零部件,而是一种整体性的存在。其次,教育问题是具有整全性的问题。每一个教育问题都涉及诸多变量,而且这些变量之间又互相联系、互生互动,如同阴阳一样共生共存。教育中的问题很难像物理或数学问题那样通过问题分割逐一予以解决。教育问题分割成若干小问题之后,会导致问题性质的变化,小问题本身仍然是具有整全性的问题,甚至是完全不同于大问题的新问题,同时又会因为对问题的分割生成其他新的问题。教育小问题的解决并不等于大问题的解决,不能通过对问题的分割进行化整为零的处理,教育中的问题必须整体性地解决。再次,教育对象和教育问题的整全性决定了教育活动的整全性。现代教育制度对教育过程进行了一定的划分,但并非工业流水线那样的工序化过程。教育活动不像工业流水线那样一道工序只针对一个具体的部件或程序,每个人只执行一小部分操作。教育过程中不同的教育活动面对的是教育对象的全部要素,教师在教育过程中要处理的几乎是所有的教育问题。现代学校的班级授课制虽然将学生分为不同年级、不同学科由不同的教师分阶段开展教育工作,但是就教育本身而言,教师在教育过程中需要掌握的是具有共性的整体性教育技术,而不是工业流水线上所需要的可以分割为一个部分、一个程序的规范性技术。从根本上说,教育就是一个过程,是一个不可拆分的、具有整体性的过程,教育过程中要面对的是教育的整体或整体的教育,而不是某一个部分或某一个环节。

  教育的整体性与数据密集型计算之间存在着研究范式通约的困难。科学哲学家波普尔(Popper,K.)认为,“整体不能成为科学研究的对象,也不能成为其他活动例如控制或改造的对象”[17],“如果我们要研究一个事物。我们就不得不选择它的某些方面”[18]。计算教育学依然面临着观察和描述教育整体的困难。大数据的全样本、总体、全过程、全数据、全景式描述之“全”都是相对性的、局域性的、有条件的,大数据之“全”并不等于教育整体之“全”,大数据并非是对教育整体的描述或教育整体的数据,被纳入大数据分析框架的“总体”只是某个维度、某个角度、某个方位、某个点的总体而非教育的整体。比如,学习者通过大规模在线开放课程(Massive Open Online Course,以下简称MOOC)进行线上学习,所有的学习行为都可以转化为数据,这个总体只是在MOOC 上发生的线上学习行为总体,并不是所有的线上学习者的总体,更不是包括线下学习者在内的全部学习者的学习行为的总体,所谓的总体是一定范围的总体。“大数据技术的空前发展并不意味着我们能够掌握所有的经验数据,随着信息数据的扩张我们也要接触到更多未知的领域和空间,科学技术的触角难以控制人类生活的所有层面,数据采集达到‘全样本’的预见可能是过于乐观了。”[19]局域性的大数据导致我们只能以类似于拆分的方式,对教育活动的一部分特征或属性进行测量与计算。大数据只能触及教育活动的一部分、一个层面或有限的几个层面。我们无法计算的全部属性,也很难通过“零存整取”的方式获取全部教育真相。即使我们了解了某几个维度上的教育属性的分布,对于预测整体性的教育行为基本上没有什么帮助,“分析、分离是可行的,合成、合并则困难得多,而且可能是不可能的”[20]。就教育而言,我们很难通过部分获取对整体的认知,同时我们也很难穷尽所有的“部分”,总是有一些“部分”因为无法测量、无法用概念描述而被忽略。算法会突出那些可计算的数据的重要性,会让我们只关注那些可以进行计算的现象,而忽略掉那些原本也很重要但无法测量、无法计算的现象,这就会因为被关注的现象缺乏代表性而导致以偏概全。局限于大数据的方法对教育的计算,就有可能只计算了我们收集到的数据而不是计算我们该去计算的数据,导致可测量、可数据化的发生在线上的教育被计算,而更重要的线下教育教学却因没有被大数据记录而被忽视。大数据将教育活动化约为数的同时也化约掉了活动背后的意义。大数据的方法无法处理教育的意义问题,它肢解了“教育”的内涵,我们在关注“是什么”的时候,却忽视了“为什么”。因此,大数据的化约、数据化处理方式与教育的整体性特质并不完全相容。从研究对象以及研究方法来看,基于数据密集型计算的研究范式应用于教育学研究还存在很大的局限性,数据密集型科学范式还不足以支撑教育学科的研究。

二、教育主体是否可以被量化与计算

  《计算教育学》提出,计算教育学的核心任务是教育各要素及其互动过程的量化与计算,“计算教育学以信息时代的教育活动与问题为主要研究对象,通过量化教育各要素及要素间的互动过程,开展多学科交叉”[21],“重点解决新时代人才培养过程中计算教育伦理、教育情境计算、教育主体计算以及教育服务计算等核心任务”[22]。量化与计算的对象涉及教育各要素、特别是作为教育主体的人(学习者和教育者),“教育主体计算以个体行为的多元属性和群体行为的涌现为核心,实现对学习者外显行为和内隐状态精准化的表示与计算”[23]。在这些核心任务中,计算教育主体与对“教育各要素及要素间的互动过程”的量化是一体两面的,可以将其归结为一点,即对教育活动中人的数据化表征与计算。对此,我们有必要对几个认识论和本体论问题进行追问:教育主体是可计算的吗?教育主体能否被表征为数据?数据能够代替“人”的本体吗?

  数据密集型科学研究的核心是数据及其处理技术。就建构一门计算教育学来说,我们首要的是看它如何获取数据、能够获取何种数据,这是对教育进行数学化计算的必要条件。数据密集型科学由数据的采集、管理和分析三个基本活动组成。[24]数据获取是进行数据密集型计算的关键,使用统计分析工具进行计算,需要采用一定的计量尺度对现象(事件)进行量化以获取可计算之数。邦格(Bunge,M.)在对经典测量理论进行研究的基础上,提出量化与测量要满足以下几个必要但非充分条件:受测项或所欲测量之具体体系的特质来自自然或社会,但其存在由理论来提引;受测项有一清楚的计量概念,即具有量值;同时有一概念尺度与物质尺度,使得量值得以测量;有一属于具首尾一贯之单位体系的测量单位。[25]也就是说,一个现象是否可以被量化和计算,取决于欲量化或数据化之现象的本质、尺度与单位问题。大数据手段与传统测量手段所获取的数据除了取数方式和数据量的不同之外并无本质的差异。通过各种传感器和人工智能数据处理设备所获取的教育数据仍然需要进行定量描述和定量概括,特别是各种非结构化数据,如视频、图像、音频等均需经过量化处理后才能进行计算。大数据的统计分析仍需“做一些界定数据单位这样的基础事情,如什么是测量单位,谁做的测量,以及该测量是在什么时候做的。这些是适用于所有领域的工作”[26]。要“提供一种标准的表达方式”、将数据“以某种算法的方式表达出来”[27],“把从一堆仪器中获得的数据放入一个校准和‘清洗’数据的管道中,包括必要时重新填补数据空缺,然后把这些信息‘重新网格化’”[28]。

  邦格提出的量化条件很大程度上是针对自然科学领域而言的,适合于自然科学的测量未必适合于对教育主体的测量,教育活动及其人的特质、计量概念、概念尺度、测量单位与自然科学领域中的物质存在极大的差异。教育活动或“教育人”的“数据”与自然科学之“数”具有不同的性质,教育活动或人的行为的数学化操作不具有自然科学的数学化操作那样的有效性和可行性。教育主体通过外显行为所表现出来的态度、情感、兴趣等的程度或强度复杂多变,不具有自然科学领域的物理性那样的稳定性和精确性,测量工具只能是一些尺度上具有很大模糊性的量表,测量工具的可靠性和稳定性完全不同于物理性测量所用的卡尺、测光仪等;对“教育人”的测量不具有物理性测量的确定的“ 测量单位”,测量所获得量值往往很难进行数学计算。因此,对“教育人”的计算只能是一种基于经验的计算。

  首先,教育量化概念是基于经验的,比如,关于同学友谊、师生互动、课堂教学活动量的强度指标可以设定为每天一次,也可以设定为每周一次或每堂课一次。这类指标的确立需要基于人们对同学友情的经验感知所形成的共识,依次获得的量值能否代表概念本身需要教育学或社会学的理论进行解释或检验,具有极强的主观性。其次,教育测量尺度的确立是基于经验的,只能是一种由经验赋予的尺度,如区分为高、中、低等,凭借经验在等级与等距尺度之间寻求一种感觉差异的区分。第三,教育主体没有“首尾一贯之单位体系的测量单位”,我们无法像时间、长度、重量那样赋予教育期望、学习兴趣、理解力一个精确的测量单位,“与物理现象不同,在社会现象里,我们没有任何测量体系可以运用小数量的面向来首尾一贯地描绘,而且,至少在原则上,我们也缺乏明确的测量单位体系,足以让使用的变项与其逻辑上乃属初始性之数量的共同集合有所关联”[29]。涉及教育主体的关键性因素如意义、理解、兴趣、努力、高兴、希望等都是无“单位”的,也不具备量值,量值并不是这些因素的原有本质,无法用量值对其进行衡量。不能像自然科学计算那样进行单位的转换与单位体系的对比。量值无法替代价值和意义,这直接导致了与主体密切相关的教育观念、教育价值无法通过量化计算证实或证伪。没有测量单位以及单位体系背后的教育意义和社会意义做支撑,把量值摆在同一个公式里不仅毫无意义,而且也失去了其应有的价值。对这些无单位的量值所进行的数学运算的结果,只能进行一种基于经验的阐释。可以说,教育主体计算必须配合理论分析和意义阐释进行,数据在教育中并不像自然科学领域那样具有显著的解释现象、反映主体行为的有效性。目前所进行的教育计算,不过是一种语言转译,“把原本是文字性的命题转译成为以数学符号来表达的公式性命题”[30]。

  教育的特殊性以及教育主体的独特性决定了应用数据密集型计算方法所能发现的“新知识”不同于自然科学领域。在量化一切事物、人人量化自我的时代,人们认为一切可测,但涉及人的研究一直存在“应用数量方法的特殊困难,尤其是测量方法”[31]。同样是社会科学领域对“人”的计算,教育学也与经济学、社会学等学科有极大的差异。经济学领域对“消费者(人)”的计算主要是对消费者消费行为的量化和计算。比如,在何处购物、购买了什么、对什么感兴趣、购买物品主要集中在什么价格区间等。社会学领域对“网络人”的计算主要是对人的网络浏览行为的量化和计算。比如,在哪里上网、主要搜索什么信息、浏览哪些网站,等等。这些领域计算的主要是人的外显行为数据,研究目的是寻求外显行为的“恒常因”的形成、影响等,关注的是外显行为的关联性,而极少追究隐含的因果关系特别是人的内在思维过程。相对而言,对“教育人”的研究要复杂得多,教育学要计算的是“人心”、内部主观世界,是学生的知识、道德、价值观等层面的内隐思维、意识流动,而不是可观察的外显行为。大数据感知和记录的是教育主体在教育过程中的外显行为数据,而非内隐思维数据。这种外显的客观痕迹和符号更接近于人类行为的表征,而不是内部真实心理、情感的直接显现。[32]外显的痕迹和符号只是教育过程的冰山一角,行为背后隐藏的主观世界才是教育的真相。经济学、社会学的研究旨在通过概率分析,发现和预测人在消费行为和网络浏览行为中表现出的稳定性的、重复性的外显行为及其规律,并通过满足某些条件以诱使相同行为再次出现。

  对“教育人”的研究是寻求教育过程中的内隐思维“变化”,教育的最终目标是要达成对人的行为、思想意识、知识、价值观等方面的“改写”,使行为、思想意识、知识、价值观按照一定的社会体系“升级”,而不是简单“重复”。如果说教育学研究有某些寻求具有稳定性、恒常性因素的需要,这些因素也不是人的行为本身而是使行为之所以如此的“第二因”,也就是能够使行为发生变化的方法背后的规律性因素。大数据可以计算“ 恒常因”,却不能计算“第二因”。与同为计算“人心”的学科如心理学相比,教育学计算的是人心之“变”,而非心理学那样计算“人心”在固定情境下的稳定反应或变化。大数据可以计算“人心”在未来会如何重复过去曾经发生过的变化,却不能计算“人心”在未来可能发生的过去从未出现过的变化。大数据计算某个人未来可能发生的变化依据的往往是他者过去所发生的变化,按照概率计算这个人会重复他者过去曾经发生的变化。应用过去的数据、群体的特征去分析某个具体的人的内隐思维变化存在极大的问题,“一个群体所具有的特征并未见得是某个体的真实特征,大数据不能说明、涵盖、体现所有人的特征,只能大凡分析平均情况、了解一般问题”[33]。按照时间的逻辑,能被数学化的东西都是过去,现在不可被数学化,前一刻被数学化的人已经与下一刻有很大的不同。人类由于获得了对他们所参与的事件,或对他们作为其成员的社会的新知识,因而经常更改他们习惯的社会行为方式。[34]教育中的人是时间性的人,“ 教育人”的思维、思想意识是流动的,“迄今最先进的智能机器也无法记录并直接呈现学生的内部心理,或者说会存在很大误差。因此,很难想象一个依靠数据客观性、注重外部行为记录的大数据方法能彻底解决教育科学研究问题”[35]。

  在自然科学领域,我们可以获取研究对象的准确知识,但是在教育领域我们只能获取对教育主体一般性的、模糊性的认识。比如,我们可以发现学生的学业成功与他的个人学习努力程度、学习专注度、学习兴趣存在大约的相关性,但是对于努力程度、学习专注度和学习兴趣我们只掌握了一些“质性”的、很不精确的一般知识,我们只能大体地说某个学生学业的成功是他比较努力、专注、学习兴趣高的结果,但对于这些事实在教育过程中的作用我们无法用量化证据加以证实。我们无法提供统计学的数据、通过计算以揭示学业有成的学生达到了何种努力、专注以及兴趣水平,也无法揭示学业失败的学生努力程度、专注程度、兴趣爱好是如何偏离了保证一个人学业成功的应有水平。我们不掌握学生努力程度、专注度、兴趣高低的量化数据,我们也不知道努力、专注、兴趣达到何种数值就能保证一个学生的学业成功。我们并不掌握这些事实的精确的“量化”知识,对学生学业失败原因的解释,也只能是一种经验理论。例如,一个学生如果努力程度不够、上课听讲专注程度不够、对于知识兴趣不高,就会导致他的学业失败、厌学;这种理论肯定不是能够使我们得出学业成功的有关努力值、专注值和兴趣值分布的量化预测理论。

  教育系统各要素及其之间的活动过程是一个复杂的结构,运用数据密集型科学范式处理教育的复杂结构要面临比自然科学领域更大的量化与计算困难。在自然科学领域“克服困难不必利用有关个别因素的特殊知识,而是可以求诸与这些因素有关的各种特征之出现频率或概率方面的相关数据”[36]。社会科学“所处理的结构,只能用包含着较多变量的模式加以说明”[37],社会科学领域的现象,“结构的性质不仅取决于其中个别的特性以及它们出现的相对频率,并且取决于各因素之间相互联系的方式”[38]。教育活动各要素之间的互动不是由个别的因素以及概率决定的,而是由全部因素以及它们之间的相互作用决定的。我们在解释这种结构的运行时,不能用统计数字取代有关各个因素的知识;如果我们打算用我们的理论对个别事件做出预测,就要对每个因素都有充分的了解。[39]对教育主体、教育系统各要素互动过程的化约只能是一种“等等式化约”,“对能够产生这种现象的那类事件的实例之性质的列举,并加上‘等等’这样的字眼。这种‘等等式化约’并不能使我们处理生物或精神实体,或能够用物理事件的陈述取代它们;它们仅仅是对某些类型的秩序或模式之一般特征的说明,对于这些秩序或模式,我们只有通过对它们的具体经验才能有所了解”[40]。对教育主体及教育系统各要素的互动过程我们无法做到如同物理学、化学等自然科学那样的化约。我们能够获取数据进行研究的方面是十分有限的,我们无法一览无余地列出构成教育活动、教育各要素互动过程的全部充分必要条件,“我们虽说知道了大量的事实,但是这些事实却是我们无力对之进行计量的;即使就我们所知道的这些事实来说,我们所掌握的也只是一些极不精确且相当一般化的信息。再者,由于这些事实在任何特定情势中的效用是不可能通过量化证据加以证实的,所以这些事实的效用也就被那些只承认那种被他们视作科学证据的因素的人忽视不顾了。这种人还会因此而产生这样一种虚幻的感觉,即他们能够计量的因素才是唯一相关的因素”[41]。

  对教育主体的化约只能帮我们获取部分数据而不是全部数据,我们对教育主体及教育系统各要素的互动过程能够进行充分观察和计算的方面是极为有限的。教育主体的教育生活绝大部分是发生在线下的,网络空间、虚拟空间只是教育生活的一个极小的部分,网络空间、虚拟空间之外的教育生活中那些无意识中发生的、顿悟的、休闲的、隐性的学习和教育活动都没有也不可能被记录和保存。线下的教育生活是大数据记录的盲区,我们只能掌握教育主体满足特定条件的特定类型的数据,而不是教育主体全部教育生活的数据。教育中真正重要的部分并不一定是发生在网络空间,更多的是教育主体间的日常互动过程。日常生活中的互动过程是较为隐秘的,互动中涉及大量非言语表达的手势、眼神、表情等,都只能通过意会、阐释转换为质性知识,不能被转换为可以量化与计算的量化知识。人被当作一个可以被计算的物体来对待,人的丰富性、复杂性和深邃的内在性被缩减了。[42]总之,对教育主体及教育系统各要素之间的互动过程,我们只能进行有限的、局部的、特定视角下的量化与计算,用数据密集型科学范式计算教育中的人与教育发展的目的存在很大的矛盾。“真正的教育所面向的内在心灵和完整人性是无法测算的,即灵魂品质的形成、建构和完善是无法测评的。人的精神成长与经验的更新只有在实践行动中被证实,而无法被测评和估算,人的行动、成长的体验、精神发展的成果,只有在主体自身的反思中,由主体自身从内在进行把握或判断。”[43]正如技术哲学家埃吕尔(Ellul,J.)所批评的那样,当技术表现出对人的兴趣,它都会把人转化成一个物质对象。它只能通过这种方法对待人:贬低人以及量化人。因为技术的完善性只有通过量的发展才能够获得,而且不可避免地必然指向可测量的东西,相反,人类美德属于质的领域,针对的是不可测量的对象。所以,在技术的完善性和人的发展之间存在着尖锐矛盾。[44]

三、数据密集型科学研究范式能否帮助发现教育规律

  《计算教育学》认为,“计算教育学隶属于教育学”,作为教育学的分支学科,计算教育学“旨在阐明教育系统内部要素的本质,找出教育活动良性运行的影响因素,揭示教育活动发生发展的规律”[45]。《计算教育学》将计算教育学的学科研究宗旨确立为对教育本质的阐明、教育规律的揭示,这是为解决计算教育学的教育学属性而与教育学学科发展定位的对接,不如此,无以解决其“隶属于教育学”的学科合法性问题。但是,我们能否通过互联网和智能感知等技术以及数据管理和统计分析工具“解释教育现象与教育内在机制,揭示新时期教育复杂系统运行规律”、“发现信息时代教育教学的模式和规律”[46]则有待进一步研究。毋庸置疑,计算科学在自然科学领域能够帮助我们发现各种自然现象和自然规律,但在教育领域,计算科学能帮助我们发现隐藏在数据中的何种教育现象和教育规律?基于数据密集型科学研究范式的模式预测能力是否存在应用领域的局限?更加根本性的问题是:教育是数据驱动还是规则驱动?教育研究的最终目标是发现关联性还是因果性?

  计算教育学是否能够发现并揭示教育模式、教育规律在很大程度上取决于它所应用的计算工具。“规律是能使我们将某一时间的某一陈述的真实性通过在此之前的另一陈述的真实性推断出来的一般性命题。”[47]对教育规律的揭示就是寻求对教育现象的因果关系解释。与传统的社会科学应用统计学方法寻求因果关系的路径一致,数据驱动的路径主要是“通过统计分析或机器学习等各类算法从数据中分析、挖掘现象和规律”[48]。运用数理统计的方法可以帮助我们处理复杂的教育活动中相同类型的信息,为我们提供教育过程中某些行为或特征一起出现的相对频率,却不能告诉我们这些行为的构成因素以及它们之间存在的“因果关系”。统计学的方法只是把这些因素中的某些相同的类型作为一个“数据”来对待,而无法对它们的统一特征做出任何说明。“它通过用出现率信息取代有关个别要素的信息,避开复杂性问题,它故意不考虑一个结构中不同要素的相对位置也会有一定作用这个事实。”[49]统计学的工作假设是“用一个集中不同要素的出现率”来解释现象,也因此导致了统计概率的方法应用于教育研究所要面对的一个最大问题:“它无法解决涉及不同属性的个别要素之间的关系的问题”。这个问题体现出一种无法调和的矛盾:一方面,只有故意忽略“不同属性的每个要素之间的关系”、“不考虑或不了解它们所形成的任何结构”时,统计学的方法才是有用的;另一方面,那些故意忽略掉的“不同属性的每个要素之间的关系”恰恰是教育中最重要的东西。比如,对学生在学习行为中表现出的学习兴趣、好奇心、想象力、理解力等精神象,统计学方法只能将它们的某些要素作为一个相同的类型进行频率计算。统计学方法可以告诉我们这些要素出现的频率,却不能告诉我们兴趣、好奇心、想象力、理解力的结构以及构成这些精神现象的要素之间的关系,不能解释为什么会形成这样的结构,也不能提出如何调整它们的结构的策略。

  统计学方法的工作假设也间接决定了它会发现何种教育模式和教育规律。教育模式和教育规律的发现是对在有关特定情况下会发生什么的预测。只要我们能够控制所有的相关条件就可以预测会形成何种结果,能够进行教育的模式预测意味着可以通过计算发现一些关系。比如,发现使学习发生、获取教益的具体条件,只要这些条件获得满足就可以产生我们期望的结果。传统的教育研究实际上一直在寻求一种“关系”解释,各种教育模式或教育规律本质上体现为教育活动中的各种“关系”(因果关系,不是相关关系),教育模式或教育规律实际上是对教育活动中各种关系的具体表述。统计学方法忽略掉了教育活动中的“关系”,实际上也就忽略掉了可能发现的教育模式或教育规律。因此,计算教育学通过统计学方法的概率计算寻求教育模式或教育规律可能是一个悖论。

  当然,这些局限性并不妨碍我们用教育大数据做出某些分析,如学习分析、教育评价等数据密集型计算方法确实有效。但是,不能因为这种方法的局部有效性就以为它可以解决所有的教育问题,就可以用这种技术去测量、计算整个教育的各种量的数值,并发展出一门计算教育学,通过计算获得某些规律。我们通过概率计算教育活动的时候,当一些集体现象表现出一定的稳定性、具有高概率,就被认为其背后有规律的存在。这种发现规律的方式本质上还是经验主义的,概率计算获得的还是经验类知识。教育规律并不是建立在高概率的基础上,教育方法、教育策略、教育政策并非依据概率制定的,教育规律受到文化、制度、伦理等多层面的制约和影响。“统计概念并不是如实证社会学者们一向所以为的,可以超越特定时空场域而有着普遍而客观的有效性。”[50]数据密集型科学研究范式并非像人们认为的那样可以完全规避传统的实验科学、理论科学、计算科学范式对于理性判断、理论假设、理论诠释的依赖,只不过将对研究者本身的知识结构、价值立场和意识形态的“个体依赖”转交给了算法开发者和程序员,数据并非在没有理论的情况下自己在发言。数据驱动的驱动器是算法和模型,算法和模型的背后需要某种原理做支撑,任何算法和模型都是基于某种先验的理论构建起来的。无论是采用何种算法,本质上都是数学建模,都隐含着对教育问题、教育活动的主观考察和价值判断,程序员调整模型、引入新变量、调整参数离不开已有的教育理论、知识、经验总结,特别是源自于程序员的主观因素。

  数据密集型科学研究范式貌似帮助研究者摆脱了对理论假设的依赖和个体主观因素,但是研究的理论依赖和主观性乃至于偏见依然存在,只不过是隐藏在了算法、智能设备的背后,不过是将“以研究者为中心”转换成了“以机器为中心”,“理论依赖”转换成了“数据依赖”和“算法依赖”。这种就地掩埋式的“客观性”背后隐藏着更大的教育风险,因此更加需要配套计算教育理论以抵御数据风险、算法风险。算法和模型是数据密集型计算方法的实现载体,智能设备以及算法、模型、数据处理技术定义了我们能够获取何种数据以及能够从数据中发现什么。“每一个代数方程或一组这样的方程都规定了一类模式,当我们用明确的数值代替其中的变量时,这些模式便具体化为个别的具体表现。”[51]因此,所谓的“数据驱动”背后依然隐藏着“规则驱动”。规则驱动也导致了某些计算上的逻辑循环,我们应用基于某个教育原理的算法去计算教育,发现的往往还是那个已知的原理或规则。目前,采用大数据方法所进行的教育数据分析还没有发现一条新规律。

  教育本质上是由规则驱动的,而非由数据驱动的。在自然语言处理、计算机视觉、信息抽取和信息检索等领域单使用相关性模型就可以满足应用需求,然而如果要求在给定情景下提供如何干预或者控制某些因素的决策支持,则需要使用因果推断模型。[52]教育实践中教师更多地需要使用因果推断进行教育决策。各种统计工具擅长的是相关分析,它并不追求数据背后的必然逻辑、不进行因果推断,基于相关分析得出的结论往往是表面现象,反映它们有某种共同变化的趋势,但并不必然存在因果关系。[53]相关分析并不足以对教育决策提供有效支持,“教育学”价值不大。“量化其实只是一种近乎没做什么决定的决定。”[54]从教育研究的最终目的来说,我们想知道的并非“是什么”的问题,而是要知道“怎么办”、“怎么教”。对教育规律的寻求不是像自然科学学科那样寻求相对简单的公式。自然科学对规律的寻求是数据的,教育领域并不存在这种基于数据的“规律”,教育规律并不是用数据表征的。甚至在教育领域我们很难应用“规律”这个概念,“通常意义上的规律的概念,似乎很难被用在有关复杂现象的理论中,因此把科学描述为‘制定规律’或‘立法’的学说,只适用于那些可以归纳出简单现象理论的只有两三个变量的问题,却不适用于超过了一定复杂水平的现象的理论”[55]。发现教育规律的前提是我们能够知道对形成教育结果起作用的所有条件和关系,运用实验科学范式或理论科学范式,我们能够知道学习的发生是由某些类型的条件决定的,“但无法具体说明决定着被预测的那类模式将会出现的特定条件”[56]。

  统计学的方法不能帮助我们知道教育以及学习何以发生的条件和关系,我们无法搞清楚使学习发生的、对人的学习起作用的所有事实,也无法控制使学习发生的所有相关条件。我们对教育进行的规律性解释实际上都是针对某种教育模式的理论描述。比如,像雅斯贝尔斯(Jaspers,K.)所揭示的那样,“所谓教育,不过是人对人的主体间灵肉交流活动”[57]。而且类似对教育模式的揭示也只能到此为止,我们无法控制一个心灵如何去影响另一个心灵,无法控制心灵之间互相影响的所有条件以获取预期的肯定性结果。我们研究发现的“规律”只是这种对教育活动特点进行描述的一般模式,而不是自然科学领域经过精确预测和计算所发现的精确模式,即使借助于大数据手段,我们也不可能期望掌握“灵肉交流”过程中各种变量之间的关系。所以不要期望以“数据驱动”发现某种可控制结果的模式,获取教育发生的必要且充分条件,并通过满足这些条件使预期的教育效果得以发生。“个人的个性仍然是一种非常独特且无法说明的现象——我们可能有望通过诸如赞扬和谴责这类从经验中发展出来的做法对这种现象施以可欲的影响,但是从一般的角度来讲,我们仍然无力对个人的具体行动做出预测或进行控制。”[58]教育领域并不存在类似于物理规律、机械规律那种隐藏在现象背后的简单规律,所谓的教育规律只能是关于教育的一些理论性阐释,而不是那种用两三个变量表达出来的“定理”、“定律”或“公式”。

  我们应该构建不同于自然科学的“数据驱动”的教育理论表达范式,不能“把科学理论等同于寻找一个参数取决于另一个参数这种简单意义上的规律”[59]。教育过程中虽然也存在大量成功的教育案例,但是,这些成功的教育案例背后存在何种规律性,需要满足哪些条件、这些条件的满足需要达到什么量值我们并不清楚,对于教育何以成功我们的认识是模糊的。如同埃尔斯特(Elster,J.)所认为的那样,自然科学的规律解释是“一种决定论的解释:给出前提,只有一个可能的结果。社会科学即使有这样类规律的解释,也是极少数的。解释项与被解释项之间的关系不是一对一或多对一,而是一对多或多对多。很多社会科学家试着用统计的方法为这种关系建模。然而,统计解释本身并不完备,因为它最终不得不依赖对看似可信的因果机制的直觉”[60]。他主张不通过寻求统计相关的因素来解释社会现象,而是通过探求那些可以展示出社会现象如何产生的机制来进行解释。[61]波普尔同样认为,社会学家不可能将对社会变化的因果解释“ 表述为数量规律”,“社会科学的因果律即使有,在性质上也必然与物理学的因果律迥然不同,因为它们是定性的,而不是定量的和数学的。如果社会学的规律能够确定任何事情的程度,它们也只有用十分含糊的措辞,充其量只能作出大致的估计”[62]。我们应该围绕教育活动建构关于如何协调各种复杂“关系”的理论或方法,而不是为了使教育学成为“科学”而像自然科学学科那样寻求某个唯一的数量规律。这样说,并不是说我们不可以进行教育模式的探索,而是说我们实际上不可能运用计算科学、统计学的技术通过量化、计算发现教育模式。对教育模式的探讨只能通过解释学的、质性的、模糊性的方式进行。教育学所涉及的教育方法、教育策略、教育理论看似做了正确的解释,其实本质上都是有限性理论而不是精确性理论,根据这些理论,我们对教育效果只能进行笼统的预测。对于做出的任何一种教育策略,我们都无法预测可能产生的确定性结果,即使最优秀的教师,也无法对他自己的教育活动进行精确预测。教育所能产生的更多的是“未预期结果”。我们寻求的教育模式或教育规律只能是一些教育机制的运行原理,我们能做的只是对教育现象的部分一般性特征的预测和解释,只是一种经验概括、一个解释方案,而不是自然科学意义上的精确预测和规律发现。

  基于数据密集型科学研究范式构建起来的计算教育学是完全数据科学化的教育学。教育学是认识解释教育现象、解决教育问题的实践性学科,它告诉人们在教育实践中怎么做、如何教。教育学的知识体系建构基于范畴化的知识表达方式,是用因果关系反映出来的可理解的、清晰的、可在教育者之间交流的语言,而数据分析所得到的是数据之间的函数拟合关系(也就是相关关系)。这种结果“仅仅是随机波动的产物,并不代表所研究现象的任何本质的特征”[63]。这与教育学的已有知识表示方式和话语体系存在很大差异。我们无法想象一门由函数拟合关系表达出来的教育学的知识体系是怎样的,以及它如何可能应用于教育实践、实现在教育者之间的对话和知识交流。教育知识、教育规律的寻求和表达本质上是原理机制的研究和理论阐释,而不是数据分析。教育学的适切的研究范式应该是基于解释学、现象学的原理机制解释、经验概括,而不是基于计算科学、信息科学、数学的,以数据驱动、以计算为核心任务的计算教育学。数据密集型科学研究范式“是一种探索性数据分析的范式,旨在对数据进行定量描述和定量概括,发现变量间的相关性,在性质上类似于传统研究中理论建构和假设检验之前的数据预处理”[64]。从构建一门教育学的分支学科的角度来看,这种研究范式只相当于教育研究过程中的数据处理环节或只是研究的数据起点。

  构建一门教育学的分支学科仅仅以“数据说话”还远远不够,需要其他研究范式“接着说”。而且,仅用数据这种研究范式“无法触及教育领域的‘真实’和‘本然’,更无法揭示教育规律,似乎大数据时代的数据挖掘本身就与教育学科的人文性相抵触”[65]。因此,我们很难将计算教育学归属于教育学科。微软研究院的贝尔(Bell,G.)在论及数据密集型研究范式时,认为这种新的科学研究范式主要是基于数据密集型计算、利用计算机从我们创建并存储在电子数据库中的数据中发现和理解自然与世界。[66]从计算教育学赖以诞生的学科渊源来看,它的学科归属更应该是计算科学和信息科学。格雷从科学领域的学术体系演变的角度指出,当前每个学科正在演变生成两个新的分支。一个分支是与收集、分析、编码数据有关的学科信息学(X-Info),一个分支是模拟该领域的系统及其运转的计算学科学(Comp-X)。[67]计算教育学的概念正是从格雷提出的新分支概念“Comp-X”演化而来,按照这种概念命名模式可以推演出诸如计算社会学、计算生态学、计算生物学等分支学科,但这并不等于我们将这些新的分支学科归属于社会学、生态学、生物学。而且,格雷是“从计算科学中把数据密集型科学区分出来作为一个新的、科学探索的第四种范式”提出来的,从概念的命名模式看,格雷更倾向于将“Comp-X”这类分支归属于计算科学。[68]

  总之,从学科渊源、技术手段、研究对象、研究范式各方面考量,计算教育学应该是计算科学、信息科学的细分学科,而不应是教育学的细分学科。笔者更倾向于认同计算教育学中文概念的提出者所做的学科归属,“通过对教育全过程的大数据进行精确分析和计算,把以定性研究为主体、以经验为基础的教育科学,转变为以大数据为基本对象、以计算和模型为手段的定量精确科学。从而创造一门新的科学研究方向——计算教育学。它将成为信息科学的一个重要分支,进一步促进信息科学其他分支的快速发展”[69]。与《计算教育学》一文作者进行商榷并不表示笔者反对计算教育学作为一个新兴领域、新兴学科的出现,而是主张在学科交叉的样态下保持计算教育学清晰的研究边界和学科归属,让这个新兴的以教育数据为研究对象的学科计算它可以计算的、研究它可以研究的。在计算科学、计算机信息技术、数据科学的基础上构建一门进行数据密集型计算的,以教育数据获取、管理、计算分析为目标的归属于信息科学的教育计算学或计算教育学,可能比以教育活动和教育问题为研究对象归属于教育学的计算教育学更为适切。

四、结语

  最后,不妨让我们科幻一下。假如计算教育学帮助我们计算出了想要知道的一切,假如我们可以获取完美的教育规则、教育规律,那么,按照规则去执行教育计划、满足一个(或多个)原因的各种充分必要条件,是否就可以断定确定性的教育结果会一再重复出现呢?假使我们能够获取所有的假设条件,将教育的所有问题如同“二二得四”那样用数学方法精确计算出来,教育是不是就一定会呈现为一种严格按照自然规律运行的图景呢?正如陀思妥耶夫斯基在一本小说中所描述的:“人的所有行为都自然而然地可以根据这些规律计算出来,用数学的方法,像对数表那样,一直算到十万零八千,并载入历书;或者更好一些,将会出现某些中规中矩的出版物,一如当今的百科辞典那样,其中的一切都得到了精确的计算和编排,于是,世界上便不再有任何冒失行为和意外事故了。”[70]一切都被精确计算出来的教育还是教育吗?像历书或百科辞典那样的教育学还是教育学吗?可以想象,如此按图索骥般的数学化操作将会扼杀教育和教育学。套用陀思妥耶夫斯基笔下那位“奇谈怪论者”的话:我们就假定这是一条逻辑规律吧,但或许根本就不是人类的规律。或许生命根本就是不可被计算的。在电影《流浪地球》中有一个值得回味的情节:人工智能莫斯(Moss)通过概率计算出航天员刘培强“拯救地球”的计划100%要失败,所以它命令刘培强放弃行动返回冷冻仓。但是,刘培强却孤注一掷引爆自己拯救了地球。人工智能可以计算所有的信息,但是它却无法将尚未发生的信息计算在内,“当人们试图用过去发生的来归纳和凝炼规律并预测未来的时候,未来的总体通常并不等于过去的总体”[71],现在尚未发生的事情使得我们无法用过去预测未来。

  教育最终要追寻的是那些尚未发生的、意料之外、没有被计算在内、能够改变预定概率的未预期结果。教育的过程和结果永远是尚未发生、悬而未决的,它不像自然科学那样一旦获取答案就可以永久性地解决某个问题。教育不能用一个模式面对所有的受教育者,哪怕是最成功的教育模式也不能应用于所有的教育对象,“把统计性的概括应用于个案是个严重的错误,不仅在科学领域,在日常生活中也是如此”[72]。面对每一个受教育者都需要像西西弗斯(Sisyphus)一次次滚石上山、从头再来。“须知二二得四已经并非生活,而是死亡的开始了。”[73]我们在“宣称一门科学能做什么不能做什么时要非常谨慎”[74],按照机器驱动、数据驱动的模式处理教育活动和教育问题时更应保持慎重。对于教育我们要始终保持一种“谦逊的”无知和无为。人们必须明白,在社会领域中,“他们根本就不可能获得那种可以使他们掌控事件成为可能的充分知识。因此,他们必须运用他们所能够获得的知识,像园丁培植其植物那样,经由提供适宜的环境去促成社会的发展,而决不能像手工艺人打造手工艺品那样刻意地塑造其产品”[75]。

【本文系山东省重点研发计划2018 年度项目“基于大数据的教育评价体系研究与实践”(项目编号:2018GGX109007)的研究成果】

参考文献:

  [1] Lazer,D.,et al. Social Science. Computational SocialScience[J]. Science(New York),2009,(6).

  [2] 刘三女牙,等. 计算教育学:内涵与进路[J]. 教育研究,2020,(3);李政涛,文娟. 计算教育学:是否可能,如何可能?[J].远程教育杂志,2019,(6);王晶莹,等. 计算教育学:是什么、做什么及怎么做[J]. 现代远程教育研究,2020,(4);郑永和,等. 计算教育学论纲:立场、范式与体系[J]. 华东师范大学学报(教育科学版),2020,(6);王晶莹,等. 从大数据到计算教育学:概念、动因和出路[J]. 中国电化教育,2020,(1);许新华. 计算教育学—— 一门新兴的交叉融合新学科[J]. 湖北师范大学学报(哲学社会科学版),2019,(5);王晶莹,等. 计算教育学:研究动态与应用场景[J]. 开放教育研究,2020,(5).

  [3][7][21][22][23][45][46]刘三女牙,等. 计算教育学:内涵与进路[J]. 教育研究,2020,(3).

  [4][24][26][27][28][66][67][68]Hey,T.,et al. 第四范式:数据密集型科学发现[M]. 北京:科学出版社,2012. 前言.xi、前言.v、前言.xxi、前言.xii、前言.xiv、前言. iii、前言. xi-xii、前言. xi.

  [5]余胜泉,徐刘杰. 大数据时代的教育计算实验研究[J].电化教育研究,2019,(1).

  [6][19]贾向桐. 大数据背景下“第四范式”的双重逻辑及其问题[J]. 江苏行政学院学报,2017,(6).

  [8][9][10][13][14][16][25][29][30][50][54]叶启政.实证的迷思:重估社会科学经验研究[M]. 北京:生活·读书·新知三联书店,2018.128、167、132、122、97、123、95、125、122、204、215.

  [11] Pietsch,W. Big Data—The New Science of Complexity[EB/OL].http://philsciarchive.pitt.edu/9944/1/pietsch-bigdata_complexity.pdf

  [12]Kitchin,R. Big Data,New Epistemologies and Paradigm Shifts[J]. Big Data & Society,2014,(1).

  [15]张务农. 大数据推动教育科学研究进入新境界[J]. 中国教育学刊,2018,(7).

  [17][18][31][62]卡尔·波普尔. 历史决定论的贫困[M]. 上海:世纪出版集团、上海人民出版社,2009. 62、61、112、20—21.

  [20][47][60][72][74]乔恩·埃尔斯特.解释社会行为:社会科学的机制视角[M]. 重庆:重庆大学出版社,2019. 440、8、8、26、438.

  [32][35]张务农. 论大数据之于教育研究“科学化”的价值与局限[J]. 中国远程教育,2018,(8).

  [33]李芒,段冬新. 历史的会师点:教育技术的学术繁荣[J].现代远程教育研究,2020,(2).

  [34]欧内斯特·内格尔. 科学的结构[M]. 上海:上海译文出版社,2005. 524.

  [36][37][38][39][40][49][51][55][56][59]哈耶克文选[M]. 郑州:河南大学出版社,2015. 597—598、597、598、598、665、650、641、668、661、670.

  [41][58][75]哈耶克. 知识的僭妄:哈耶克哲学、社会科学论文集[M]. 北京:首都经济贸易大学出版社,2014. 191—192、110、204.

  [42][43]金生鈜. 大数据教育测评的规训隐忧——对教育工具化的哲学审视[J]. 教育研究,2019,(8).

  [44]埃吕尔. 技术秩序[A]. 吴国盛. 技术哲学经典读本[C].上海:上海交通大学出版社,2008. 125.

  [48]沈阳,等. 大数据时代的教育:若干认识与思考——访中国科学院院士梅宏教授[J]. 电化教育研究,2020,(7).

  [52][53]马双鸽,等. 大数据时代统计学发展的若干问题[J]. 统计研究,2017,(1).

  [57]雅斯贝尔斯. 什么是教育[M]. 北京:生活·读书·新知三联书店,1991. 3.

  [61]彼得·赫斯特洛姆.解析社会:分析社会学原理[M]. 南京:南京大学出版社,2010. 26.

  [63][64][71]丁小浩. 大数据时代的教育研究[J]. 清华大学教育研究,2017,(5).

  [65]南钢,夏云峰. 大数据时代的教育科学研究:可能、风险与策略[J]. 湖南师范大学教育科学学报,2020,(4).

  [69]李未. 抓住MOOC 发展机遇全面提高高等教育质量[J]. 中国大学教学,2014,(3).

  [70][73]陀思妥耶夫斯基.地下室手记[M]. 杭州:浙江文艺出版社,2020. 32、45.