埃尔德里奇:从话语词汇的使用看教育技术学的理论研究

来源:百度文库 编辑:中财网 时间:2024/05/01 04:43:20

Some Research on Glossary Used in Educational Technology Theory

从话语词汇的使用看教育技术学的理论研究*

杨开城 张润芝

北京师范大学 教育技术学院 100875

贺红星

佛山大学 教育信息技术系 528000

摘要:话语分析是教育技术理论元研究的一种重要方法。话语分析的主要工作,一是确定话语词汇体系,二是探究理论研究的话语逻辑。通过话语分析,本研究得出的结论是:⑴中国教育技术学理论研究细节不够丰富;⑵中国对教育技术理论的独创研究较少;⑶复杂性、学习支架、可选择性等研究被忽略了;⑷建构主义已经成为中国教育技术研究的背景;⑸只有在社会生活中普遍使用的技术进步才可能引发教育技术领域的大发展;

关键词:话语分析、元研究、教育技术学

 

一、话语分析对于中国教育技术学理论元研究的必要性

任何一种组织系统的成长,都有可能引发一定的无组织力量。这种无组织力量如果不得到有效消除,必然导致组织系统的解体。理论研究也是一样。当一种理论自身发展到足够混乱无序时,必然引发一定的自我反思,即这种理论的元研究。元研究是一种清除无组织力量的努力。元研究的基本任务,不仅包含反思确认理论的研究对象、世界观和方法论问题,还应该包括审视理论自身的话语体系和话语逻辑。

与十年前相比,中国目前教育技术学理论可以说是较为繁荣了。但是术语使用的混乱和随意、旷日持久的名称之争、教育技术与其他学科之间的紧张关系、理论体系结构的简单拼凑、对媒体技术和外来理论的盲目迷信等无组织力量也逐渐产生。这个关口,我们有必要重新审视,我们这个领域到底在做些什么、在想些什么、在说些什么。

语言是思维的工具。话语的苍白也就意味着思想的无力。通过分析教育技术学理论的话语体系和话语逻辑,我们能够探寻到研究者的研究视野、思想前提和思考逻辑,并将那些“不容置疑的”合理性依据也作为批判的对象。

本次教育技术学理论研究的话语分析所做的工作,一是确定话语词汇体系,这个词汇体系的某些特征反映了理论研究的某些特征;二是探究理论研究的话语逻辑,主要考察教育技术学理论研究的思想前提和思维方式。本文主要集中介绍前一部分工作的研究结果。有关话语逻辑的研究,我们将另文撰述。

 

二、本研究的话语分析的研究方法和操作过程

㈠收集分析文献的样本

本研究收集了《中国电化教育》、《电化教育研究》、《现代教育技术》三个刊物在2001~2005年间的理论性质的论文。

论文取样是人工完成的。我们主要依据论文的标题和摘要来判断该论文是否属于理论性质的论文。收集的文献样本,其内容主要涉及教育技术基本理论研究及其反思以及媒体技术的教育应用及其反思。

这个阶段共收集986篇文献,其中《中国电化教育》374篇、《电化教育研究》445篇、《现代教育技术》167篇。

 

㈡登记文献的基本信息

将各文献的刊源、发表时间、作者记录在Excel表中,并对文献进行标号,标号的格式是“刊源+年份+月份+_+取样编号”。例如10501_04表示《中国电化教育》2005年第1期所取文献的第4篇;20305_02表示《电化教育研究》2003年第5期所取文献的第2篇;30203_03表示《现代教育技术》2002年第3期所取文献的第3篇。这些标号是我们所编写的程序识别文献的唯一标识。这个Excel表也是我们选择人工研读文献的数据源之一。

 

㈢提取话语词汇和确定歧义切分干预规则

抽取各样本文献的标题和摘要文本,合并成单独的文件。运行自动分词系统对该文件进行自动分词,并对分词结果进行人工干预,总结歧义切分的干预规则。同时,从论文标题和摘要文本的分词结果中,总结和提取教育技术理论研究所采用的基本话语词汇。

比如自动分词系统的切分结果是“{{|操作}|}”,干预后的结果是“/可操作性/”;又比如自动分词系统的切分结果是“/教育/技术/”,干预后的结果是“/教育技术/”,等等。在这个过程中总结和提取教育技术理论研究的话语词汇471条。

 

㈣统计各词汇的使用次数,即频度信息

对所选取的各文献样本的全文文本进行自动分词并对歧义切分进行干预,然后通过编程对分词后的文献文本进行扫描,计算这471条话语词汇在各文献样本中的使用频度。这些频度数据被存储在Kwinfo.dat文件中以备后用。Kwinfo.dat文件中记录的是每个文献中这471条词汇出现的次数。这是一个986×471大小的矩阵,不适合存储在Excel表或者某个数据库中,只能单独编程处理。这个矩阵是后面计算词汇的分布系数和词汇间的相关强度的数据源。

 

㈤对471条词汇中的一些词汇进行人工聚类和对比分析

比如,我们可以将“建构主义”、“认知主义”、“行为主义”等划分为一类,然后观察这三个词汇的使用频度随时间变化的情况。这种对比分析有助于我们考察这些词汇所代表的思想在学术共同体中的地位和变化。当然,聚类操作并没有什么客观标准,完全取决于分析者的主观目的。

 

㈥确定核心词汇集合

一开始,我们通过编程计算这471条词汇出现的总频度,进行降序排列,试图将频度高的词汇作为话语的核心词汇。可是我们发现,各词汇的频度之间虽然有较大差异、但可连续性也很强。比如假设词汇A与词汇B的频度差异是50或者100,但是多数词汇之间的这种差异都很普遍,这样就难以确定一个标准来划分哪些词汇属于核心词汇。也就是说,频度信息不适合作为划分核心词汇的指标。我们需要另确立一个指标。

这个指标必须满足这样几个条件:词汇被使用的总频度越高,它就越可能属于核心词汇;词汇被越多文献使用,它就越可能属于核心词汇,即很多人关注它;词汇在各文献中使用的频度越均衡,它就越可能属于核心词汇,即它不属于边缘话题。

这个指标,我们将它命名为分布系数(distributing coefficient,后简称DC)。分布系数的数学表征是:

,其中N>1,表示使用某个词汇的文献个数;Xi>0,表示某词汇在某个文献中出现的次数。

可以证明当N固定并且Xi>1(恰巧我们统计的词汇频度总是大于1)X1XN的各数值越接近,即分布越均匀,DC的值就越高;理想情况下,当X1= X2=…= XN时,DC的值最大;如果频度总和 不变且Xi>1,那么N增加,DC的值也增加;当然,如果N不变,Xi的值越高,DC的值也就越大。

编程计算各条词汇的分布系数并降序排列后,我们发现各词汇之间的DC值差异的确很大。由于DC的值是乘积的累积,所以值很大。例如,“教学”一词的分布系数是2.795X101171,“教育技术”一词的分布系数是2.581X10497。我们就根据DC值的数量级(10的幂次)进行核心词汇的划分。我们将数量级在100以上的确定为本次话语分析的核心词汇。

 

㈦计算某些核心词汇与其他词汇的相关强度

这里,所谓词汇A与词汇B的相关强度(Relative Degree),是指在讨论词汇A的文献中多大程度上涉及到B

相关强度的计算方法:RD= ,其中XiYi是某文献样本关键词XY的频度值,Xi>0Yi>0

之所以我们没有采用教育统计学中的积差相关的计算方法,是因为在这里方差、标准差、平均次数等数据完全没有意义,两个词汇之间的相关强度是一个非负数。但是利用相乘关系来计算相关是通常的做法。为了避免数值过大以及公式的对称性,我们将XiYi的乘积除以它们的和。我们只关心相关强度的相对大小,相关强度的具体数值并没有直接的意义,所以我们认为采用这种计算方法是可以接受的。

由于考察某些比较上位的核心词汇(比如“教学”)的相关强度,对于话语分析没有什么启发作用,所以我们选择下位一些的核心词汇(比如“教学设计”、“网络课程”等),计算它们与其他词汇的相关强度,看看人们在讨论这些核心词汇时,都关注着哪些方面、忽略了哪些方面。

 

㈧选择人工研读的文献样本并研读分析

将核心词汇以及与其强相关的词汇构成一个词汇集合。将这个集合中词汇在各文献样本中的频度信息提取出来,并进行排序。然后,针对特定词汇,选择一定数量高频度的文献作为人工研读分析的文献样本。

最终我们选择了“教育技术、教育技术学、信息技术、教学设计、教学模式、学习环境、交互、教育信息化、协作学习、网络教育、网络课程、电化教育、课程整合、信息技术教育”这些词汇作为参考词汇进行样本选择,共选择204篇。

 

三、话语分析的基本结论

⑴我国教育技术学的理论细节不丰富

471条词汇中,我们将数量级为100以上的划分为核心词汇,数量级是10的词汇划分为边缘词汇,其他的划分为中间词汇。这样的划分结果是,核心词汇占11%,中间词汇占74%,边缘词汇占15%(详见图1)

核心词汇必然包含着整个学术共同体的关注焦点,这些核心词汇包括有:教学、技术、资源、设计、方法、环境、系统、教育技术、信息技术、计算机、课程、学科、活动、评价、领域、开发、多媒体、媒体、管理、模式、教学设计、结构、认知、整合、情境、思维、教学模式课件、软件、主体、交互学习环境、专业、教学内容、建构、培训、策略、建构主义、实验、标准、共享、学习理论、教学活动、教育技术学、原则、信息化、平台、远程教育、网络教学、教育信息化、经济、学习活动、素质、协作学习、网络教育、自主学习、教学目标、网络课程、电化教育、模型。

上面笔者将核心词汇中与教育技术直接相关的词汇划出来了,其中代表教育技术理论细节的词汇(那些划浪线的词汇)只占18%。

核心词汇的总量只占11%,核心词汇中代表着理论细节的词汇只占18%,这说明我国教育技术学理论研究的理论细节不够丰富。也就是说,宏观论述比较多、深入研究比较少。我们相信,随着教育技术理论研究的深入发展,代表着理论细节的话语词汇的分布系数会越来越大,这些词汇进入核心词汇的数量也会越来越多。

1 词汇的数量级分布情况

 

⑵我国对教育技术学理论的独创贡献还很小

471条词汇中,中国教育技术领域独创的、有关教育技术理论与实践的词汇一共有17个,只占3.60%,其中只有3个属于核心词汇,它们是“电化教育、教育信息化、信息化”;有5个属于边缘词汇,它们是“技术化教育、知识网络图变形法、角色分析、知识网络图、知识组件”,另外属于中间词汇的9个词汇是“电化教学、电教、积件、积件库、技术人造物、潜件、群件、娱教技术、支助服务”。

新思想的出现必然表现为新范畴、新词汇的使用。我国独创的词汇中只有3个词汇属于核心词汇,而且它们都具有宏观的语义。代表着思想细节的“积件”、“知识网络图”、“群件”等词汇并没有成为核心词汇,它们所代表的思想并没有被广泛承认。总体看来,我国对教育技术学理论的独创贡献还很小。

 

⑶一些被忽略的研究

1 部分相关强度数据

词汇A

词汇B

相关强度

网络课程

教学

768.812

网络课程

设计

699.681

网络课程

课程

677.491

网络课程

交互

354.201

网络课程

共享

167.083

网络课程

积件

9.249

网络课程

知识分类

0.976

网络课程

目标模式

0.5

网络课程

复杂性理论

0

 

我们计算了核心词汇与其他词汇的相关强度,并对相关强度进行了排序。比如,表1是“网络课程”与部分词汇的相关强度数据,最大相关强度是768.812,最小的相关强度是0

我们发现考察高相关的词汇对我们并没有什么启发,比如,“网络课程”与“交互”高相关、“教学设计”与“教育技术”高相关,等等。然而对低相关词汇的考察却带给我们一些发现。

我们将相关强度小于1.0的界定为低相关。有些词汇与核心词汇低相关是正常的,可是有些低相关则暴露了理论研究的不足。比如 “复杂适应系统”与“教育技术”、“教学设计”、“网络教学”、“网络教育”的相关强度都为0、“复杂性理论”与“教育技术”的相关强度为0.8,等等,这些低相关关系,说明教育教学系统的复杂性并没有引起足够的重视和研究。“可选择性”与“网络教学”、“网络课程”呈低相关,这说明我们在建设网络课程和研究网络教学时,并不认为“可选择性”是一个重要属性。“学习支架”与“网络教学”、“自主学习”、“网络教育”、“网络课程”呈低相关,这说明我们在从事这些方面的思考时,视野中并没有“学习支架”,虽然我们有些研究者单独讨论过支架式教学。

 

⑷一些聚类对比分析的结论

从图2可以看出,建构主义已经成为我国教育技术领域的理论背景,而认知主义、行为主义已经不占统治地位,人本主义也远没有建构主义影响大。

2  几个主义的对比                3 几个新技术应用的对比

从图3可以看出,并非所有的新技术出现都能带来教育技术理论与实践的大发展。一些技术的教育应用只是“一闪而过”。新技术的出现,的确会引发研究者的兴趣。但是新技术只有在社会生活中足够普及后,才可能带来教育领域的相应大变化。比如,从图4可以看出,网络技术已经成为教育技术领域的基本实践条件。“技术的普及”已经不是“技术”本身,而是与技术有关的社会条件了。所以,我们认为,教育技术的发展动力并不是技术本身,而是适当的社会条件。教育的发展从来都是从属于社会发展的,而不是从属于技术发展的。

从图5可以看出,一直有人在思考着教育教学系统的不确定性、多元性、非线性和复杂性等属性,但是从频度数据上看,这些关键属性却没有收到足够多的人重视。

4网络技术词汇频度随时间的变化       5 教育教学系统的各属性对比

四、一点讨论

本研究的过程和一些结论参杂着一些主观因素,比如文献样本的选取、人工干预歧义切分、分布系数和相关强度的计算方法选取、核心词汇划分标准的确定等。这些因素都会直接或间接地影响最后结论的可靠性。然而,这些主观因素的参杂是这类话语分析研究无法规避的,所以建议读者对本文提出的初步结论保持警觉。



* 本文是教育部人文社会科学研究青年基金项目《教育技术学的技术哲学基础研究》(批准号:05JC880045)阶段性成果