摘要:大数据时代的在线教育面占着资源量巨大而难以组织、异构资源之间没有统一描述而难以跨平台获取、资源之间缺乏关系而难以关联检索等问题。如何构建适应大数据持征的组织框架以实现基于海量在线教育资源的模式创新,是推动大数据时代互联网教育发展的关键所在。该文提出了一种在线教育资源百科型大数据组织框架,其持点在于:首先,通过轻量级的资源链接方式,实现教育资源大数据在同一平台内的汇集;其次,通过基于知识图谱方式,实现教育资源的统一语义描述和关系刻画,消除资源歧义性并实现资源间语义级别的知识点关联;最后,通过百科型词条以及分级目录方式,实现资源的优化查询与检索。
关键词:大数据,在线教育资源,知识图谱,组织框架
一、引言
随着互联网和大数据时代的到来,在线教育及其应用模式得到了飞速的发展,MooC等形式的在线教育和线上课堂走进了广大用户的家庭。以美国为例,各大教育机构凰教育院校均通过某种形式发布在线教育资源(OniineEducationResource-OER),鼓励学生通过互联网进行学习。我国近年来的在线教育资源也呈现出爆发式增长趋势。在线教育资源的优势在于:以数字资源的形式部署于互联网环境下,满足用户使用所需的易获取凰可重用凰可共享等需求;资源通过互联网得到更为有效的组织,实现教育资源的易检索凰可移动访问等优点。这些优势促使在线教育迅速成为人们获取教育的重要渠道之一,也成为人们实现自我教育方式转变的关键推动力。
然而,随着互联网教育资源的日益增长和不断累积,在线教育资源已经呈现出大数据的典型特征:(1)海量性,即资源数量巨大;(2)多样性,即资源种类繁多;(3)高速性,即资源保持高速增长的态势。由此可见,人们在互联网和大数据时代,在线教育资源高效利用面临着巨大挑战:人们在获取在线教育资源时往往面对着无数资源信息,而缺乏有效的指引和搜索导航,导致教育资源的信息迷航;教育资源来源多样性而导致冗余信息过度,用户无法辨别真伪;教育资源快速增长致使大量资源杂乱分布在多个不同的站点,缺乏统一途径对这些教育资源进行分类存储和统一组织。可以说,如何对互联网中海量的在线教育资源大数据进行有效的组织管理,促使在线教育资源获得更为优化的服务模式,已经成为当前亟待解决的关键问题。
实现在线教育大数据资源有效应用面临着以下关键问题:(回)海量网络资源的组织框架问题,即提供轻量级资源组织管理的一体化框架,整合全网教育资源的同时避免单一平台承载大数据容量负担,其目的在于为用户提供在线教育资源获取入口,并对资源进行开放式分类管理;(2)在线教育资源的统一组织和描述问题,即对各种来源的教育资源进行统一的资源描述,使其具有规范的凰标准的表达方式,其目的在于消除在线教育资源的异构性和歧义性;(3)在线教育资源的知识关联模式问题,即在各类教育资源之间建立知识关联,使各类教育知识点之间通过准确的语义实现关联,其目的在于通过教育资源之间的知识关联实现知识点关联,进而便于资源检索和推荐;(4)在线教育资源的查询优化问题,即在海量数据的前提下,如何组织和优化查询方法,尽量缩短用户响应时间,提升用户体验。
针对上述问题,本文提出了一种大数据时代在线教育资源百科型组织模式,其特点在于:(1)为在线教育资源提供百科型组织框架,通过开放式百科模式为用户呈现结构化凰分类化的在线教育平台入口,融合来自全网的教育资源和数据链接,实现资源的获取导航;(2)在组织模式框架底层定义规范化资源描述格式,对来自互联网的多源在线教育资源进行统一描述,便于在框架中对资源进行自动分类凰检索凰推送等;(3)在组织框架中定义教育领域知识图谱,在各类教育知识点(资源实体)之间建立知识关联关系,使图模型为基础的教育知识点(资源实体)以图网络方式得到关联化表示,从而为资源提供链接凰跳转凰推理等规则;(4)在组织框架中采用分层架构,将各个功能点相对分离,以实现各层之间的宽松耦合,也便于后期的扩展和维护。并且使用冷热数据分离方法控制数据响应时间,从而优化资源查询速度。
二、在线教育资源组织模式
(一) 互联网中在线教育资源的传统组织模式
在线教育资源组织的目的在于通过互联网处理凰存储和传播教育资源,并且支持与教学相关的管理与通讯。在大数据时代,为了避免资源管理的冗余性凰复杂性,提升用户获取资源的便捷性凰准确性,在线教育资源组织必须将多源异构的资源实现有机组织和关联。根据语义信息将多源异构资源有机地联系在一起,达到可查询凰可追溯凰可比较凰可保障的目标。
为了提高在线教育资源的服务质量,传统的互联网分类方法是目前最为流行的组织模式。基于网络分类的在线教育服务模式具有诸多优点:首先,在线服务让教育资源可以被大众共享,提高资源复用性;其次,互联网部署方式降低开销,提高开发的效率,提升服务的质量;第三,互联网分类为教育资源提供了有效索引结构,便于用户按类别检索,也便于网站按类别分类存储。现有的在线教育资源,诸如基于云计算的服务提供,让教育资源能够更稳定的被用户访问。在我国,各大高校也通过第三方互联网平台发布了大量的在线教育资源。
然而,传统在线教育资源组织技术模式的瓶颈在于:(1)资源管理分类目录大多为人工设置,分类目录结构直接决定资源组织类别,不合理的分类直接导致资源管理难度加大,海量资源缺乏自动标注亦导致精确资源检索难以实现;(2)传统分类方法无法解决海量教育资源之间的知识B动关联问题,使教育资源碎片化存在,难以形成智能化地提供关联学习应用模式;(3)传统教育资源组织技术模式局限于单一网站内,由于互联网各网站海量资源之间存在描述异构凰标签语义不一致凰资源种类繁多,难以在统一平台中存储并整合多源异构的海量教育资源,难以统一服务。
上述问题亟待突破的关键在于:如何提供一种适应大数据环境的在线教育资源组织模式,解决:(1)具备分类知识语义描述的资源分类规范;(2)教育资源的自动关联;(3)海量教育资源的精确查询与应用导航;(4)多源异构教育资源的统一开放管理与描述等问题。
(二) 大数据在线教育资源组织模式的关键要素分析为了适应在线教育资源组织使用所需要满足的统一组织凰资源跨平台使用凰关联检索等需要,同时避免单一平台内海量资源大数据存储查询的巨大负担,新型在线教育资源组织应满足的关键要素包括以下方面:
回.分类规范,即建立按照学科凰方向等为分类标准的树形分类目录,在不同的树形目录中给出类别标签语义,满足OER在分类书中获得关键类别标注的需要。本文设计的分类规范所采用的树形目录中可明确给定任意类别的规范语义,即{类别名,父类别,子类别集合,类别属性集合}等元数据。同时,应定义类别推理规则,用以在分类树中依据确定的类别语义推理出与其相关联的类别,进而计算类别之间的相似性等数值。
2.知识关联,即海量OER均可以视为可使用的资源实体(Entity),通过一种知识关联性视角使教育资源展现在用户面前。本文设计的关联通过知识图谱实现,提供任何两个资源及其之间的关联关系表述,其形式为{主体,关系,客体}三元组。由于知识图谱在表达关系时灵活度高凰表达式简单凰存储方便,其能够在框架内提供良好的资源关联。
3.资源导航,即利用百科模式,通过分类树为用户提供教育知识点词条分类导航;继而在用户所关卜的教育知识点词条中,提供与该词条说明相关联的邻近词条,然后通过知识图谱分析与这些词条相关联的教育资源,并给出资源的评估参数,包括来源网站凰可用性凰可靠性凰质量评价等附加信息,便于用户通过参数自我评估后选择使用。