欢迎浏览杂志社官方网站
计算机论文

大数据时代机器学习的关键技术论文发表要点

当下,机器学习的论文发表研究与实际运用过程中最为常见且相对关键的核心技术主要包含集成的学习、半监督式的学习与概率图模型学习以及迁移式的学习。

大数据时代机器学习的关键技术论文发表要点

一、集成学习

在现实之中,群体决策通常高于个体决策,尤其是群体之中见解均不同的情况。在机器学习中同理,集成学习是指整合复数不同学习系统得出的结果,以便获得超出个体学习系统的理想学习效果。通过集成学习,哪怕是更为简单的学习系统也可以得到更为理想的学习效果。此外,集成学习所具备的架构特性原本就适合并行处理,可以为提高大数据时代背景下的训练效率和测试效率奠定较为符合预期的基础。传统机器学习的核心在于检索,检索全部的可能函数并相应地构造假设空间集合,以便从中选取最为贴合未知函数的相近函数。而在统计、计算与表示层面会面临一定的问题,可用的训练数据同时存在很多,甚至存在复数精确度相近的不同假设,其或许会在相同的训练数据上得到相同的表现,但换用新的数据则会出现较大偏差,而使用集成学习的简单平等投票则可以避免这些问题。

二、半监督式的学习与概率图模型的学习

参考传统机器学习的理论框架,机器学习可以分为有监督的学习和无监督的学习。前者使用的是有标识数据,后者则仅仅使用未标识数据。进入大数据时代后,论文发表数据采集和数据存储方面的技术高速发展,大量未标识数据的收集逐渐变得轻而易举。同时,大量的有标识数据则需仰赖领域内专家的帮助,不仅极其耗时耗神,还需要面对容易出现错误的风险。因而在现实之中,未标识数据在数量方面已经远超有标识数据,只有充分地利用未标识数据,机器学习所得模型的泛化能力才可以得到保障。大数据的发展对于处理海量不确定数据提出了较高的要求,而不确定数据广泛存在于各行各业,通过这些不确定数据分解出信息并相应地获取知识逐渐成为大数据分析的重点发展目标。概率图模型是概率论与图论结合后的产物,是图形化表现概率实际分布的结果,为把握随机变量之间错综复杂的依赖关系并构造规模较大的复数变量统计模型创造了统一的条件。

大数据时代机器学习的关键技术论文发表要点

三、迁移式的学习

进入大数据时代后,大量崭新的数据出现在各行各业,只有获得海量有标识数据的训练用数据,才可以在崭新的数据处理上运用传统的机器学习方法。针对各行各业差异化地设置训练数据需要占用大量的人力物力,而在不同场景间迁移转化知识的能力可以相应地解决问题。迁移式的学习在传统的机器学习之中较为匮乏,根源是传统的机器学习通常要求论文发表学习的知识与应用的场景具备一致的统计特征。当二者彼此分离之后,相关统计特征会随之发生改变,统计学习的效率会大幅降低。而迁移式的学习可以较好地解决该问题,其主要借助源头任务中的相关知识相应地提升目标任务中的学习效率与学习性能,这不仅可以帮助计算机掌握更为有效的学习能力,还可以推动机器学习相关研究的发展。

本文标签: 计算机论文发表
热门期刊