欢迎浏览杂志社官方网站
科技论文

面向管理与决策的中国科技创新图谱研究

 基于大数据的管理与决策已经成为时代发展的趋势,科技信息大数据的形成与发展必将对科技管理与决 策产生深远的影响。通过可视化技术展示和预测科技创新发展的历史、现在和未来,有助于科技管理与决策的科 学化和民主化。在顺应基于大数据的科技管理与决策的潮流下,通过调研国内外科技管理与决策领域的研究与应 用状况,中国科学技术信息研究所率先开展中国科技创新图谱研究、开发与应用,基于海量、多源的科技创新要 素数据,利用大数据分析方法与技术,特别是可视化技术,在时间、空间及创新专题等维度,呈现中国的科技创 新的发展状况,辅助科技创新管理与决策。目前,中国科技创新图谱研究主要结合创新城市科技监测与评估开展 研究与应用,从世界和国家的宏观层面,到中观的区域省市,再到微观的组织机构乃至个体科研工作者,展现中 国城市科技创新的发展状况,创新要素的分布和流动,分析预测发展趋势与规律,支撑创新城市的建设,特别是 城市科技创新的管理与决策。中国科技创新图谱应用研究及成果推广将在我国各级政府在科技创新管理和决策中 发挥重要的支撑作用。

关键词 科技创新图谱;科技管理;科技决策;大数据;可视化分析

1 引 言

随着大数据时代来临,大数据对人类社会发展 已经产生了深远的影响。大数据不仅改变了人类的 生产生活方式,还深刻影响并改变了人类的思维方 式。大数据中蕴含着巨大的价值,如何认识、理解 和运用大数据产生更大的价值,成为学术界和产业 界共同关心的问题。从海量数据中发现知识,寻找 隐藏在大数据中的模式、趋势和相关性,揭示各种 社会现象与社会发展规律,都需要有更好的数据洞 察力。

在信息分析与管理决策过程中,数据是重要的 依据和基础,而正确地解读数据则是关键。可视化 作为一种技术手段,对于分析数据、理解数据以及 管理决策起到重要的帮助作用。数据可视化借助于 图形化手段,意在清晰有效地传达与沟通信息。进 入大数据时代,可视化技术日益发挥重要的作用。 可视化技术通过计算技术和图形图像技术,使隐含 于数据之中不可见的现象成为可见,为人们洞察数 据的内涵、理解数据蕴藏的规律、找到数据之间的 关联以及发现隐藏在数据背后的知识提供了重要的 手段。

大数据热潮不断升温,越来越多的机构部署使 用了大数据平台,并建立起基于大屏幕显示的可视 化系统平台,用于数据信息的可视化展示并进一步 支持管理决策。大屏可视化展示不仅能够多方位展 示实时信息起到数据新闻的作用,还可以通过直观 形象的方式传递信息,有助于系统用户快速了解大 数据中蕴含的信息、理解局势并做出判断决策。

大数据对科学研究和科技发展也产生了深远影 响。科学研究已经进入到数据密集型时代,不仅自 然科学研究面对大数据的分析与计算,社会科学研 究、政策和创新研究等也越来越依赖大量的数据作 为分析和决策的基础。此外,工业企业选择技术与 产业发展方向、制定路线,都离不开对相关技术、 产品大数据的分析。

科技创新对建设创新型国家具有重要意义,如 何利用大数据支撑科技创新管理与决策成为重要的研究问题并且极具应用价值。城市作为科技创新的 主要阵地,建设创新城市是建成创新国家的关键。 对创新型城市建设而言,创新资源的管理[3]以及创新 决策都需要大数据的支撑。如何利用科技信息大数 据支撑科技管理与决策成为科研工作者、管理决策 者、企业家以及风险投资人等共同面临的问题。从 宏观的国家创新管理与决策,到中观的行业、产业 发展管理与决策,再到微观机构组织乃至个人的科 研管理与决策都有大数据支持决策的强烈需求。

2 相关研究

现代社会科技研究活动日益活跃,众多的科研 活动中产生了海量的数据共同形成了科技大数据。 科技大数据的组织与可视化紧密相关,可视化是对 经过数据组织的结构化数据的可视化图形展示,而 科技大数据的合理组织则是可视化的基础保障。

2.1 知识图谱

知识图谱(Knowledge Graph)是由 Google 于 2012 年提出的概念。知识图谱由知识以及知识之间 的关系组成。知识之间的关系通过两个实体之间相 连接的边来表示。本质上,知识图谱是一种揭示实 体之间关系的语义网络,可以对现实世界的事物及 其相互关系进行形式化地描述。现在的知识图谱已 被用来泛指各种大规模的知识库。

知识图谱的构建方法通常有自顶向下和自底向 上两种。所谓自顶向下的方法是指先构建知识图谱 的本体,即从行业领域、百科类网站及其他等高质 量的数据源中,提取本体和模式信息,添加到知识 库中;而自底向上的方法是指从实体层开始,借助 于一定的技术手段,对实体进行归纳组织、实体对 齐和实体链接等,并提取出具有较高置信度的新模 式,经人工审核后,加入到知识图谱中。然而,在 实际的构建过程中,并不是两种方法孤立单独进行 着,通常是两种方法交替结合的过程。在构建多数 据源的知识图谱时通常结合两种方法,首先采用自 顶向下的方式来构建本体库,然后采用自底向上的 方式进行提取知识来扩展知识图谱。不同的学科领域已经陆续建立学科知识图谱,其中生物医疗等领 域走在知识图谱建设工作的前列

2.2 科学知识图谱

人类利用形象思维将数据映射为形象视觉符 号,从中发现规律,进而获得科学发现,其中可视 化技术对重大科学发现起到重要作用。大数据可视 化分析将成为大数据时代科技创新管理和决策的新 手段。科技管理与决策所依赖的可视化技术中,科 学知识图谱(Mapping Knowledge Domains)是其中 非常重要的一项。科学知识图谱可以作为宏观层面 跟踪科技前沿、选择科研方向、预测学科发展、开 展知识管理与辅助决策的有效工具。科学知识图谱 和知识图谱的侧重点不同,表现为:知识图谱侧重 于知识组织,本质上是用语义网络的知识表示方法 将知识点和事实数据进行关联组织;科学知识图谱 则侧重于利用可视化技术对知识点之间的关联进行 图形化展示,主要目的是通过可视化结果支持科技 发展规律发现及趋势分析。

科学知识图谱兴起于 20 世纪末期,其发展过程 可以划分为如下阶段:在初始阶段,主要是研究人 员基于自身兴趣展开的自由探索,其开发的工具普 遍具有功能单一、界面简单等特征。在发展阶段, 研究机构和信息服务企业开始重视和投资开发功能 全面、界面友好、兼容性强的软件工具。在应用阶 段,随着科学知识图谱和可视化技术成为信息科学 的研究热点,集成数据清洗、数据分析、数据挖掘、 知识可视化等多领域技术进步成果的大型综合性软 件工具开始出现,并在不同的行业领域广泛应用。

世界各主要国家地区,特别是传统科技强国, 都在科学知识图谱和可视化技术方面开展了研究工 作。通过科学知识图谱和可视化技术开发与应用研 究,为研究机构、企业、政府等提供从技术到内容、 从开发到分析、从设计到传播的全面信息支持服务, 利用可视化工具设计出很多面向经济和科学决策、 科普等方面的精美知识图谱。这些科学知识图谱和 可视化技术方面的成果和活动已经产生了巨大社会 影响。在科学知识图谱和可视化技术发展方兴未艾 的阶段,美国就已经认识到它的重要价值,并开始 通过国家公共资金渠道投入和打造知识图谱和可视 化技术开发与应用研究团队。美国印第安纳大学 Katy Borner 教授组建科学知识图谱和可视化技术开 发与应用研究团队开展“知识领域可视化”研究。

随着数据挖掘技术、科学计量学、信息计量学和计算机技术的不断发展和进步,科学知识图谱和 可视化技术的应用范围在不断扩展,呈现出从知识 组织展示,到发展规律分析,再到技术预见与决策 支持的发展路径。传统的科学知识图谱是以科学计 量学原理为基础,通过简单图表直观地表达了一些 科学统计结果。主要应用范围集中在知识组织呈现, 例如利用文献共词、共引和耦合、合作网络分析等 基础理论,研究知识或文献的组织规律和发展脉络。 进入 20 世纪以来,随着数据挖掘领域的进展和高性 能数据计算能力的提高,科学知识图谱和可视化技 术的应用扩展到对科学问题发展规律的分析,在研 究某学科的全球发展结构,分析科技人才队伍结构 和协作情况,检测科技产出与影响力分析、发展趋 势跟踪等方面发挥重要作用。2005 年通过可视化技 术发现并展示了生物化学和生物工程稳步地进入化 学领域,并对化学领域的知识基础产生影响。近年 来,在技术预见和宏观决策支持领域中,科学知识 图谱和可视化技术已经开始发挥重要作用。

2.3 基于文献数据的决策需求

除了科研机构进行科学知识图谱研究外,传统 的科技信息服务公司基于海量文献信息数据库也不 断推出可视化分析产品与服务。汤森路透、爱思唯 尔集团在各自研发大型文献数据库的基础上,重点 研发和推出了集成数据分析、数据挖掘、知识可视 化等多领域技术的大型综合性软件工具平台。汤森 路透推出的 InCites 工具,能够帮助政府和学术研究 机构中的决策者、科研管理人员分析本机构的学术 表现和影响力,并针对全球同行的研究成果进行比 较。爱思唯尔研发的 SciVal 从可视化视角衡量一个 机构多年来在科学领域的研究表现。将各个专题领 域的总体规模进行量化,使机构能了解其研究的重 要性和市场份额及其在领域内的竞争排名。

基于海量文献信息数据库基础的科学知识图谱 分析软件工具的发展方向,一是分析学科主题与领 域发展状况和规律。构建一个学科主题的按时间维 度发展的图谱,反映学科的衍生、发展、成熟和衰 退状态。同时,可利用关键词共现网络的分布,识 别学科热点和发现研究前沿。二是分析科学家、研 究团队、机构、国家的产出分布、合作和相互关系。 展现国家、机构、团队、科学家等不同层次的科研 合作网络,定位空间和时间分布情况。三是表现科 技投入与科技产出的关系。将科技投入与产出的状 况和关系在一起集中展示,直观地展示科技投入效果与效率。这些应用都为政府和管理部门制定科技 规划和布局提供了有效的决策支持。

在大数据时代下的科技管理与决策需要决策 机构具备“智慧决策”的能力,即对海量数据的挖掘和 分析能力、对抽象和复杂体系的模拟及发展预测能 力,以及对潜在风险和机会的识别和管理能力[10]。 科学知识图谱和可视化技术的发展,正是从这几个 方面提供了更多工具和方法,将科学发展的全貌进 行整合、分析,从中提炼出最具意义的信息,以多 视角的、精确的、易读的和深刻的形式展现。科学 知识图谱和可视化技术的发展信息科学和相关领域 技术进步的综合体现,其中融合了数理统计与分析、 系统分析与数据库技术开发、高性能计算与建模、 复杂软件系统架构、专用硬件系统开发、创新图表 设计等众多领域的研究成果与突破,以事实数据为 基础,结合专家智慧,支持科技管理决策部门更加 深刻和确切地掌握科技事业发展规律与进展态势, 为科技规划、科技决策等提供支撑,助力科技管理 实现“智慧决策”。

3 中国科技创新图谱:概念与目标

3.1 概 念

中国科技创新图谱综合利用文本分析、信息组 织、数据挖掘与可视化等关键技术,面向科技管理 与决策需求,实现中国科技创新信息数据的动态、 交互、可视化展示,用于分析国家、区域、省、市 等多个层次的科技创新发展状况,发现蕴含的科技 创新规律,预测未来科技创新发展趋势,支持国家、 区域、省、市乃至创新主体等多个层面的科技创新 管理与决策。

为了对中国科技创新状况进行了解和分析,需 要可视化展示科技创新现状,并进行各个方面的创 新数据分析。对中国科技创新的监测与评价可以分 为国家、区域、省/直辖市/自治区以及区县级城市等 不同层级。其中,城市科技创新通过区域协同构成 区域科技创新城市群,而科技创新城市群进一步形 成国家级的宏观科技创新状况。中国科学技术信息 研究所结合城市创新监测与评价工作开展了中国科 技创新图谱研究,从城市科技创新的监测与评估入 手,研究中国区域乃至国家的创新发展。

建设创新城市对于建成创新型国家具有重要意 义。由于城市聚集了绝大部分的创新力量包括人才、 资金、知识、技术等,建成创新型国家必然需要建成众多创新城市。建设创新型城市是开展国家创新 活动、建设创新型国家的重要基地和力量之源,也 是探索城市发展新模式和推进城市可持续发展的迫 切需求。创新型城市主要由创新资源、城市创新载 体、城市创新平台、城市创新服务、城市创新环境 和城市创新通道等六大要素构成。城市创新资源 包括创新人才、创新企业、科研机构、大学教育、 金融投资、中介机构、政府机构等。城市创新资源 是建设创新城市和构建城市创新体系的重要基础, 创新资源越丰富的城市,其城市创新能力越强,城 市创新潜力和动力越大。创新城市建设迫切需要对 城市及其下辖区县科技创新状况进行监测、评估, 并制定相关的科技政策促进科技创新发展。

在科技创新决策时,如何通过可视化、交互直 观地了解科技创新状况,利用科技创新大数据发现 规律和存在的问题,对于科技创新发展有重要的支 撑作用。建设创新城市,需要对城市进行科学的管 理与决策。政府通过制定创新政策、开展创新项目, 引导创新资源的配置和发展方向。创新决策面临的 问题日益复杂,基于事实证据的科学决策已经成为 发展趋势。

3.2 目 标

中国科技创新图谱的目标是基于海量科技信息 资源,利用大数据分析和可视化技术展现科技创新 现状、发现创新规律、预测科技创新发展趋势、辅 助科技政策制定影响科技创新要素及科技创新绩效变 化,支撑科技决策促进科技创新发展、助力经济发展。

中国科技创新图谱系统秉承开放、集成、大数 据、交互、可视化的设计理念。由于科技创新的监 测与评估设计多来源、多类型的数据,只有开放和 集成才能实现综合科技创新数据并进行分析的目 标。科技创新活动活跃,经过多年积累的海量数据 与正在生成的科技信息数据形成了科技大数据,是 科技管理和决策数据基础。交互和可视化则是科技 管理与决策的需求,通过交互式访问、可视化呈现 有助于管理决策者快速直观地了解所需的数据和信 息,促进科技管理决策的科学化。

中国科技创新图谱系统将从多种信息资源收 集、加工开始,利用信息处理技术处理数据,分析 文本、对数据库的抽取建立实体之间的关联。基于 不同实体之间的关联,对不同信息资源的展示、科 技创新现状的监测、创新达标评价与预测,以及创 新要素在不同地点之间的流动。基于科技创新图谱平台,实现对科技创新现状的展示、通过可视化分 析工具辅助发现创新规律,辅助专家智慧进行科技 创新决策。


热门期刊