图书馆建设

期刊导读

大数据技术在图书馆数据中的应用研究

来源:图书馆建设 【在线投稿】 栏目:期刊导读 时间:2021-05-08

0 引言

在互联网信息时代,现代网络科技的迅猛发展助力图书馆行业发生了巨大的变革,转变了传统图书馆的构成模式、阅读渠道,也随之改变了图书馆的管理与服务方式。尽管从大数据技术应用层面来看,现代图书馆在资源获取、图书内容、阅读服务等方面颠覆了人们对原有图书馆的认知,然而从社会地位性、认可度方面来看却不及传统图书馆时期。究其原因,主要还是信息化的便利性使得读者改变了传统的阅读方式,很多读者不再往返于图书馆耗时耗力获取资料,这也成为现代图书馆在转型期发展的阵痛,我国图书馆行业正面临着重大的机遇和挑战[1]。因此,如何在大数据时代,利用网络科技的力量获得成功转型、重新得到读者青睐,现已成为图书馆行业的重要使命。

1 大数据与图书馆

在大数据时代各行各业都与数据挂钩,“大数据”这个名词已经脍炙人口,如今社会企业、医疗机构、高等院校、金融领域等都在分析使用大数据。大数据技术让人们从数据系统中获取到更多有深度价值的信息资源,帮助人们及时做出重大决策,这也对大数据研究提供了重要依据。鉴于存储、分析大数据所需的软硬件成本较低而实用性很强,这也就使得越来越多的行业对大数据产生了兴趣,传统图书馆行业更要在逆境中求生存、化阻力为动力,利用大数据技术转变管理及服务模式。在现代图书馆管理中,大数据技术能够将图书馆数据转化为信息资源,为读者提供个性化服务。因此,当前大量的大数据研究都在分析图书馆大数据的应用问题,力求通过大数据技术优化图书馆工作效率及服务品质。在大数据背景下,现代图书馆数据库具备以下特点:

1.1 图书馆数据组织复杂

从图书馆表面管理来看,图书馆中的各类图书、杂志、刊物等数据组织井井有条,读者可以通过类别查询所需内容;然而针对存储的图书研究数据却不尽人意。通常大部分图书馆的数据较为混乱,数据研究者惯于使用自我认知来分类组织数据,这些数据通常经项目管理,而项目完成了数据也就受到封存。

1.2 无规范数据格式

数据研究者在组织数据时没有规范格式标准,尽管有些图书学科或领域已创建数据标准,然而大部分学科往往都缺少规范化,尤其是政治、社会研究这类集中的数据库。此外,数据格式也缺乏统一性,数据研究者惯于用自己的格式对数据进行收集,即便是同一个数据研究者,不同数据格式也会用于不同项目,这就给收集数据带来很大阻力[2]。

2 当前图书馆大数据存在的不足

图书馆数据库中所存储的数据庞大,鉴于图书多源异构的特征,这个大数据也不同于其他数据领域,因此在图书馆数据收集、处理、分析及转换等方面均存在一定问题。图书馆大数据要获得科学合理应用,其应用技术区别于其他领域,这也正是当前图书馆大数据存在的不足之处。

2.1 行业紧缺图书馆数据分析师

作为图书馆数据分析师,不但要掌握基本的计算机和统计学技术,同时必要具备图书馆管理领域知识和技能。当前,大部分图书馆之所以在大数据技术方面应用不足,主要是专业人员技术力量的不足,图书馆管理人员更需要加强大数据信息的管理培训,这是一个循序渐进的过程,绝非靠短期突击学习所能达成。

2.2 利用大数据的能力不足

在互联网信息时代,大数据的挖掘来源于行业各个领域,现在很多行业并未实质做好大数据的研究准备工作。据了解,社会半数以上的行业机构因缺少专业人才、应用平台而无法实现大数据的处理及应用。然而,图书馆行业的大数据研究起步甚至更晚,究其原因主要还是基于图书馆更像是一个独立的组织单位,自成一体与其他行业的关联性不强。

2.3 图书馆成本投入不足

尽管现在很多人都明白应用大数据分析的优势,但大数据研究还需要一些较大的成本投资,比如高性能的计算机服务系统、分析服务系统等。基于有些图书馆规模较小、成本预算不足,无法将大数据技术普及到图书馆实际管理中;同时专业人才成本较高,其所研究数据极少能受到充分重视也是问题之一。据了解,当前很多图书馆研究数据仍为多年前所产生的,显然资源数字化本非一项简单工作,还需要耗费大量的时间和精力。

2.4 具备技术挑战难度

大数据要实现使用功能,必须要经过数据收集、存储、处理、转换等环节,通过这些技术应用才能呈现真实的数据信息。图书馆数据库中的数据类型多且杂,其数据表象不同,一些数据没有数字化;同时大量数据中还包含了许多错误、无意义的数据,要排除这些无用数据则需要花费更多的数据处理时间。鉴于图书馆数据类型、格式的特异性,大数据研究者要将其实现集成必定是一项庞大且困难的工作,很多类型的数据看似具备可用性,实则在通过处理之后其可用性会明显降低;同时基于数据的可访问性,图书馆数据库发生系统入侵的风险问题也必须慎重考虑。

上一篇:区块链技术与图书馆图书漂流服务 下一篇:没有了