本文摘要:摘要:在信息时代背景下大数据技术得到快速发展,在诸多领域发挥出越来越重要的作用。大数据时代的到来对科技情报研究提供了更多新思路与新方向。为此,就大数据的概念以及在科技情报研究领域的应用技术进行论述,并探讨了大数据时代背景下科技情报研究工作的
摘要:在信息时代背景下大数据技术得到快速发展,在诸多领域发挥出越来越重要的作用。大数据时代的到来对科技情报研究提供了更多新思路与新方向。为此,就大数据的概念以及在科技情报研究领域的应用技术进行论述,并探讨了大数据时代背景下科技情报研究工作的对策。
关键词:大数据;科技情报研究;对策
0引言
随着网络信息技术的快速发展以及海量数据处理能力的增强,进入了大数据时代。在大数据时代促使产业提升、科技发展的一个有效手段就是探索基于大数据处理技术的动态情报解决策略。伴随移动终端与智能手机的大范围普及,公众自身的信息数据都可能成为被记录与分析的数据。这给科技情报研究工作带来了新机遇与新挑战。
1大数据的定义与特点
关于大数据的定义尚未形成统一的标准,主流观点认为这是一种数据量非常大、数据形式多元化的非结构化数据。维基百科中将大数据定义为所包含的数据量规模庞大到难以通过当前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策目的的资讯[1]。
情报论文投稿刊物:《广东科技》(半月刊)创于1992年,是由广东省科技厅主管、广东省科技情报研究所主办的综合性科技刊物,国内外公开发行的广东省唯一综合性省级科技刊物,是反映广东省科技与经济发展的窗口。本刊坚持以促进科技成果转化、科技创新为目标,融新闻、科技、经济、信息、产业、市场、服务为一体,内容丰富、时代感强,是推动科技进步、加强技术创新、发展高科技、实现产业化的重要宣传阵地。
它的特征可归纳为“4V”:①Volume。数据容量巨大,搜集与分析的数据量巨大,一般数据量规模可超过10TB。②Variety。数据种类多,来源广,格式多元化。③Velocity。数据流动速度快,大数据通常是以数据流的形式出现,数据流动速度极快,传统系统难以处理。④Value。价值密度低,尽管数据量呈指数级增长,但隐藏在其中的有用信息并未实现对应比例增长,反而增加了获取有用信息的难度[2]。可见,尽管大数据拥有很好的潜在价值,但若受限于传统思维与技术,则容易被淹没在数据海洋中,难以获取有用信息。
2科技情报研究工作中应用的大数据技术
2.1数据挖掘研究技术
从广义上来讲,数据挖掘是指知识的发现过程是从大量的、有噪声的、不完全的、模糊的、随机的实际应用数据中提取出人们事先不知、隐含在其中但有用的信息与知识的过程。该技术涉及到的学科领域很多,除了统计学、算法外,还包括数据库、机器学习、模式识别、高性能计算等技术[3]。
根据数据挖掘的定义可以发现它与情报研究有着密切的关联。利用数据挖掘技术能够有效解决情报研究问题。运用该技术对目标关联规划进行研究,进而发现科技情报中存在的转换关系。根据科技情报研究工作的需要,运用大数据技术开发相关数据挖掘工具,借助智能化辅助分析功能,提高科技研究人员的工作效率,缩短研究时间。将数据挖掘技术应用于科技情报研究工作中,首先对研究任务做好种类划分,运用数据挖掘技术的类别功能,归纳整理这些研究任务的共同点与差异性,构建数据挖掘技术适用于科技情报研究工作的适用标准。然后,数据挖掘技术的组合形式及相关算法应围绕研究任务的实际情况作出恰当的修正,对挖掘数据进行合理评价等等,这些都是科技情报研究工作对数据挖掘技术提出的要求。
2.2智能化研究技术
智能化技术涉及领域广泛,涵盖了神经网络、网络分析、机器学习、模式识别、遗传算法、预测建模等诸多学科知识。运用智能化技术开展科技情报研究工作,可实现对高级、复杂信息的智能化分析处理[4]。这能够减轻工作人员的工作强度,使其有更多精力去研究方法的优化以及研究结果的应用。在信息技术高速发展的背景下,科技情报研究对象不再局限于传统的报刊杂志书籍,还应注重网络信息,比如网络上的图片、音频、视频等信息。运用相关技术手段对上述网络信息数据进行结构化处理,为智能化技术的应用做好准备。面对多元化的数据时,智能化技术应根据对象来分析,从语义层面上给予技术支持。
此外,传统的统计分析难以适应信息海量增长的时代需要,而应借助机器学习、模式识别等技术来开展科技情报研究工作。运用智能化技术能够避免很多人为因素的干扰,提高研究结果的准确性与真实性。
2.3可视化技术
科技情报研究对象具有信息分散、数据结构多样的特点,过去主要以人工分析为主,容易受到各种非结构性与不确定性因素的干扰,因此,很难形成规则的分析模式与分析流程,从而增大了数据挖掘规则的难度。基于此,可通过可视化数据分析技术来解决,构建完整的可视化图表进行分析。通过图表可以了解全部数据信息,而且也能看到数据分析的过程以及数据链的走向,便于研究人员对数据进行关联性分析,再辅以人工操作。可视化平台具有多种视图,用于显示数据信息,利用网络分析、空间分析、信息分析等研究手段来协调人机间的交互沟通,便于工作人员对分析结果的理解与运用。
3大数据时代做好科技情报研究工作的对策
3.1强化大数据观念科技情报研究人员首先要树立起大数据意识,充分认识到大数据对科技情报研究工作带来的机遇与挑战,掌握大数据技术,善于运用这些技术来挖掘分析科技情报信息。为此,科技情报研究所应加强对工作人员的教育培训,组织他们学习大数据技术,了解各种大数据分析技术方法,提高大数据应用水平,更好地推动科技情报研究工作的开展。
3.2科学利用各种数据源
情报研究的结果会对社会产生深远的影响,因此,必须确保情报分析结果准确可靠。这需要从源头抓起,在分析数据的过程中加以完善与丰富。情报研究工作比较复杂,各种信息源的特性也明显不同,因此,综合运用多种信息源已成为科技情报研究的重要趋势[5]。
研究人员需从问题出发,将全部信息资源进行系统化整合,用于情报研究。其中,信息源不仅包括学术论文、专利等文献资源,也包括文本、数据、各种正式或非正式出版物。研究人员应先熟悉各种信息资源的特性,清楚相似信息在不同资源类型中的具体表现及不同信息源之间存在的联系。然后,根据待分析问题选取恰当的信息。此外,研究人员要将不同信息源分析出的结果进行有效的组织、综合、解释,尤其是结论发生矛盾时,能够识别不当结果,确保分析结果的准确性是非常关键的。
3.3加强对数据的清洗与过滤处理
科技情报研究人员在大数据时代面临着海量的处理数据,这些数据通常良莠不齐,可能造成分析结果错误,降低决策的正确性。大多数数据库具有动态特征,很多数据是冗余的、不完整的,甚至是不正确的,从而给数据的识别发现造成困难。为此,在进行数据挖掘处理时可先对数据作预处理,即数据净化与过滤,将部分无关数据删除。加强对数据质量的管控,从而增强数据分析的准确性,提升情报工作效率。这是由于数据的体量仅仅属于大数据的一个特征,大数据的核心价值在于数据的价值、传递速度以及持续性。
4结语
大数据时代促使宏观经济环境发生了显著的变化,为科技情报研究工作带来了新机遇与新挑战。为此,科技情报研究人员应具备大数据意识,合理运用大数据技术开展科技情报研究工作,不断提高科技情报研究结果的准确性、科学性与合理性,最大限度挖掘出科技情报研究的内在价值,促进社会生产力的转型升级。
参考文献:
[1]彭家义.浅析大数据时代科技情报工作面临的机遇与挑战[J].低碳世界,2017,35(28):289-290.
[2]夏雪.基于大数据的科技情报研究刍议[J].江苏航空,2014,16(2):21-23.
[3]原毅玲.大数据时代科技情报研究工作探索[J].信息技术与标准化,2015,22(7):46-48.
[4]蒋卓然.“大数据”时代情报工作面临的机遇与挑战[J].吉林广播电视大学学报,2016,11(4):73-75.
[5]姚旭.基于大数据环境下的科技信息方法研究[J].决策与信息,2015,21(3):152-153.
作者:王荣花
转载请注明来自发表学术论文网:http://www.fbxslw.com/jjlw/25819.html