本文摘要:摘要数据科学作为一门应用型学科,在很多领域都发挥着重要的作用。目前,许多国内外高校纷纷在不同学科领域开设数据科学及相关专业,以应对大数据产业日益增大的人才缺口。本文通过遍历QS图书与信息管理专业排名前50的学校官网,对图书情报、经济与工商管理
摘要数据科学作为一门应用型学科,在很多领域都发挥着重要的作用。目前,许多国内外高校纷纷在不同学科领域开设数据科学及相关专业,以应对大数据产业日益增大的人才缺口。本文通过遍历QS图书与信息管理专业排名前50的学校官网,对图书情报、经济与工商管理、计算机科学与技术、数学与统计学科背景的数据科学相关硕士专业的开设现状、培养目标、入学要求、课程设置、职业前景进行对比分析。相比其他三个学科,图书情报学科开设的数据科学硕士专业具有浓厚的图情色彩,更加注重“以人为本”的理念。但是也存在领域和实践类课程开设较少的问题,是今后图情学科数据科学相关专业努力的方向之一。
关键词图书情报;数据科学教育;课程研究;人才培养
0引言
我们生活在一个数据爆炸的新时代,社交媒体、金融交易、交通运输甚至科学研究每时每刻都在以不断增长的速度产生大量的数据。对海量数据的分析与理解成了各大领域亟待解决的问题,大数据产业应运而生。2015年,国务院印发《促进大数据发展行动纲要》,提出要全面推进大数据发展,加快建设数据强国。随后,工信部编制印发了《大数据产业发展规划(2016-2020年)》,进一步明确了促进行业大数据应用发展、加快大数据产业主体培育等7项任务及8项重点工程。数据产业的发展带来了新的人力资源需求。从2016年数联寻英发布的全国首份《大数据人才报告》中我们可以看出,目前大数据产业人才供不应求,截至2016年7月15日,中国的大数据人才仅46万,在未来3-5年内大数据人才的缺口将高达150万[1]。
面对巨大的人才缺口,高校纷纷设立数据科学相关专业,以培养大数据应用型人才。数据科学作为一门跨领域学科,将计算机科学领域与数学统计领域专业知识相结合,以培养具有管理和分析数据能力的专门人才。数据科学家不仅需要具有从大量数据中得到有用信息的洞察力和分析能力,而且需要熟悉所处具体领域的相关知识。因此,开设数据科学相关专业,培养数据科学人才成为目前高等教育的重要趋势,众多高校在不同学院均设立了数据科学相关专业。例如,密歇根大学安娜堡分校信息学院开设了在线应用数据科学硕士专业,在计算机科学与工程学院、统计系也设立了数据科学硕士学位。我国也顺应时代发展的潮流,在不同的学科门类下纷纷开设数据科学相关专业。
根据教育部印发的《普通高等学校本科专业目录(2020版)》,我国于2015年在计算机学科门类下增设数据科学与大数据技术本科专业,于2017年在管理科学与工程类门类下增设大数据管理与应用专业。在今年发布的新增专业目录中,还在医学技术类下增加了生物医药数据科学专业。同时,根据我国研究生招生专业目录,多个学科下均开设了数据科学研究生项目,如经济学的商业大数据分析专业,理学、工学及管理学的数据科学专业。目前,数据科学专业主要集中开设在图书情报、经济、计算机、数学、统计等领域[2]。
因此本文选取了图书情报、经济与工商管理、计算机科学与技术、数学与统计学四个学科背景,筛选出国内外19所学校四个学科背景下的61个数据科学相关研究生教育项目,通过对比其开设现状、培养目标、学科背景需求、课程设置、职业前景,分析图书情报领域数据科学相关硕士项目开设的特色及不足,并对培养方案提出改进建议。
1研究现状
1.1数据科学教育研究现状
“数据科学家”被DavenportTH称为是21世纪“最性感的”职业[3]。海量数据的激增及科学技术的发展对大数据人才能力素养的要求逐渐增高,越来越多的学者开始重视数据科学教育的发展。目前国内外对数据科学的教育还处于探索阶段,相关研究主要分为以下三种:
(1)以现有的数据科学人才为研究对象,挖掘数据科学人才应具备的各项技能。一种方法是通过调查数据科学职员的用户档案,分析数据科学家之间的共性。Jerina[4](2017)等调查了菲律宾从事数据科学工作的员工LinkedIn档案,从他们的简介中提取学历背景、个人技能等信息,发现数据处理及可视化、编程、数学与统计相关的技能是数据科学家必须具备的能力。另一种方法是采用问卷调查、访谈或德尔菲研究的方式,对数据科学家反馈的信息进行分析。Chen,Jiang[5](2020)等人对国内的数据科学家开展德尔菲研究,旨在探讨成为中国成功数据科学家所具备的技能清单。
(2)是从职业需求出发,研究成为数据科学人才所具备的能力和素养。招聘广告中一般包含了对人才的学历、能力等要求以及对岗位的职业描述,已经有多项研究通过内容分析对数据科学家招聘广告进行了分析。朝乐门[6](2021)等人广泛搜集了包括八个国家在内的数据科学家的网络招聘信息,对岗位要求和职责描述进行了聚类挖掘,总结出数据科学家的主要职责和能力要求,为人才培养提供指导建议。Aasheim[7](2018)利用职业名称中包含“大数据”的招聘广告信息,建立了大数据学科技能概念模型,该模型表示数据科学家需具备的技能是复杂多样的,不仅包括传统的开发技能,而且需要具备团队合作、沟通技巧、领导力等软技能。
(3)是从现有开设的数据科学专业项目出发,总结数据科学专业的人才培养模式。从教育方法层面,Il‐YeolSong[8]等人(2016)调查了美国15所提供数据科学教育的大学,提出应该在数据科学教育中采用多种方法,如教授CDO(首席数据官)学科、教学中融入八步数据分析生命周期、多部门协作、与行业或政府进行实践合作、积极使用MOOC等。从课程设置层面,苏日娜[9]等人(2019)以15所iSchools高校作为调研对象,从课程目标、授课方式、课程制度等方面对图书馆与信息科学领域数据科学研究生项目的课程体系进行了探讨。从能力素养层面,Renata[10]等(2016)调研了美国机构提供的93个数据科学学位,总结出数据科学教育非常重视统计、数学和计算技能,包括高级编程和建模,其中许多能力是申请该学位的先决条件。
1.2不同学科背景下的数据科学教育研究
由于数据科学是一门交叉性和应用性极强的学科,许多研究者立足本领域对数据科学专业教育进行了探索。在经济与商业领域,张永亮[11]等(2021)对国内外5所代表性高校的大数据专业的设立、课程、培养特色等方面进行了分析,总结了经管类学院大数据专业建设的特点,对商科背景下数据科学人才培养提出了建议。
在计算机科学领域,桂劲松[12]等人(2018)遵循国际工程教育认证标准,对工科背景下数据科学与大数据技术专业的培养方案和培养模式进行解读,深入探讨该专业的建设思路。在数学与统计学领域,温雅敏[13]等人(2017)重新思考了大数据时代统计专业人才培养的定位,提出要培养具备数据分析和实践能力的复合型人才的创新教学培养模式,并构建具有大数据分析特点的科学课程体系。
图书情报领域的数据科学教育研究也比较多,苏芳荔[14](2021)以美国图书馆协会发布的与数据相关的招聘信息为研究对象,通过对职位名称、能力要求、岗位职责进行分析,明确数据科学人才的工作需求,为图情领域数据科学专业的人才培养和课程设计提供帮助。经过文献调研发现,数据科学教育在信息管理、计算机科学与技术、数学与统计学等学科均有开设,现有研究都是纵向研究,即专注于某一特定学科,缺乏不同对学科下数据科学教育的横向对比。
考虑到目前数据科学本科教育尚处于起步阶段,大多数知名大学都只提供数据科学研究生教育[8],而且主要途径大多为硕士水平[15],本研究以图书情报、经济与工商管理、计算机科学与技术、数学与统计学四个不同学科背景下开设的数据科学研究生项目为研究对象,分析比较他们在培养目标、课程设置与特色等方面的异同,找到图书情报学科开设数据科学的优势与不足,从而促进图书情报背景下数据科学专业课程体系建设与人才培养。本研究主要解决以下两个问题:(1)图书情报、经济与工商管理、计算机科学与技术、数学与统计学背景下数据科学相关专业开设的情况是怎样的?(2)与其他三个领域相比,图书情报学科的数据科学专业有哪些优势与不足?
2调查对象及研究方法
2.1调查对象
本研究的重要目的之一是通过横向对比分析,以发现图书情报学科开设数据科学研究生教育的特色及不足,因此本文以2020年QS世界大学学科排名(QSWorldUniversityRankingsbySubject)中图书馆与信息管理(Library&InformationManagement)专业排名前50的学校为调查对象,通过遍历这50所学校的网站,收集图书情报、经济与工商管理、计算机科学与技术、数学与统计学四个学科所开设的数据科学相关研究生教育项目。同一学校上述4个学科有2个及以上开设了数据科学相关研究生教育项目的高校被纳入本研究。
由于各大高校开设大数据专业的名称不尽相同,为了统一数据收集的标准,本研究制定了三条标准:(1)研究生项目开设的目标是提取数据的价值,以帮助决策和解决现实问题;(2)侧重于培养与数据挖掘、数据分析和数据建模相关的技能;(3)毕业生的职业前景包含数据管理员、数据科学家、数据分析师、数据工程师等。经筛选,最终19所学校的61个数据科学相关研究生教育项目被纳入。通过逐个访问各项目的官网,上述61个研究生教育项目的项目描述、开设课程、课程描述等信息进行获取。
2.2研究方法
扎根理论是一种定性的社会学研究方法,这种研究方法的本质是从数据中系统地生成理论[16]。研究者在进行研究之前通常不进行理论假设,而是通过对收集到的资料进行拆解、编码,在此基础上寻找杂乱数据背后的核心概念,最后建立概念之间的联系以达到对理论的认识。扎根理论主要通过逐级编码,对资料中的每一条信息进行分类、概况及说明,从而从原始资料中归纳出经验或特征,产生新的概念或范畴。
扎根理论编码分为三个不同层次:①一级编码又称开放性编码,通过将原始资料打散,并进行逐字逐句编码,最后赋予标签;②二级编码又称主轴式编码,是对已经形成的一级编码进行深度分析,比较、分类、综合并重新排列,最终得到更上位的概念。③三级编码又称核心式编码,是对二级编码的进一步归纳、合并和总结,最终建立反应原始资料的初步理论。本文使用扎根理论对专业描述、入学要求、课程名称及描述、职业前景的信息分别进行人工编码,将收集到的官网信息进行分解、标注、概念化和类属化,最大限度描述原始信息。
3不同学科数据科学相关硕士专业设置情况
本节分为五部分。第一部分对四门学科包含项目的数量进行了统计,分析了目前各学科开设数据科学相关硕士项目的现状。第二部分对专业描述字段进行编码分析,明确各学科数据科学硕士项目培养目标的异同。第三部分对入学要求字段进行编码分析,理解各学科数据科学硕士项目对申请人学科背景要求的异同。第四部分对课程名称及课程描述进行编码,分析各学科数据科学硕士项目在课程设置上的异同。第五部分对项目提供的职业前景进行编码,分析各学科数据科学硕士项目在毕业生就业方向上的异同。
4图书情报学科开设数据科学项目的特点
4.1与图书情报学科相融合
数据科学是一门融合计算机、数学、统计等学科的综合交叉科学。从申请人的相关学科背景来看,数据科学硕士项目更欢迎有计算机科学、数学或统计学背景或具备一定基础知识的学生。与其他学科不同,图书情报学科的数据科学项目也鼓励具有人文背景的学生申请。从课程体系设置来看,不同学科的数据科学项目均设置了计算机、数学与统计等基础课与数据管理、数据分析等实践课,但领域类课程大不相同,如图书情报学科的元数据、信息组织、情报学基础等。相比较其他学科,图书情报学科背景下的课程体系兼具图书情报特色,计算机、数学与统计学课程偏重基础,可能与部分生源为人文学科背景有关。从职业前景来看,不同学科背景的数据科学硕士项目没有明确的职业界限,但对于一些管理类、信息服务类岗位,图情学科的毕业生更加受欢迎。
4.2以实践为导向
从课程设置上来看,应用与实践类课程和数据分析与建模类技术课程在课程体系中占比均较大,说明数据科学是一门实践导向的应用型学科。计算机科学与技术和数学与统计学科下的数据科学专业涉及的应用领域更加广泛,同时结合就业领域融入特定学科的课程,如医学、生物学、金融等基础课程。与其他学科相比,图书情报学科的数据科学项目的实践课程带有浓厚的图情特色,如知识媒体应用、信息处理与检索专题、图书情报学专题等,也有比较少其他领域的应用,如文本检索及其在生物医学中的应用、机器学习与计量经济学实践等。
因此,面向实践,善于理解用户需求,着重培养学生解决现实生活中实际问题的能力、支持决策制定是图情学科开展数据科学教育的重要导向。但是,与其他学科相比,图情学科的数据科学项目应用与实践类课程较少,涉及领域比较局限,主要集中在本学科领域,还需要增加实践课程的比例,可以采用与其他学院联合办学的方式,提供更多领域的基础知识和实践项目,拓展学生知识的广度,培养社会所需、满足发展要求的复合型数据科学人才。
4.3坚持“以人为本”的理念
随着人工智能逐渐渗透到我们工作、生活的各个领域,人们对于人工智能中人的价值的关注越来越高。而关注信息和数据实践中的人为因素一直是图书情报学科研究的一部分,但对于数据科学教育来说还是一个比较新的话题[18]。从各学科数据科学硕士项目培养目标与课程体系设置的对比中可以发现,相比于其他学科更注重计算和统计教育相比,图书情报学科中的数据科学硕士项目不单一依赖技术与算法,而是更加注重培养学生的信息素养,以善于理解用户需求,提高对数据、模型的解释。
同时将以用户为中心的理念引入课堂,关注于学生个人特质的塑造,培养学生的批判性思维、人际沟通的能力,并挖掘人在数据分析中的价值。大数据技术带来便利的同时,也带来了一系列令人困扰的伦理问题,如信息安全、数据污染、隐私侵害等[19]。面对这些问题,图书情报学科的数据科学项目为学生提供了整个数据科学生命周期中与法律、政策和道德问题相关的挑战、理论和解决方案的概述,如数据科学伦理学、信息隐私、信息政策及法规和法律等。这也体现了图情学科坚持“以人为本”的数据科学教育。
5总结
随着人才需求的不断增长,数据科学专业也得到了迅速的发展。作为一个交叉性和应用性极强的学科,数据科学逐渐渗透到各个行业。国内外高校也纷纷在各大学院开设大数据与数据科学相关专业。本文收集了来自图书情报、经济与工商管理、计算机科学与技术、数学与统计学四大学科开设数据科学相关专业的有关信息后发现,为了将数据科学与本领域更好地融合,不同的学科背景有着不同的培养目标与培养方案。
图书管理论文:浅析信息社会环境下图书馆服务的创新与发展
与其他三个学科相比较,图书情报学科的数据科学专业更加具有人文特色,对于计算机与数学基础要求不高,除开设数据分析、机器学习等数据科学基础课程之外,也开设了一些图情类、管理学课程。同时图情学科的数据科学专业更加注重以人为本,培养学生理解大数据的人文价值和社会价值。但是应用与实践类课程开设较少,提供更多的领域实践类课程、提升学生的技术水平、培养学生应用能力是今后图情学科数据科学相关专业的努力的方向之一。
参考文献
[1]中国首份《大数据人才报告》发布[J].大数据时代,2016(1):71-73.
[2]曾粤亮.国外iSchools数据科学项目人才培养模式的特点与启示[J].图书情报知识,2018(4):109-118.
[3]DavenportTH,PatilDJ.Datascientist:thesexiestjobofthe21stcentury[J].HarvBusRev.2012Oct;90(10):70-6,128.
[4]JerinaJeanEcleo,AdrianGalido.SurveyingLinkedInProfilesofDataScientists:TheCaseofthePhilippines[J].ProcediaComputerScience,2017,124.
[5]Chen,Jiang.ImportantSkillsforDataScientistsinChina:TwoDelphiStudies[J].JournalofComputerInformationSystems,2020,60(3).
[6]朝乐门,肖纪文,王解东.数据科学家:岗位职责、能力要求与人才培养[J].中国图书馆学报,2021,47(3):100-112.
[7]Gardiner,Aasheim,Rutner,Williams.SkillRequirementsinBigData:AContentAnalysisofJobAdvertisements[J].JournalofComputerInformationSystems,2018,58(4).
[8]Il‐YeolSong,YongjunZhu.Bigdataanddatascience:whatshouldweteach?[J].ExpertSystems,2016,33(4).
[9]苏日娜,杨沁.LIS学科中数据科学课程体系设置研究——以iSchools高校课程调研为中心[J].图书馆论坛,2019,39(4):40-49
作者:吴丹,孙雅琪,许浩
转载请注明来自发表学术论文网:http://www.fbxslw.com/jylw/27588.html