精华内容
下载资源
问答
  • 工程教育专业认证下数据科学与大数据技术专业Python数据分析及可视化课程大纲.pdf
  • 数据科学与大数据技术专业建设研究实践.pdf
  • 工程教育背景下数据科学与大数据技术专业课程体系设计.pdf
  • 北京物资学院数据科学与大数据技术专业.pdf
  • 数据科学与大数据技术专业课程体系探索.pdf
  • 试卷代号 1479 座位号仁二 国家开放大学2020 年春季学期期末统一考试 Python 程序设计试题 2020 年 9 月 I: :1 - I 二 I 三 I 四 I 总分1 一选择题选择一个正确答案的代码填入括号中每小题 2 分共 尸 30 分 1....
  • 2017年5月 目 录 一专业产生的背景 二专业获批情况 三相关专业的差异 四培养方案应重视产学研相结合 五培养方案应高度重视实践环节 六专业申报案例贵州师范大学 一专业产生的背景产业发展催生 美国政府发布 3月1日...
  • 高考结束,同学们还没过上几天开心到劈叉的日子,就要面临一个直击灵魂的问题:你想好报什么专业了吗?这些年,在大数据和人工智能的背景下,企业对数据科学家的需求正在持续增长。在人才需求巨大的缺...

    高考结束,同学们还没过上几天开心到劈叉的日子,就要面临一个直击灵魂的问题:你想好报什么专业了吗?这些年,在大数据和人工智能的背景下,企业对数据科学家的需求正在持续增长。在人才需求巨大的缺口下,从 2015年至2019 年,全国有612 所高校成功申报“数据科学与大数据技术”本科专业。我国高校“数据科学与大数据技术”教育工作全面开花,稳步推进,目前正处于快速普及与高速发展阶段。作为最有前景的专业之一,数据科学与技术专业受到越来越多考生的欢迎。这里,我们整理了一份关于大数据相关专业的报考指南,如果你也想进入这个科技最前线,不妨先看完本文再决定报考哪个院校。

     

    一、数据科学专业相关介绍

     

    “数据科学与大数据技术”本科专业是 2016 年我国高校设置的本科专业,专业代码为 080910T,学位授予门类为工学、理学,修业年限为四年,课程教学体系涵盖了大数据的发现、处理、运算、应用等核心理论与技术,旨在培养社会急需的具备大数据处理及分析能力的高级复合型人才。

     

    由于数据科学专业是一门横跨数学、计算机及相关专业领域的交叉学科,因此在高招时主要划分在这两个院系下:计算机系和数学统计系。此外,一些应用学科,比如金融专业、经贸等也会在自己的专业下设置相关课程。

     

    数据科学与大数据技术专业都学些什么?

     

    该专业以统计学、数学、计算机为三大支撑性学科,生物、医学、环境科学、经济学、社会学、管理学为应用拓展性学科。此外还需学习数据采集、分析、处理软件,学习数学建模软件及计算机编程语言等,知识结构是有专业知识和数据思维的复合跨界人才。

     

    以中国人民大学为例:

    基础课程:数学分析、高等代数、普通物理数学与信息科学概论、数据结构、数据科学导论、程序设计导论、程序设计实践。

    必修课:离散数学、概率与统计、算法分析与设计、数据计算智能、数据库系统概论、计算机系统基础、并行体系结构与编程、非结构化大数据分析。

    选修课:数据科学算法导论、数据科学专题、数据科学实践、互联网实用开发技术、抽样技术、统计学习、回归分析、随机过程。

     

    目前申报了数据科学与大数据专业的高校有:

    第一批(3所):北京大学、对外经济贸易大学、中南大学;

    第二批(32所):中国人民大学、复旦大学、北京邮电大学、华东师范大学、电子科技大学、北京信息科技大学、中北大学、长春理工大学、上海工程技术大学、上海纽约大学、浙江财经大学、广西科技大学、昆明理工大学、云南师范大学、云南财经大学、重庆理工大学、晋中学院、福建工程学院、黄河科技学院、湖北经济学院、佛山科学技术学院、广东白云学院、北京师范大学-香港浸会大学联合国际学院、成都东软学院、电子科技大学成都学院、贵州大学、贵州师范大学、安顺学院、贵州商学院、贵州理工学院、宁夏理工学、宿州学院。

    第三批(283所):

    链接:

    https://pan.baidu.com/s/1aYXDfCjSPln10RnzM6DKQg 密码:a3dc

     

    录取分数不低

    从往年数据科学与大数据技术专业的录取情况看,该专业的录取分数还是比较高的。以对外经济贸易大学和重庆理工大学为例,2017年对外经贸大学数据科学与大数据技术专业在京理科一批录取最高分653分,最低分646分,平均分650分,平均分高出北京一本批次线113分。

    重庆理工大学理学院院长李波介绍,该校数据科学与大数据技术是2017年获批后开设的。尽管该专业属于本科二批招生,但首批数据科学与大数据技术专业所招73名学生的平均分超一本线20分左右,并且第一志愿录取率达百分之百。

     

    二、专业发展前景

     

    大数据技术已经在互联网、银行保险等金融机构、交通运输、航空航天、医疗、公共卫生、国防等众多领域广泛应用。数据成为企业最宝贵的资源,大数据分析技术在提升企业经营管理、提高销售业绩、降低管理成本等方面发挥着日趋重要的作用。根据中国信通院数据,我国大数据核心产业规模2017年为236亿元,同比增长40.5%,到2020年将达到586亿元,2015-2020年间年均复合增长率达38.26%。

     

    一方面是迅猛增长的产业规模,另一方面大数据相关人才高度稀缺。根据主流数据媒体调查,全国目前的大数据人才仅46万,未来3-5年内大数据的人才缺口将高达150万。人才的紧缺注定了这个领域的高薪。以Hadoop开发工程师为例,Hadoop入门月薪达8K以上,1年工作经验1.2W以上,2-3年工作经验的年薪30万—50万,一般需要大数据处理的往往都是大公司,学习大数据专业也是进大公司的一条捷径。

     

    大数据领域三个大的技术方向:

    1、Hadoop大数据开发方向; 所涉及的职业岗位为:大数据工程师、大数据维护工程师、大数据研发工程师、大数据架构师等;

    2、数据挖掘、数据分析和机器学习方向; 所涉及的职业岗位为:大数据分析师、大数据高级工程师、大数据分析师专家、大数据挖掘师、大数据算法师等;

    3、大数据运维和云计算方向;对应岗位:大数据运维工程师。

     

    精通任何一个方向,未来就业都前景可期。

     

     

    三、报考建议

     

    目前,开设数据科学与大数据专业的学校如此之多,究竟选择哪一所,主要还是看准师资实力和专业特色。

     

    当前我国高校开设本专业的模式主要有两种:

     

    一种是高校自主开设。如果高校在计算机科学一些前沿技术领域实力较强,或者在数学、统计学、数据挖掘、机器学习等方面有较强的师资团队,是非常值得报考的。比如北京大学是在数学院开设了该专业,偏数学的内容更多一些,致力于培养运用统计分析、机器学习、分布式处理等技术,能从大量数据中提取对科学研究和生产实践有意义的信息,以可视化等技术通过通俗易懂的形式传达给决策者,并创造出新的数据运用服务的人才。

     

    还有一种是校企合作办学。这种模式中,高校负责基础理论方面的教学,企业负责专业技术及实践方面的教学,侧重培养应用型人才,在就业方面较有优势。

     

    例如贵州理工学院与阿里云合建的“贵州理工学院——阿里巴巴大数据学院”,计划在5年内为贵州省培养1万名大数据专业技术人才;黄河科技学院是与中科院、云和数据以及中国科普开等知名大数据相关研究机构及公司开展交流合作,在学校建立联合实验室、在企业设立学生实训基地,实现更好地培养人才。

     

    此外,还有很多高校将大数据与自身的特色专业相结合,例如有的大学在信息学院开设本专业,有的在计算机学院,还有的在经管学院。比如对外经济贸易大学该专业设在信息学院,因为财经是学校传统优势,专业还会偏重经济、金融等相关学科领域的知识;复旦大学甚至成立了专门的大数据学院,并在同一个专业下设置了更为细分的四个研究方向:数学类、经管类、技科类和自科类;中国传媒大学具备完整的全媒体大数据体系,开设的大数据专业带有传媒特色,学生在校期间就可以接触到海量影视大数据、新闻大数据、音频大数据等,对业务数据耳濡目染。总之,考生和家长可以从这类大学的传统优势学科、行业背景做出考虑。

     

    另外,如果有同学没有条件报考大数据相关专业、又特别想学习这方面内容,也可以从相关专业(比如应用统计学专业)跨考此专业的研究生,可实现快速切入,但还应注意关注行业发展最新状况并着重弥补能力差距。

     

    四、部分高校数据科学与大数据技术专业介绍

     

    下面,我们以湖北省为例,盘点了一部分高校数据科学与大数据技术专业针对湖北的招生及培养计划。

     

    复旦大学

    学院名称:大数据学院

    专业名称:技术科学试验班(卓越班,含复旦-澳大利亚国立大学“2+2”双学位项目和复旦-加拿大多伦多大学、复旦-比利时鲁汶大学等“3+1+1”本硕连读项目)

    招生人数:5人(2019年数据)

    录取分数:678分以上(2019年数据)

    综合水平:数据科学与大数据技术方向依托于复旦大学在数据库领域多年的研究历史,形成了具有较强实力的研究团队,多年来取得了丰硕的研究成果,在 SIGMOD、VLDB、ICDE、CCS 等领域的权威的学术会议和期刊上发表了多篇高水平的论文。同时,承担了多项国家自然科学基金、863、973、国防预研等国家项目,和 IBM、微软、SAP、EMC、Google、Baidu、华为等国内外知名企业建立了紧密的合作关系。并多次获得上海市科技进步奖(一等奖和二等奖)和教育部自然科学奖二等奖。2013 年,本方向建立了上海市数据科学重点实验室,这是国内第一个省部级的数据科学重点实验室。

     

    上海财经大学

    学院名称:信息管理与工程学院(工学)、统计与管理学院(理学)

    专业名称:数据科学与大数据技术

    录取分数:648分以上(2019年数据)

    培养方向:

    数据科学与大数据技术(工学)旨在培养具有扎实数据科学基础知识,掌握计算机技术、现代经济管理基本理论和具备大数据平台搭建、数据分析与建模、数据处理技术能力,能胜任大数据分析、处理、开发和研究等领域工作、特别是能以富有创新意识的数据思维解决金融、商务、营销、运营管理等财经应用领域预测与决策问题的高端复合型科技人才。

    数据科学与大数据技术(理学)的培养目标定位于综合掌握统计学、数学和计算机科学等多方面知识,能通过数据表象来理解内在逻辑和总体特征,从事大数据处理和统计分析并把握实际经济金融运行或者商业运作规律的复合型数据科学人才。

     

    综合水平:师资方面,目前与数据科学有关的师资达到25名,多来自北美名校,同时引进了从事机器学习和统计计算等相关研究领域的千人和特聘教授;实验室方面,上海财经大学统计与管理学院与国家统计局共建 “数据科学与统计研究院”,并配套建设了“数据科学重点实验室”。上海财经大学信息管理与工程学院已建成4个与大数据相关的实验室,包括:并行优化国际合作实验室(与斯坦福大学合作)、IBM联合大数据实验室、数据挖掘与人工智能实验室、金融信息工程实验室。

     

    西安电子科技大学

    专业名称:数据科学与大数据技术、数字媒体技术、大数据管理与应用

    录取分数:未知

    招生人数:未知

    综合水平:2019年,西安电子科技大学新增数据科学与大数据技术专业和数字媒体专业。2020年,新增大数据管理与应用专业。学校是国内最早建立信息论、信息系统工程、雷达、微波天线、电子机械、电子对抗等专业的高校之一,开辟了我国IT学科的先河,形成了鲜明的电子与信息学科特色与优势。在师资力量方面,焦李成教授、石光明教授等在学术界有较大影响力。

     

    对外经济贸易大学

    学院名称:信息学院

    录取分数:648分以上(2019年数据)

    招生人数:2人(2020年数据)

    培养方向:培养统计分析为基础,强调专业的理论性、实践性及应用性,培养具有较强的专业与外语能力,具备经济、金融、物流、商业、贸易、管理等相关学科的领域知识,并能胜任数据分析与挖掘算法研究和大数据系统开发的研究型和技术型人才。学生在入学后有机会通过二次选拔的方式进入数据科学与大数据专业(跨境电商)实验班,可为希望出国深造的学生提供美国、新加坡、澳大利亚等高校的短期交流项目及 3+1.5、3+2 等国际化本科 + 硕士学历项目。

    综合水平:对外经济贸易大学信息学院拥有学校唯一的“十二五”国家级现代服务业人才培养实验教学示范中心和北京市校外人才培养基地(中国国际电子商务中心);与 IBM、SAP 等世界知名企业建立了长期战略合作伙伴关系;师资方面,学院教师在国际知名期刊和国内核心刊物发表具有重要影响的学术论文数百篇,出版各种著作与教材近 100部,其中多部教材入选教育部规划教材并获得各类奖项。

     

    武汉理工大学

    学院名称:计算机科学与技术学院

    专业名称:数据科学与大数据技术

    录取分数:609分以上

    招生人数:20人(2020年数据)

    培养方向:培养系统地掌握数据科学与大数据领域理论、方法、技术及应用知识,能胜任大数据及相关领域的科学研究、设计开发与分析等多方面工作,并具有创新创业能力及国际竞争力的高素质人才。

    综合水平:师资方面全部具有博士学历,其中大多数教师具有海(境)外研究背景和经历,其教学方法新颖且紧跟前沿研究。另外,数据科学与大数据技术专业所在学院拥有计算机湖北省重点实验教学示范中心(学院实验中心获批湖北省普通本科高校优秀基层教学组织),华为ICT学院创新人才中心,“武汉理工大学-中软国际”和“武汉理工大学-中原电子”国家级实践教学基地及“科技部国家数字传播创新人才培养示范基地”等国家级和省部级人才培养基地。

     

    太原理工大学

    学院名称:大数据学院

    专业名称:数据科学与大数据技术

    录取分数:578分(2019年数据)

    招生人数:2人(2020年数据)

    培养方向:培养掌握数据科学的基础知识、理论及技术,具有扎实的面向大数据应用的数学、统计学以及计算机科学等基础知识,具有数据建模、算法设计、编程分析和处理实际数据的能力;了解工业、医药、信息、经济、社会、商业、教育等应用领域中的大数据技术及应用,具有较强的专业技术能力和良好的外语交流能力,能胜任大数据处理、大数据挖掘、大数据算法设计和大数据系统开发的研究型和技术型人才。

    综合实力:大数据学院拥有“太原理工大学科学云计算中心”、“高分辨率对地观测卫星系统山西数据与应用中心”、“山西省空间信息网络工程技术研究中心”、“山西省空间信息网络研究生教育创新中心”、“山西省工业智能大数据研究生教育创新中心”等教学科研平台;聚焦服务山西省转型跨越发展和山西省地方经济建设,对照“云聚山西”“云惠山西”“云殖山西”和“云安山西”四大工程,联合校内大数据相关科研力量,建设智能大数据研究中心、智能感知与大数据技术研究中心、社会治理大数据研究中心、工业大数据研究中心、公共安全大数据研究中心、医学大数据研究中心等科研团队。

     

    重庆邮电大学

    学院名称:计算机科学与技术学院

    专业名称:数据科学与大数据技术

    录取分数:577分以上(2019年数据)

    招生人数:26人(2020年数据)

    综合实力:学院近五年来牵头承担了国家重大专项国家自然科学基金、国家973计划、国家863计划、科技部攀登计划、国家发改委专项项目80余项国家级科研项目,教育部科学技术研究重点项目、重庆市科技攻关项目等200余项省部级科研项目,出版学术专著和教材20多部,发表学术论文1800多篇,其中SCI/EI收录900多篇,论著被他引9000多次。获授权发明专利50余项,取得一系列科研成果,获20多项国家、省部级科技奖励。

     

    北京信息科技大学

    专业名称:数据科学与大数据技术

    招生方式:该专业招生采用入校后二次选拔方式,面向所有被录取到北京信息科技大学的全日制本科生,综合高考成绩、英语分级考试成绩、数学分级考试成绩、专业面试成绩择优录取。

    录取分数:532分以上(2019年数据)

    招生人数:30人左右

    培养方向:培养熟悉计算机专业基本知识、方法和技能,掌握大数据系统与平台技术(数据采集、清洗、存储、计算等大数据系统与平台相关技术)、大数据分析与可视化技术(数据分析、人工智能、数据挖掘等大数据分析相关技术和数据可视化技术)、特定场景下大数据开发与应用等方面的基本工程能力,具备工程师所必需的学习与创新、沟通与表达、合作与交流等基本能力与素养,具有良好的职业发展力和适应力的工程师与专业管理人才。

    综合实力:学校以培养应用型人才为主,现有1个国家级教学团队,取得国家级教育教学成果特等奖1项、一等奖1项,北京市教学成果奖24项,列入国家级规划教材选题18本、北京市级精品教材22本、精品课程9门等成果。

     

    厦门理工学院

    学院名称:计算机科学与技术学院

    专业名称:数据科学与大数据技术

    招生条件:511分以上(2019年数据)

    培养方式:在大二专业分流后,专业将构建本科生团队,以4-5人为一队,实施“一队一导师”、“导师全程负责”的策略,坚持“产、学、研、用”深度结合,通过导师与企事业单位的横纵向课题合作,实施三个阶段(创新创业训练、企业项目实践、企业实习或高校实验室实习)经历的育人模式,逐步引导学生掌握实践项目开发与分析所需技能,形成复合型与应用型的大数据技术人才培养创新模式。 

    培养方向:培养针对健康医疗大数据、交通大数据、电商大数据、社交媒体大数据等应用领域,专注于网络数据爬取、海量数据存储、自然语言处理、时空数据分析、搜索引擎开发、数据可视化等技术,培养当前市场急需的大数据分析、系统研发、系统维护和管理的高素质应用型人才。 

    综合实力:拥有福建省医疗数据挖掘与应用工程技术研究中心,数字福建自然灾害监测大数据应用研究所,数据挖掘与智能推荐福建省高校重点实验室,厦门市智慧交通诱导工程技术研究中心,厦门理工学院数据挖掘与知识工程研究所等科研机构,与IBM、思科、智业软件、厦门科拓、甲骨文、用友软件、雅马哈、万安实业、中地集团、南方测绘集团、厦门精图、厦门银据、闽矿测绘院等50余家国内和本地企业开展产学研合作。

     

    西安财经大学

    学院名称:统计学院

    专业名称:数据科学与大数据技术

    招生条件:505分以上(2018年数据)

    招生人数:4人(2020年数据)

    培养方向:本专业培养具有数学、统计学与计算机科学的理论基础,掌握大数据的采集、处理、存储、分析与应用的理论、方法和技术,具备应用现代信息、网络技术对社会、经济领域的大数据进行收集、整理、挖掘和服务能力,能够在企事业、政府等部门从事大数据的整理、分析等工作,或在高等院校、科研机构进行大数据科研工作,能适应社会经济与科学技术发展要求、富有合作精神和实践能力的应用型创新人才。

    综合实力:统计学办学已经有60多年的历史,统计学专业为陕西省“一流专业”建设点,陕西省名牌专业,国家和陕西省两级特色专业建设点,陕西省创新试验区建设点,陕西省级实验教学示范中心;《统计学》、《抽样调查》等5门课程为陕西省精品资源共享课;统计学教学团队为陕西省优秀教学团队。

     

    大数据站在互联网“风口”,直接催热了大学的大数据专业。越来越多的高校启动大数据人才培养计划,以填补百万级的大数据人才缺口。不过,由于在数据科学与技术专业的建设上,投入资金和资源要求高、可借鉴经验不足、学生实践机会不多等因素,各高校在新专业的课程建设路上还是存在着很多挑战,教学质量也均在较大差异,考生和家长一定要全面分析自身兴趣和优势,冷静慎重地做出选择。

     

    最后,附上全国高校人工智能与大数据创新联盟针对全国已经开办数据科学与大数据技术本科专业的612所普通高校调研、综合打分后完成的《全国612所数据科学与大数据技术本科专业高校教育教学综合排名一览表》的前50所高校排名(不作权威性参考)。

    编辑:文婧

    校对:林亦霖

    展开全文
  • 数据科学与大数据技术是当今最前沿的科学技术,我校申请设立数据科学与大数据技术专业,是响应国家大数据产业加快发展的号召,为大数据所催生的新产业、新业态、新经济培养具备扎实数据分析和系统建构能力、了解数据...
  • 高考结束,同学们还没过上几天开心到劈叉的日子,就要面临一个直击灵魂的问题:你想好报什么专业了吗?这些年,在大数据和人工智能的背景下,企业对数据科学家的需求正在持续增长。在人才需求巨大的缺...

    高考结束,同学们还没过上几天开心到劈叉的日子,就要面临一个直击灵魂的问题:你想好报什么专业了吗?这些年,在大数据和人工智能的背景下,企业对数据科学家的需求正在持续增长。在人才需求巨大的缺口下,从 2015年至2019 年,全国有612 所高校成功申报“数据科学与大数据技术”本科专业。我国高校“数据科学与大数据技术”教育工作全面开花,稳步推进,目前正处于快速普及与高速发展阶段。作为最有前景的专业之一,数据科学与技术专业受到越来越多考生的欢迎。这里,我们整理了一份关于大数据相关专业的报考指南,如果你也想进入这个科技最前线,不妨先看完本文再决定报考哪个院校。

     

    一、数据科学专业相关介绍

     

    “数据科学与大数据技术”本科专业是 2016 年我国高校设置的本科专业,专业代码为 080910T,学位授予门类为工学、理学,修业年限为四年,课程教学体系涵盖了大数据的发现、处理、运算、应用等核心理论与技术,旨在培养社会急需的具备大数据处理及分析能力的高级复合型人才。

     

    由于数据科学专业是一门横跨数学、计算机及相关专业领域的交叉学科,因此在高招时主要划分在这两个院系下:计算机系和数学统计系。此外,一些应用学科,比如金融专业、经贸等也会在自己的专业下设置相关课程。

     

    数据科学与大数据技术专业都学些什么?

     

    该专业以统计学、数学、计算机为三大支撑性学科,生物、医学、环境科学、经济学、社会学、管理学为应用拓展性学科。此外还需学习数据采集、分析、处理软件,学习数学建模软件及计算机编程语言等,知识结构是有专业知识和数据思维的复合跨界人才。

     

    以中国人民大学为例:

    基础课程:数学分析、高等代数、普通物理数学与信息科学概论、数据结构、数据科学导论、程序设计导论、程序设计实践。

    必修课:离散数学、概率与统计、算法分析与设计、数据计算智能、数据库系统概论、计算机系统基础、并行体系结构与编程、非结构化大数据分析。

    选修课:数据科学算法导论、数据科学专题、数据科学实践、互联网实用开发技术、抽样技术、统计学习、回归分析、随机过程。

     

    目前申报了数据科学与大数据专业的高校有:

    第一批(3所):北京大学、对外经济贸易大学、中南大学;

    第二批(32所):中国人民大学、复旦大学、北京邮电大学、华东师范大学、电子科技大学、北京信息科技大学、中北大学、长春理工大学、上海工程技术大学、上海纽约大学、浙江财经大学、广西科技大学、昆明理工大学、云南师范大学、云南财经大学、重庆理工大学、晋中学院、福建工程学院、黄河科技学院、湖北经济学院、佛山科学技术学院、广东白云学院、北京师范大学-香港浸会大学联合国际学院、成都东软学院、电子科技大学成都学院、贵州大学、贵州师范大学、安顺学院、贵州商学院、贵州理工学院、宁夏理工学、宿州学院。

    第三批(283所):

    链接:

    https://pan.baidu.com/s/1aYXDfCjSPln10RnzM6DKQg 密码:a3dc

     

    录取分数不低

    从往年数据科学与大数据技术专业的录取情况看,该专业的录取分数还是比较高的。以对外经济贸易大学和重庆理工大学为例,2017年对外经贸大学数据科学与大数据技术专业在京理科一批录取最高分653分,最低分646分,平均分650分,平均分高出北京一本批次线113分。

    重庆理工大学理学院院长李波介绍,该校数据科学与大数据技术是2017年获批后开设的。尽管该专业属于本科二批招生,但首批数据科学与大数据技术专业所招73名学生的平均分超一本线20分左右,并且第一志愿录取率达百分之百。

     

    二、专业发展前景

     

    大数据技术已经在互联网、银行保险等金融机构、交通运输、航空航天、医疗、公共卫生、国防等众多领域广泛应用。数据成为企业最宝贵的资源,大数据分析技术在提升企业经营管理、提高销售业绩、降低管理成本等方面发挥着日趋重要的作用。根据中国信通院数据,我国大数据核心产业规模2017年为236亿元,同比增长40.5%,到2020年将达到586亿元,2015-2020年间年均复合增长率达38.26%。

     

    一方面是迅猛增长的产业规模,另一方面大数据相关人才高度稀缺。根据主流数据媒体调查,全国目前的大数据人才仅46万,未来3-5年内大数据的人才缺口将高达150万。人才的紧缺注定了这个领域的高薪。以Hadoop开发工程师为例,Hadoop入门月薪达8K以上,1年工作经验1.2W以上,2-3年工作经验的年薪30万—50万,一般需要大数据处理的往往都是大公司,学习大数据专业也是进大公司的一条捷径。

     

    大数据领域三个大的技术方向:

    1、Hadoop大数据开发方向; 所涉及的职业岗位为:大数据工程师、大数据维护工程师、大数据研发工程师、大数据架构师等;

    2、数据挖掘、数据分析和机器学习方向; 所涉及的职业岗位为:大数据分析师、大数据高级工程师、大数据分析师专家、大数据挖掘师、大数据算法师等;

    3、大数据运维和云计算方向;对应岗位:大数据运维工程师。

     

    精通任何一个方向,未来就业都前景可期。

     

     

    三、报考建议

     

    目前,开设数据科学与大数据专业的学校如此之多,究竟选择哪一所,主要还是看准师资实力和专业特色。

     

    当前我国高校开设本专业的模式主要有两种:

     

    一种是高校自主开设。如果高校在计算机科学一些前沿技术领域实力较强,或者在数学、统计学、数据挖掘、机器学习等方面有较强的师资团队,是非常值得报考的。比如北京大学是在数学院开设了该专业,偏数学的内容更多一些,致力于培养运用统计分析、机器学习、分布式处理等技术,能从大量数据中提取对科学研究和生产实践有意义的信息,以可视化等技术通过通俗易懂的形式传达给决策者,并创造出新的数据运用服务的人才。

     

    还有一种是校企合作办学。这种模式中,高校负责基础理论方面的教学,企业负责专业技术及实践方面的教学,侧重培养应用型人才,在就业方面较有优势。

     

    例如贵州理工学院与阿里云合建的“贵州理工学院——阿里巴巴大数据学院”,计划在5年内为贵州省培养1万名大数据专业技术人才;黄河科技学院是与中科院、云和数据以及中国科普开等知名大数据相关研究机构及公司开展交流合作,在学校建立联合实验室、在企业设立学生实训基地,实现更好地培养人才。

     

    此外,还有很多高校将大数据与自身的特色专业相结合,例如有的大学在信息学院开设本专业,有的在计算机学院,还有的在经管学院。比如对外经济贸易大学该专业设在信息学院,因为财经是学校传统优势,专业还会偏重经济、金融等相关学科领域的知识;复旦大学甚至成立了专门的大数据学院,并在同一个专业下设置了更为细分的四个研究方向:数学类、经管类、技科类和自科类;中国传媒大学具备完整的全媒体大数据体系,开设的大数据专业带有传媒特色,学生在校期间就可以接触到海量影视大数据、新闻大数据、音频大数据等,对业务数据耳濡目染。总之,考生和家长可以从这类大学的传统优势学科、行业背景做出考虑。

     

    另外,如果有同学没有条件报考大数据相关专业、又特别想学习这方面内容,也可以从相关专业(比如应用统计学专业)跨考此专业的研究生,可实现快速切入,但还应注意关注行业发展最新状况并着重弥补能力差距。

     

    四、部分高校数据科学与大数据技术专业介绍

     

    下面,我们以湖北省为例,盘点了一部分高校数据科学与大数据技术专业针对湖北的招生及培养计划。

     

    复旦大学

    学院名称:大数据学院

    专业名称:技术科学试验班(卓越班,含复旦-澳大利亚国立大学“2+2”双学位项目和复旦-加拿大多伦多大学、复旦-比利时鲁汶大学等“3+1+1”本硕连读项目)

    招生人数:5人(2019年数据)

    录取分数:678分以上(2019年数据)

    综合水平:数据科学与大数据技术方向依托于复旦大学在数据库领域多年的研究历史,形成了具有较强实力的研究团队,多年来取得了丰硕的研究成果,在 SIGMOD、VLDB、ICDE、CCS 等领域的权威的学术会议和期刊上发表了多篇高水平的论文。同时,承担了多项国家自然科学基金、863、973、国防预研等国家项目,和 IBM、微软、SAP、EMC、Google、Baidu、华为等国内外知名企业建立了紧密的合作关系。并多次获得上海市科技进步奖(一等奖和二等奖)和教育部自然科学奖二等奖。2013 年,本方向建立了上海市数据科学重点实验室,这是国内第一个省部级的数据科学重点实验室。

     

    上海财经大学

    学院名称:信息管理与工程学院(工学)、统计与管理学院(理学)

    专业名称:数据科学与大数据技术

    录取分数:648分以上(2019年数据)

    培养方向:

    数据科学与大数据技术(工学)旨在培养具有扎实数据科学基础知识,掌握计算机技术、现代经济管理基本理论和具备大数据平台搭建、数据分析与建模、数据处理技术能力,能胜任大数据分析、处理、开发和研究等领域工作、特别是能以富有创新意识的数据思维解决金融、商务、营销、运营管理等财经应用领域预测与决策问题的高端复合型科技人才。

    数据科学与大数据技术(理学)的培养目标定位于综合掌握统计学、数学和计算机科学等多方面知识,能通过数据表象来理解内在逻辑和总体特征,从事大数据处理和统计分析并把握实际经济金融运行或者商业运作规律的复合型数据科学人才。

     

    综合水平:师资方面,目前与数据科学有关的师资达到25名,多来自北美名校,同时引进了从事机器学习和统计计算等相关研究领域的千人和特聘教授;实验室方面,上海财经大学统计与管理学院与国家统计局共建 “数据科学与统计研究院”,并配套建设了“数据科学重点实验室”。上海财经大学信息管理与工程学院已建成4个与大数据相关的实验室,包括:并行优化国际合作实验室(与斯坦福大学合作)、IBM联合大数据实验室、数据挖掘与人工智能实验室、金融信息工程实验室。

     

    西安电子科技大学

    专业名称:数据科学与大数据技术、数字媒体技术、大数据管理与应用

    录取分数:未知

    招生人数:未知

    综合水平:2019年,西安电子科技大学新增数据科学与大数据技术专业和数字媒体专业。2020年,新增大数据管理与应用专业。学校是国内最早建立信息论、信息系统工程、雷达、微波天线、电子机械、电子对抗等专业的高校之一,开辟了我国IT学科的先河,形成了鲜明的电子与信息学科特色与优势。在师资力量方面,焦李成教授、石光明教授等在学术界有较大影响力。

     

    对外经济贸易大学

    学院名称:信息学院

    录取分数:648分以上(2019年数据)

    招生人数:2人(2020年数据)

    培养方向:培养统计分析为基础,强调专业的理论性、实践性及应用性,培养具有较强的专业与外语能力,具备经济、金融、物流、商业、贸易、管理等相关学科的领域知识,并能胜任数据分析与挖掘算法研究和大数据系统开发的研究型和技术型人才。学生在入学后有机会通过二次选拔的方式进入数据科学与大数据专业(跨境电商)实验班,可为希望出国深造的学生提供美国、新加坡、澳大利亚等高校的短期交流项目及 3+1.5、3+2 等国际化本科 + 硕士学历项目。

    综合水平:对外经济贸易大学信息学院拥有学校唯一的“十二五”国家级现代服务业人才培养实验教学示范中心和北京市校外人才培养基地(中国国际电子商务中心);与 IBM、SAP 等世界知名企业建立了长期战略合作伙伴关系;师资方面,学院教师在国际知名期刊和国内核心刊物发表具有重要影响的学术论文数百篇,出版各种著作与教材近 100部,其中多部教材入选教育部规划教材并获得各类奖项。

     

    武汉理工大学

    学院名称:计算机科学与技术学院

    专业名称:数据科学与大数据技术

    录取分数:609分以上

    招生人数:20人(2020年数据)

    培养方向:培养系统地掌握数据科学与大数据领域理论、方法、技术及应用知识,能胜任大数据及相关领域的科学研究、设计开发与分析等多方面工作,并具有创新创业能力及国际竞争力的高素质人才。

    综合水平:师资方面全部具有博士学历,其中大多数教师具有海(境)外研究背景和经历,其教学方法新颖且紧跟前沿研究。另外,数据科学与大数据技术专业所在学院拥有计算机湖北省重点实验教学示范中心(学院实验中心获批湖北省普通本科高校优秀基层教学组织),华为ICT学院创新人才中心,“武汉理工大学-中软国际”和“武汉理工大学-中原电子”国家级实践教学基地及“科技部国家数字传播创新人才培养示范基地”等国家级和省部级人才培养基地。

     

    太原理工大学

    学院名称:大数据学院

    专业名称:数据科学与大数据技术

    录取分数:578分(2019年数据)

    招生人数:2人(2020年数据)

    培养方向:培养掌握数据科学的基础知识、理论及技术,具有扎实的面向大数据应用的数学、统计学以及计算机科学等基础知识,具有数据建模、算法设计、编程分析和处理实际数据的能力;了解工业、医药、信息、经济、社会、商业、教育等应用领域中的大数据技术及应用,具有较强的专业技术能力和良好的外语交流能力,能胜任大数据处理、大数据挖掘、大数据算法设计和大数据系统开发的研究型和技术型人才。

    综合实力:大数据学院拥有“太原理工大学科学云计算中心”、“高分辨率对地观测卫星系统山西数据与应用中心”、“山西省空间信息网络工程技术研究中心”、“山西省空间信息网络研究生教育创新中心”、“山西省工业智能大数据研究生教育创新中心”等教学科研平台;聚焦服务山西省转型跨越发展和山西省地方经济建设,对照“云聚山西”“云惠山西”“云殖山西”和“云安山西”四大工程,联合校内大数据相关科研力量,建设智能大数据研究中心、智能感知与大数据技术研究中心、社会治理大数据研究中心、工业大数据研究中心、公共安全大数据研究中心、医学大数据研究中心等科研团队。

     

    重庆邮电大学

    学院名称:计算机科学与技术学院

    专业名称:数据科学与大数据技术

    录取分数:577分以上(2019年数据)

    招生人数:26人(2020年数据)

    综合实力:学院近五年来牵头承担了国家重大专项国家自然科学基金、国家973计划、国家863计划、科技部攀登计划、国家发改委专项项目80余项国家级科研项目,教育部科学技术研究重点项目、重庆市科技攻关项目等200余项省部级科研项目,出版学术专著和教材20多部,发表学术论文1800多篇,其中SCI/EI收录900多篇,论著被他引9000多次。获授权发明专利50余项,取得一系列科研成果,获20多项国家、省部级科技奖励。

     

    北京信息科技大学

    专业名称:数据科学与大数据技术

    招生方式:该专业招生采用入校后二次选拔方式,面向所有被录取到北京信息科技大学的全日制本科生,综合高考成绩、英语分级考试成绩、数学分级考试成绩、专业面试成绩择优录取。

    录取分数:532分以上(2019年数据)

    招生人数:30人左右

    培养方向:培养熟悉计算机专业基本知识、方法和技能,掌握大数据系统与平台技术(数据采集、清洗、存储、计算等大数据系统与平台相关技术)、大数据分析与可视化技术(数据分析、人工智能、数据挖掘等大数据分析相关技术和数据可视化技术)、特定场景下大数据开发与应用等方面的基本工程能力,具备工程师所必需的学习与创新、沟通与表达、合作与交流等基本能力与素养,具有良好的职业发展力和适应力的工程师与专业管理人才。

    综合实力:学校以培养应用型人才为主,现有1个国家级教学团队,取得国家级教育教学成果特等奖1项、一等奖1项,北京市教学成果奖24项,列入国家级规划教材选题18本、北京市级精品教材22本、精品课程9门等成果。

     

    厦门理工学院

    学院名称:计算机科学与技术学院

    专业名称:数据科学与大数据技术

    招生条件:511分以上(2019年数据)

    培养方式:在大二专业分流后,专业将构建本科生团队,以4-5人为一队,实施“一队一导师”、“导师全程负责”的策略,坚持“产、学、研、用”深度结合,通过导师与企事业单位的横纵向课题合作,实施三个阶段(创新创业训练、企业项目实践、企业实习或高校实验室实习)经历的育人模式,逐步引导学生掌握实践项目开发与分析所需技能,形成复合型与应用型的大数据技术人才培养创新模式。 

    培养方向:培养针对健康医疗大数据、交通大数据、电商大数据、社交媒体大数据等应用领域,专注于网络数据爬取、海量数据存储、自然语言处理、时空数据分析、搜索引擎开发、数据可视化等技术,培养当前市场急需的大数据分析、系统研发、系统维护和管理的高素质应用型人才。 

    综合实力:拥有福建省医疗数据挖掘与应用工程技术研究中心,数字福建自然灾害监测大数据应用研究所,数据挖掘与智能推荐福建省高校重点实验室,厦门市智慧交通诱导工程技术研究中心,厦门理工学院数据挖掘与知识工程研究所等科研机构,与IBM、思科、智业软件、厦门科拓、甲骨文、用友软件、雅马哈、万安实业、中地集团、南方测绘集团、厦门精图、厦门银据、闽矿测绘院等50余家国内和本地企业开展产学研合作。

     

    西安财经大学

    学院名称:统计学院

    专业名称:数据科学与大数据技术

    招生条件:505分以上(2018年数据)

    招生人数:4人(2020年数据)

    培养方向:本专业培养具有数学、统计学与计算机科学的理论基础,掌握大数据的采集、处理、存储、分析与应用的理论、方法和技术,具备应用现代信息、网络技术对社会、经济领域的大数据进行收集、整理、挖掘和服务能力,能够在企事业、政府等部门从事大数据的整理、分析等工作,或在高等院校、科研机构进行大数据科研工作,能适应社会经济与科学技术发展要求、富有合作精神和实践能力的应用型创新人才。

    综合实力:统计学办学已经有60多年的历史,统计学专业为陕西省“一流专业”建设点,陕西省名牌专业,国家和陕西省两级特色专业建设点,陕西省创新试验区建设点,陕西省级实验教学示范中心;《统计学》、《抽样调查》等5门课程为陕西省精品资源共享课;统计学教学团队为陕西省优秀教学团队。

     

    大数据站在互联网“风口”,直接催热了大学的大数据专业。越来越多的高校启动大数据人才培养计划,以填补百万级的大数据人才缺口。不过,由于在数据科学与技术专业的建设上,投入资金和资源要求高、可借鉴经验不足、学生实践机会不多等因素,各高校在新专业的课程建设路上还是存在着很多挑战,教学质量也均在较大差异,考生和家长一定要全面分析自身兴趣和优势,冷静慎重地做出选择。

     

    最后,附上全国高校人工智能与大数据创新联盟针对全国已经开办数据科学与大数据技术本科专业的612所普通高校调研、综合打分后完成的《全国612所数据科学与大数据技术本科专业高校教育教学综合排名一览表》的前50所高校排名(不作权威性参考)。

    「完」

    转自:数据派THU 公众号;

    版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。


    更多相关知识请回复:“ 月光宝盒 ”;

    数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。

    展开全文
  • 我是我们学院数据科学与大数据技术专业的第一批学生,没有学长学姐,目前对于考研很迷茫,想问一下各位盆友们这个专业的考研方向以及院校的推荐。
  • 数据科学与大数据技术概述 高中信息技术必修教材 P A G E 43 THANKS
  • 推荐 :数据科学与大数据技术专业特色课程研究

    千次阅读 多人点赞 2018-03-22 00:00:00
    在我国,数据科学与大数据技术专业的建设已成为新的热点话题。在系统调研世界一流大学数据科学专业建设现状的基础上,从特色课程视角重点分析加州大学伯克利分校、约翰·霍普金斯大学、华盛顿大学、纽约大学、斯坦福...

      在我国,数据科学与大数据技术专业的建设已成为新的热点话题。在系统调研世界一流大学数据科学专业建设现状的基础上,从特色课程视角重点分析加州大学伯克利分校、约翰·霍普金斯大学、华盛顿大学、纽约大学、斯坦福大学、卡内基梅隆大学、哥伦比亚大学、伦敦城市大学等8所大学的数据科学专业,提出数据科学与大数据技术这一新专业应重视的10门特色课程,并分析了现阶段我数据科学教育中普遍存在的8种曲解现象及对策建议

     


    2016年,教育部发布的《2015年度普通高等学校本科专业备案和审批结果》中就首次增设“数据科学与大数据技术专业”,并获批了北京大学、对外经济贸易大学及中南大学的新增专业申请。接着,2017年,中国人民大学等32所高校出现在第二批次的获批名单中。另,全国高校大数据教育联盟的统计数据显示,2017年申请该专业的院校高达263所,其中工学190所,理学73[1]。从申请资料看,国内数据科学专业是一门主要以统计学和计算机科学与技术专业为基础建设的全新专业。数据科学专业已成为我国现阶段高等教育的热点问题之一。但是,建设什么样的专业以及如何建设该专业仍为各高校面临的难点问题。

    在国外,数据科学(Data Science)专业是以数据分析学(Data Analytics)专业为基础发展而来的,可追溯至2007年北卡罗来纳州立大学(North Carolina State University)率先设立的数据分析硕士学位(Master of Science in Analytics[2]。与统计学和计算机科学与技术等基础学科不同的是,数据分析学进一步抽象了这些底层科学中的数据问题,连接了包括统计学和计算机科学在内的基础学科与数据科学之间的空白,为数据科学这一新学科的出现奠定了直接基础。从“数据分析学”向“数据科学”的实质性过渡出现在2013年左右,比较有代表性的是纽约大学于2013年新开设的数据科学硕士专业(The Master of Science in Data Science[3]之后,包括加州大学伯克利分校、约翰·霍普金斯大学、华盛顿大学在内的多个学校设立了数据科学专业。可见,国外一流大学的数据科学专业建设至少早于国内年。

    为此,本文在调查分析世界一流大学数据科学专业的培养方案,重点分析数据科学专业中开设的特色课程,并对探讨我国数据科学专业建设的借鉴意义。


    1
    数据调研及分析          

    作者通过Study Portal进行调查发现,截止201711月,国外数据科学专业的本科、硕士、博士学位项目分别已达到56014179301项,主要分布在美国、英国、澳大利亚、加拿大、德国和意大利等国家。但是,从课程体系和人才培养定位看,能够体现国外数据科学专业教育的本质与特色的是硕士层次的教育,比较有典型的学校有加州大学伯克利分校、约翰·霍普金斯大学、华盛顿大学、纽约大学、斯坦福大学、卡内基梅隆大学、哥伦比亚大学、伦敦城市大学,如表1所示。


    典型数据科学专业及其特色课程(Typical Data Science Programs and their Core Courses

    学校

    学位名称

    特色课程

    加州大学伯克利分校 [4]

    信息与数据科学硕士
      
    Master of   Information and Data Science

    Python 与数据科学/Python for Data Science

    研究设计及数据与分析中的应用/Research   Design and Application for Data and Analysis

    数据存储与检索/ Storing and   Retrieving Data

    应用机器学习/ Applied   Machine Learning

    试验与因果分析/Experiments   and Causality

    大数据——人与价值/ Behind the Data: Humans and Values

    (纵向扩展及真正的)大数据/ Scaling Up!   Really Big Data

    数据可视化与沟通/ Data   Visualization and Communication

    (数据科学)综合训练课程/ Synthetic Capstone   Course

    约翰·霍普金斯大学 [5]

    数据科学理学硕士
      
    Master of   Science in Data Science

    数据科学/Data Science

    数据可视化/Data Visualization

    随机优化与控制/Stochastic Optimization and Control

    数据科学家的工具箱/ Data Scientist's Toolbox

    数据采集与清洗/Getting and Cleaning Data

    探索性数据分析/Exploratory Data Analysis

    可重复研究/Reproducible Research

    实用机器学习/Practical Machine Learning

    数据产品开发/Developing Data Products

    数据科学综合训练课程/Data Science Capstone

    华盛顿大学            [6]

    数据科学理学硕士
      Master of Science in Data Science

    数据可视化与探索性分析/ Data Visualization & Exploratory Analytics

    应用统计与试验设计/Applied Statistics & Experimental Design

    数据管理与数据科学/Data Management for Data Science

    数据科学家常用的统计机器学习/Statistical Machine Learning for Data Scientists

    面向数据科学的软件设计/Software Design for Data Science

    可扩展的数据系统与算法/Scalable Data Systems & Algorithms

    以人为中心的数据科学/Human-Centered Data Science

    数据科学综合训练课程/Data Science Capstone Project

    纽约大学              [7]

    数据科学理学硕士MS in Data   Science

    数据科学导论/ Intro to   Data Science

    大数据/Big Data 

    面向数据科学的统计学与概率论/Probability   and Statistics for Data Science

    推理与表示/  Inference and Representation

    机器学习与计算统计学/  Machine Learning and Computational   Statistics

    数据科学综合训练课程/ Capstone   Project in Data Science

    基于优化的数据分析/Optimization-based   Data Analysis

    非光滑凸优化/Convex and   Nonsmooth Optimization

    斯坦福大学             [8]

    统计学:数据科学理学硕士学位

    M.S.in Statistics:Data Science

    现代应用统计学:学习/Modern Applied Statistics: Learning

    现代应用统计学:数据挖掘/Modern Applied Statistics: Data Mining

    数据驱动型医学/ Data Driven   Medicine

    现代统计学与现代生物学/Modern   Statistics for Modern Biology

    大数据商务智能/ Business   Intelligence from Big Data

    基于数据的计算范式/Paradigms   for Computing with Data

    卡内基梅隆大学         [9]

    计算数据科学硕士学位
      Master of Computational Data Science

    云计算/Cloud   Computing

    高级云计算/Advanced   Cloud Computing 

    多媒体数据库及数据挖掘/Multimedia   Databases and Data Mining

    移动与普适计算/Mobile and   Pervasive Computing

    大数据集的机器学习/Machine   Learning with Big Data Sets 

    智能信息系统的设计与开发/Design and   Engineering of Intelligent Info Systems

    大数据分析学/Big Data   Analytics

    哥伦比亚大学(纽约) [10]

    数据科学理学硕士
      Master of Science in Data Science

    数据科学导论/Introduction   to Data Science

    面向数据科学的计算机系统/Computer   Systems for Data Science

    探索性数据分析与可视化/Exploratory   Data Analysis & Visualization

    数据科学中的因果推理/ Causal   Inference for Data Science

    大数据分析学/Big Data   Analytics

    数据科学综合训练及伦理/Data Science   Capstone & Ethics

    伦敦城市大学           [11]

    数据科学理学硕士
      MSc in Data Science

    数据科学原理/Principles   of data science

    大数据/Big Data

    可视分析学/Visual   analytics

    数据可视化/Data   visualization

    神经计算/Neural   computing

    研究方法与专业问题/Research   Methods and Professional Issues

    高级并发编程 /Advanced   Programming: Concurrency


    1.1 
    加州大学伯克利分校

    该学校的数据科学专业由信息学院(School of Information)开设,专业名称为信息与数据科学,授予的学位为信息和数据科学专业硕士(Professional Master of Information and Data Science, MIDS[12]。该专业主要侧重于培养学生的研究设计、数据清洗、存储与检索、挖掘与探索、数据可视化、道德与隐私、数据分析、沟通与呈现的能力,如图1所示。

                                                  

    加州大学伯克利分校MIDS专业所关注的学生能力

    Key Skill Areas of MIDS at UC Berkeley[12]


    为了达到上述人才培养目的,该专业开设基础课程、高级课程和综合训练课程等3类课程。其中,基础课程共有5门,即面向数据科学的Python语言(Python for Data Science)、面向数据与分析的研究设计(Research Design and Application for Data and Analysis)、面向数据科学的统计学(Statistics for Data Science)、数据存储与检索(Storing and Retrieving Data)以及应用机器学习(Applied Machine Learning);高级课程有7门,包括试验与因果分析(Experiments and Causality)、数据、人与价值(Behind the Data: Humans and Values)、(纵向扩展及真正的)大数据(Scaling Up! Really Big Data)、面向离散响应,时间序列和面板数据的统计方法(Statistical Methods for Discrete Response, Time Series, and Panel Data)、可扩展的机器学习(Machine Learning at Scale)、基于深度学习的自然语言处理(Natural Language Processing with Deep Learning)以及数据可视化与沟通(Data Visualization and Communication)。除了基础课程和高级课程,该学校还开设一门综合训练课程(Synthetic Capstone),培养学生综合运用所学专业知识及解决现实问题的能力。

    从总体上看,人才培养定位在培养数据科学领域的领导者,侧重培养学生的运用新工具和新方法,从现实数据中获得洞见(Insights)以及如何有效地沟通与阐释自己的研究发现,进而改变他人行动和思想的能力。该学校的数据科学专业的人才培养具有如下几个特点

    • 强调数据科学的多学科交叉特点,将社会科学,计算机科学,统计学,管理学和法学等多学科知识融入具体课程之中;

    • 凸显数据科学本身的讲解,注重提升学生的基于数据提出好问题的能力以及面向数据科学的研究设计、数据清理、存储与检索、交流与沟通、统计分析、道德与隐私、数据可视化以及数据挖掘与探索等关键技能;

    • 引入基于项目的学习方法,借鉴本校信息学院其他专业的培养经验,通过基于项目的教学方式,鼓励学生综合运用多种不同的工具和方法来解决复杂问题;

    • 强调动手实践能力的培养,为学生提供亚马逊Web服务和IBM大数据平台等实践平台。


    1.2
    约翰 · 霍普金斯大学     

    该学校的怀廷工程学院(Whiting School of Engineering)开设名为数据科学(Data Science)的新专业,授予的学位为数据科学理学硕士(Master of Science in Data Science)。

    该专业的课程体系包含先修课程(Prerequisite Courses)、基础课程(Foundation Course)、必修课程(Required Courses)、选修课程(Electives)以及独立学习(Independent study)课程等近60门课程[13]基础课程有2门,即算法基础(Foundations of Algorithms)和统计方法与数据分析(Statistical Methods and Data Analysis);必修课程包括数据库系统原理、数据科学、数据可视化、优化导论(Introduction to Optimization)、统计模型与回归、计算统计学;选修课分为机器学习和统计学两个大方向,共有14门主要课程,均为较为常见课程。值得一提的是,该专业另提供了近30门扩展选修课程(Additional Selections),供学生用于置换同一个领域的必须/选修课程,这些扩展课程均为统计学和计算机科学与技术专业常见课程。独立学习(Independent study)课程主要包括独立动手实战(Capstone项目)和独立学习(Independent Study)。

    从总体上看,该学校的数据科学专业的人才培养具有如下几个特点

    • 从人才培养的目的看,专业旨在培养“有竞争力”的数据科学家,要求学生具备三方面的能力:综合运用计算机科学和应用数学的知识,分析与处理大规模数据集的能力;从复杂数据中快速洞察到有价值信息的能力和从信息中发现相关关系的能力;基于规范的技术和抽象的方法以及面向现实世界中的具体问题的建模能力[14]。

    • 强调学生对数据科学的理论基础的掌握程度,突出了三个主要领域:计算机科学与技术、统计学与应用数学。其中,对应用数学的重视是该学校数据科学专业的一大特色。

    • 从课程设计及内容选择看,该专业鼓励在每一门课程中引入来自现实世界的具体问题作为例题和主要关注点。例如,独立学习(Independent Study)课程中强调对具体行业中实际问题的处理能力。

    • 强调培养学生的数据全生命期管理、统计分析和故事化描述能力。


    1.3
    华盛顿大学      

    整合自己的应用数学系、生物统计学系、Paul G. Allen计算机科学与工程学院、以人为本的设计与工程系、统计系、信息学院6大院系以及电子科学研究所的资源,开设出了一种面向在职人员的夜大类数据科学专业项目,所授予的学位为数据科学理学硕士(Master of Science in Data Science)。该专业的课程设计较为简洁,包括8门核心课程以及1Capstone项目。其中,8个核心课程分别是统计与概率论(Introduction to Statistics & Probability)、信息可视化(Information Visualization)、应用统计与试验设计(Applied Statistics & Experimental Design)、面向数据科学的数据管理(Data Management for Data Science)、数据科学家常用的统计机器学习(Statistical Machine Learning for Data Scientists)、面向数据科学的软件设计(Software Design for Data Science)、可扩展的数据系统与算法(Scalable Data Systems & Algorithms)和以人为中心的数据科学(Human-Centered Data Science)。Capstone项目要求学生自己组队,并自主完成项目的选题、研究设计和研究过程等工作,侧重培养学生对大规模数据集的处理能力、从数据中获得洞察能力(Insights)以及与其他人分享自己所发现的洞见的能力[15]

    从整体看,该学校的数据科学专业主要定位在应用型人才的培养,尤其是数据分析师和应用型数据科学家。人才培养的主要特点如下

    • 面向在职人员。该专业主要针对刚毕业的学生或在职人员开设,上课时间一般为业余时间,允许学生脱产或在职学习。

    • 重视团队协作能力。多数课程的作业均需要团队方式完成,而并非为个人独立完成。

    • 强调动手操作能力,加强学生运用Python和R进行数据分析的能力,部分作业还需要进行Java编程。

    • 突出以人为中心的数据科学与可视化(human-centered data science and visualization)能力,开设有专门《以人为中心的数据科学( Human-Centered Data Science)》。


    1.4
    纽约大学      

    该学校的数据科学专业由数据科学中心(Center for Data Science)开设,授予的学位为数据科学理学硕士(Master of Science in Data Science) [16]主要必选课程有数据科学导论、面向数据科学的统计学与概率论(Probability and Statistics for Data Science)、机器学习、大数据以及Capstone项目。此外,该专业还要求学生从以下6门课程中选择1门:推理与表示、深度学习、基于表示学习的自然语言处理、自然语言理解与计算语义、基于优化的数据分析(Optimization-based Data Analysis)、优化与计算线性代数。值得一提的是,该学校的数据科学专业设有多个培养方向(Track

    • 大数据方向(Data Science: Big Data Track)设有自然语言理解与计算语义、信息可视化、大规模可视化分析、数据库导论、高级数据库系统等课程;

    • 数学与数据方向(Data Science: Mathematics and Data Track)设有基于优化的数据分析、推理与表示、数据科学中数学:图与网络(Mathematics of Data Science: Graphs and Networks)以及非光滑凸优化(Convex and Nonsmooth Optimization)等课程。

    • 自然语言处理方向(Data Science:  Natural Language Processing Track)开设基于表示学习的自然语言理解、自然语言理解与计算语义、统计自然语言理解、推理与表示、深度学习、文本数据(Text as Data)、自然语言处理以及高级语言学等课程。

    • 物理学方向(Data Science: Physics Track)中开设的主要课程有推理与表示、实验物理研究(Experimental Physics Research)、理论物理研究(Theoretical Physics Research)、研究式阅读( Research Reading)、计算物理(Computational Physics)、统计物理、生物物理(Biophysics)、专题研讨课、天体物理学专题(Special Topics in Astrophysics)以及相变与临界现象(Phase Transitions and Critical Phenomena)。

    • 生物学方向(Data Science: Biology Track)重点讲解基础生物学、健康与疾病等基础知识,并要求选修生物学的课程

    纽约大学的数据科学专业的人才培养定位在下一代数据科学家,为具备数学、计算机科学和应用统计基础的学生提供了多个可选的培养方案,其主要特点如下

    • 设有多个培养方向,如大数据、数学与数据、自然语言处理、物理学和生物学等,其人才培养特别强调数据科学与其他专业的深度融合。

    • 重视对优化论的学习,在课程体系中设置了多个与优化论相关的课程,如《基于优化的数据分析(Optimization-based Data Analysis)》和《优化与计算线性代数(Optimization and Computational Linear Algebra)》、《非光滑凸优化(Convex and Nonsmooth Optimization)》。

    • 强调实践操作能力,重视来自现实世界的具体问题的处理能力。


    1.5
    斯坦福大学

    该学校的数据科学专业由统计系(Department of Statistics)和计算与数学学院(Institute for Computational and Mathematical Engineering)联合开设,授予的学位为数据科学方向的统计学理学硕士(M.S. in Statistics: Data Science)。共开设有29门课程[17]分为以下5个模块

    • 基础课程模块:数值线性代数(Numerical Linear Algebra)、离散数学与算法、优化论、工程中的随机方法(Stochastic Methods in Engineering)以及随机算法与概率分析(Randomized Algorithms and Probabilistic Analysis);

    • 数据科学模块:统计推理导论、回归模型及方差分析导论、统计模型导论、现代应用统计学:学习以及现代应用统计学:数据挖掘;

    • 高级科学编程及高性能计算(Advanced Scientific Programming and High Performance Computing)模块,涉及的课程有高级科学编程(Advanced Scientific Programming)、并行计算导论、分布式算法与优化论、数值分析的并行方法、并行计算、并行计算机的架构及编程以及高级多核系统;

    • 专业选修(Specialized Electives)模块,设有以下课程:计算分子生物学中的表示与算法(Representations and Algorithms for Computational Molecular Biology)、数据驱动型医学(Data Driven Medicine)、面向现代生物学的统计学、社会与信息网络分析、机器学习、面向视觉认知的卷积神经网络(Convolutional Neural Networks for Visual Recognition)、海量数据集的挖掘、计算机图形学、地理统计学(Geostatistics)、基于大数据的商务智能(Business Intelligence from Big Data)、人类神经影像学方法(Human Neuroimaging Methods)和数据计算范式(Paradigms for Computing with Data);

    • 实战(Practical Component)模块,包括Capstone项目和独立学习项目。

    斯坦福大学此专业的人才培养目标侧重的是统计学家,而并非是数据科学家。其最突出的特点是将数据科学作为统计学的一个方向,将培养出面向数据科学的统计学家。因此,该专业与其他学校的数据科学专业不同,强调的是数据科学与统计学的深度融合。


    1.6
    哥伦比亚大学(纽约)

    该学校的数据科学专业由数据科学学院( Data Science Institute)开设,授予的学位为数据科学理学硕士(Master of Science in Data Science课程体系可分为导论类课程、计算机科学、统计学、选修课程和Capstone课程等5大类。

    • 导论类课程的定位在计算机学和统计学的交叉课程,课程名称为《数据科学原理》;

    • 计算机科学类课程包括面向数据科学的计算机系统(Computer Systems for Data Science)、数据科学中的机器学习、数据科学中的算法;

    • 统计学类课程包括概率论、面向数据科学的概率统计(Probability & Statistics for Data Science)、探索性数据分析及可视化、统计推理与建模;

    • 选修课程为跨专业课程,鼓励学生跨专业选修哥伦比亚大学其他专业的课程,比较受欢迎的选修课程包括翻译生物信息学(Translational Bioinformatics)、应用机器学习、数据科学中的因果推理、数据科学的要素、面向数据科学的机器学习产品、社会意义的计算模型(Computational Models of Social Meaning)、数据科学项目、大数据分析学、面向计算机可视化、语音和语言的深度学习(Deep Learning for Computer Vision, Speech, and Language)、金融大数据(Big Data in Finance)和可持续技术与智慧城市的演化(Sustainability Technology and the Evolution of Smart Cities

    • Capstone项目的名称为数据科学Capstone与道德(Data Science Capstone & Ethics),综合运用所学知识解决产业、政府和非盈利部门的实际数据和具体问题[18]

    该专业的人才培养定位在数据科学家。主要特点有两个:一是专业教育与专业认证的相结合。该学校不仅开设有数据科学硕士专业,而且还提供一项专业认证——数据科学专业成就认证(The Certification of Professional Achievement in Data Sciences),打通了二者的课程设置;二是专业教育与在线免费课程的相结合。作为线下专业课程的重要补充,该学校提供了在线开放课程——数据科学与分析X系列课程(Data Science and Analytics XSeries),介绍数据科学的最新工具及其在金融、健康医疗、产品开发、市场营销等领域中的应用。目前,已开设的在线课程有:数据科学与分析学中的统计思维(Statistical Thinking for Data Science and Analytics)、数据科学与分析学中的机器学习(Machine Learning for Data Science and Analytics)、数据科学与分析学中的驱动技术:物联网(Enabling Technologies for Data Science and Analytics: The Internet of Things)。


    1.7
    伦敦城市大学

    该学校的数据科学专业由数学、计算机与工程学院(School of Mathematics, Computer Science & Engineering)和计算机系(Department of Computer Science)联合开设,授予的学位为数据科学理学硕士(Master of Science in Data Science),其课程体系由核心模块、选修模块和综合训练课程3部分组成。每个模块包括动手实验室教程和课程作业。其中,核心模块包括数据科学原理(Principles of Data Science)、机器学习、大数据、神经计算(Neural Computing)、可视分析学、研究方法与专业问题(Research Methods and Professional Issues);选修课程有高级并发编程(Advanced Programming: Concurrency)、高级数据库、信息检索、数据可视化、数字信号处理及音频编程(Digital Signal Processing and Audio Programming)、云计算、计算机视觉、软件代理(Software Agents)等综合训练课程与其他学校不同,并非以小组形式完成,而是以学生在指导教师或合作企业的指导下独立完成。选题要求必须为来自实际部门的真实数据及现实问题[19]

    该专业的人才培养定位在数据科学家,特别强调学生的洞察能力的培养,即从大规模数据中快速洞见有价值的、可以指导实际行动的洞见的能力主要特色如下:

    • 重点培养学生的3C精神,尤其是好奇心,通过掌握新技术来提升自己的职业竞争力。该专业的学员主要来自于经济学、统计学和计算机科学专业。

    • 强调数据科学的三个要素,突出数据科学的跨学科性,开设课程涉及计算机科学、统计学、机器学习及实战应用。此外,该学校特别强调机器学习在数据科学中的重要地位,重视学生对机器学习和数据可视化的掌握和应用能力

    • 强调实习的重要性,开设由PLU( Professional Liaison Unit)资助的专业实习项目(Professional Internships Program),将学生派送到NHS、Facebook、亚马逊、BBC的实际工作部门进行为期6个月的实习。

    • 重视产业真实数据及现实问题的处理能力。该学校设有个人大作业(The individual project),要求学生综合运用所学知识,选择来自产业、学术或政府的真实数据,解决现实世界中存在的具体问题。


    1.8
    卡内基梅隆大学

    该学校的数据科学专业人才培养分散在多个专业之中,如表2所示,其中直接用数据科学命名的专业为计算数据科学(Computational Data Science[20]。计算数据科学专业由计算机学院开设,课程体系设有分析和系统2个方向,学生必须选修5门核心课程、3门选修课和1Capstone项目。分析方向的核心课程为智能信息系统、机器学习、大规模数据集的机器学习、搜索引擎和可扩展分析学;系统方向的核心课程为操作系统的实现、数据库应用、并行计算机架构及编程、分布式系统、大数据系统、高级存储系统、云计算及高级云计算、数据库系统的前沿问题及多媒体数据库


      卡内基梅隆大学的数据科学硕士专业(Data Science Master's Table at Carnegie Mellon University)[20]

    学院

    学位

    时间

    类型

    背景要求

    未来工作去向

    海因茨学院

    公共政策硕士(政策分析方向)

    2

    专业硕士

    商业、科学或技术学位

    政府、咨询公司、智库

    信息系统管理硕士(商务智能与数据分析方向)

    1.5

    专业硕士

    具有工科学位和工作经验

    金融服务公司、科技公司、初创企业

    泰伯商学院

    工商管理硕士(商务分析方向)

    2

    专业硕士

    不同的背景(见正文)

    咨询公司、IT公司、财务数据分析公司等

    计算机科学学院

    语言技术研究院

    计算数据科学硕士

    1.5

    专业硕士

    计算机科学或其他相关专业

    高科技公司的软件工程职位

    智能信息系统硕士

    1

    专业硕士

    计算机科学或其他相关专业

    高科技公司的软件工程职位

    语言技术硕士

    2

    专业硕士

    计算机科学或其他相关专业

    软件工程工作、博士项目

    人机交互研究院与心理学系

    教育技术硕士

    1

    专业硕士

    心理学、教育学、计算机科学等专业

    各种相关工作

    机器学习系

    机器学习硕士

    15

    专业硕士

    计算机科学、统计或其他相关专业

    软件工程、财务工作、博士项目

    迪特里希人文社会科学学院

    统计实践硕士

    1

    专业硕士

    数学或统计数据相关专业

    咨询公司、金融公司、市场营销公司等


    该学校的人才培养侧重于专业中的数据科学家,强调的是与具体专业学科高度融合的人才培养。其主要特点有两个:

    • 侧重融合式教育及专业中的数据科学家的培养。与上述其他学校不同的是,该学校的数据科学专业分散在多个学位项目,如公共政策、信息系统管理、工商管理、计算数据科学、智能信息系统、语言技术、教育技术、机器学习和统计实践等。其中,以数据科学为命名的专业只有一个,即为计算数据科学(Computational Data Science)。

    • 强调跨学科方法(Interdisciplinary Approach):重视统计学、计算机科学和具体应用领域之间的深入融合,所涉及的具体应用领域有公共政策、信息系统管理、商务分析、智能信息系统、语言技术、教育技术与应用学习。


    2
    特色课程                     

    特色课程是一个新专业的存在标志之一。通过对上述8个学校的培养方案进一步深入调研发现,数据科学与大数据技术专业的特色课程有9种:


    2.1数据科学的理论基础类课程

    主要讲解正式学习数据科学之前必备的知识而对数据科学本身的介绍较少,主要定位是数据科学专业的先修课程,为学生学习数据科学课程奠定基础。常见的理论基础类课程有统计学、机器学习以及Python语言(或R语言)。

    • “统计学”类课程:主要讲解面向数据科学的应用统计学的知识,为学生深入学习数据科学理论奠定基础。例如,华盛顿大学《应用统计与试验设计( Applied Statistics & Experimental Design) [21]主要学习离散和连续随机变量的推理统计方法,包括手段和比例差异的测试、线性和逻辑回归、因果关系以及重采样方法等。再如,斯坦福大学开设两门统计学类课程,即现代应用统计学:学习( Modern Applied Statistics:Learning)和现代应用统计学:数据挖掘(Modern Applied Statistics:Data Mining)[22]。

    • “机器学习”类课程:主要讲解面向数据科学的应用机器学习的知识,为学生深入学习数据科学理论奠定基础。例如,加州大学伯克利分校开设的应用机器学习(Applied Machine Learning)[23]课程认为机器学习是计算机科学与统计学交叉点之上发展迅速的领域,强调的是寻找数据中的模式。类似的课程还有华盛顿大学的数据科学家常用的统计机器学习(Statistical Machine Learning for Data Scientists)[24]纽约大学的机器科学与计算统计学( Machine Learning and Computational Statistics)等课程。

    • Python语言(或R语言)课程,主要讲解面向数据科学的数据分析语言及开源工具。例如,加州大学伯克利分校开设的《面向数据科学的Python语言(Python for Data Science) [25]侧重讲解的是数据科学工作所必需掌握的Python知识——Python基本语法及数据科学常用包的应用。


    2.2数据科学的基础理论类课程

    主要讲解数据课程本身的术语、理念、理论、方法、技术、工具和最佳实践应用,属于数据科学专业的入门性、导论类课程。例如,约翰·霍普金斯大学《数据科学(Data Science) [26]课程涵盖数据科领域的核心概念和技能,包括问题识别和通信、概率、统计推断、可视化、提取/变换/加载、探索性数据分析、线性和逻辑回归、模型评估以及常用机器学习算法等。该课程以有效沟通和可重复分析为指导思想,认为数据科学并不等同于统计学和机器学习的简单拼接,强调的是对数据科学自身的新知识的讲解。


    2.3数据科学的领域应用类课程

    主要讲解数据科学对某一学科领域的影响及其应用方法论或最佳实践。例如斯坦福大学开设的《数据驱动型医学( Data Driven Medicine) [27]《基于大数据的商务智能(Business Intelligence From Big Data)[28]课程,分别探讨的是如何将数据科学的理念、理论方法和技术应用于医学和商务智能领域。


    2.4“数据呈现和沟通”类课程

    主要讲解数据呈现与沟通能力在数据科学中的重要地位以及数据科学中常用的可视化表示与故事化描述方法。例如,加州大学伯克利分校《数据可视化 (Data Visualization) [29]约翰·霍普金斯大学的《数据可视化(Data Visualization) [30]以及伦敦城市大学的《可视分析学(Visual Analytics) [31]课程讲解可视化方法在数据科学专业中的应用。此外,数据的故事化描述能力也是数据科学家的基本功之一。杜克大学的交叉数据科学硕士专业认为数据的故事化描述与可视化表示同等重要,并开设课程《数据逻辑、可视化表达与故事化描述(Data Logic, Visualization,and Storytelling)》[32]


    2.5“数据计算”类课程

    主要讲解大数据环境下计算模式的变化及新的算法、技术、工具与平台。例如,华盛顿大学的《可扩展的数据系统与算法(Scalable Data Systems & Algorithms) 主要讲解面向大规模数据的可扩展算法。再如,卡内基梅隆大学的《云计算(Cloud Computing ) [33]课程不仅介绍云计算模式,还讲解数据中心,虚拟化,云存储和编程模型等主题。斯坦福大学也同样开设了关于数据计算方面的基于数据的计算范式(Paradigms for Computing with Data)》[34]课程。


    2.6“数据管理”类课程

    主要讲解数据管理,尤其是大数据时代的数据管理新挑战、新理念、新方法、新技术和新工具。例如,华盛顿大学开设的《数据管理与数据科学(Data Management for Data Science) 主要讲解的是数据模型、查询语言、数据库调优和优化、数据仓库以及并行处理等内容。再如,加州大学伯克利分校开设的《数据存储与检索(Storing and Retrieving Data ) [35]课程的涉及面很广,鼓励学生综合运用Python、关系数据库、HadoopMap reduceSpark和云计算(AWS)等多种技术,完成分布式数据处理、流式数据分析、图计算和大数据架构设计等工作。


    2.7“数据分析”类课程

    主要讲解数据分析,尤其是大数据分析的方法和技术。例如,卡内基梅隆大学多媒体数据库及数据挖掘(Multimedia Databases and Data Mining),华盛顿大学的大数据分析学(Big Data Analytics) 以及哥伦比亚大学(纽约)的大数据分析学(Big Data Analytics)[36]均强调了大数据分析的主要挑战和新方法。值得一提的是,正如Gartner数据分析价值扶梯模型(Gartner's analytic value escalator)所示,因果分析是大数据数据分析中重要组成部分。例如,哥伦比亚大学开设有《数据科学中的因果推理(Causal Inference for Data Science),重点讲解因果分析在数据科学中的应用。此外,探索性数据分析成为数据科学专业的重要课程之一,如约翰霍普金斯大学和哥伦比亚大学均开设有名为探索性数据分析(Exploratory Data Analysis的课程。


    2.8“数据产品开发”类课程

    主要讲解数据产品开发方法、试验设计和优化论等知识。其中,数据产品开发是数据科学专业教育的重要抓手之一。例如,卡内基梅隆大学的智能信息系统的设计与开发(Design and Engineering of Intelligent Info Systems)。在数据产品开发中,试验设计和优化论是必不可少的支撑课程,如华盛顿大学和纽约大学分别开设有关试验设计(Design of Experiment)和优化论(Optimization有关的课程。


    2.9数据科学中“人文”类课程

    主要讲解数据科学的研究与实践中的非技术和工程类问题,主要涉及大数据与数据分析相关的道德、隐私、法律、经济和社会影响。例如,华盛顿大学开设的《以人为中心的数据科学(Human-Centered Data Science)》课程[37]的内容涉及数据道德与隐私、算法偏倚、法律框架和知识产权保护、数据溯源和再现、数据管理与长久保存、大数据的用户体验和可用性测试、大规模协同中的道德问题、数据沟通以及数据科学的社会影响。


    10综合训练类课程

    主要讲解如何综合运用数据科学专业中学习的理论、方法、技术和工具解决具体行业中的实际问题,重点培养学生的实战能力。加州大学伯克利分校、约翰·霍普金斯大学、华盛顿大学、纽约大学、哥伦比亚大学(纽约)的综合训练课程成为《数据科学综合训练课程(Data Science Capstone)》课程,均强调学生以团队工作的形式,选择解决具体行业中真实问题和真实数据,提升自己的数据洞见、数据产品开发和综合动手能力。


    3
    启示与建议       

    目前,我国数据科学与大数据技术专业建设仍处于起步阶段,其课程体系的设计中存在一些不足之处,甚至存在曲解现象。我国大数据教育中存在的常见曲解以及以上分析的借鉴意义主要体现在


    3.1 
    曲解之一、数据科学 = 计算机科学 + 统计学

    从目前国内部分高校的培养方案可看出,其数据科学专业课程体系主要由计算机科学和统计学两大学科领域的主干课程组成,而对数据科学本身的关注不够,并没有开出数据科学专业的特色课程。需要注意的是,计算机科学和统计学是数据科学的理论基础,而并非是数据科学特有的知识[38]。世界一流大学的数据科学课程设置看,数据科学专业并非是计算机科学和统计学的简单拼凑,而更加突出的是数据科学本身——数据科学的基础理论、数据加工、数据分析、数据计算、数据管理及数据产品开发从本次调查分析发现,数据科学专业中应重视的新课程有:

    • 数据科学导论(Introduction to Data Science)或数据科学原理(Principles of data science);

    • 数据可视化(Data Visualization)或可视分析学(Visual analytics);

    • 数据产品开发(Data Product Development);

    • 探索性数据分析(Exploratory Data Analysis,EDA);

    • 大数据分析(Big Data Analytics);

    • 试验设计(Experimental Design 或 Design of Experiment);

    • 优化论(Optimization);

    • 因果分析(Causality);

    • 数据科学综合训练课程(Data Science Capstone)


    3.2
    曲解之二、照搬传统统计学和计算机科学专业的课程

    从国内部分高校公布的数据科学专业课程体系看,一般均设有两门基础课程——统计学和机器学习,并直接将计算机科学和统计学专业的两门课程照搬到数据科学这一新专业之中,甚至教学大纲都没有做任何的改动。但是,从上述一流大学的课程设置看,数据科学专业中讲解统计学和机器学习的方式与统计学和计算机科学等传统学科不同以机器学习为例,

    • 加州大学伯克利分校和约翰霍普金斯大学的开设的课程名分别为《应用机器学习(Applied Machine Learning)》、《实用机器学习(Practical Machine Learning)》,强调的是从应用角度讲解机器学习;

    • 华盛顿大学开设课程名为《数据科学家常用的统计机器学习(Statistical Machine Learning for Data Scientists)》,强调的是从数据科学视角讲解统计学,突出的是数据科学与机器学习之间的关联;

    • 卡内基梅隆大学的课程名为《大数据集的机器学习(Machine Learning with Big Data Sets)》,强调的是面向大数据的机器学习。

    • 纽约大学开设的课程名为《机器学习与计算统计学(Machine Learning and Computational Statistics) 》,强调的是机器学习与统计学的深层融合,而并非是二者的简单拼凑。


    3.3 
    曲解之三、大数据教育的重点是相关性分析

    由于大数据在相关性分析领域的应用案例和故事较多,部分高校的大数据教育中过分强调相关分析,而忽略了因果分析,甚至认为大数据或数据科学不善于或不包括因果分析。因此,因果分析的课程在国内数据科学与大数据技术专业的课程中极其罕见。与此不同的是,国外数据科学专业中因果分析课程较为常见,体现了数据分析的多样性以及因果分析在数据科学中的重要地位:

    • 加州大学伯克利分校开设有《试验与因果分析(Experiments and Causality)》;

    • 哥伦比亚大学的数据科学专业开设有《数据科学中的因果推理(Causal Inference for Data Science)》课程。


    3.4
    曲解之四、数据科学与大数据技术专业关注的是数据本身的管理

    在国内,部分学校的数据科学专业的人才培养方案与数据工程、数据仓库、商务智能等其他专业或方向的区别并非明显,课程设置仍定位在于数据工程师的培养,关注的科学问题是数据本身的管理。但是,数据科学专业与数据工程专业不同,侧重的是“基于数据的管理”,而并非是“数据本身的管理”,其培养目的为数据科学家和数据分析师。例如,

    • 斯坦福大学的《数据驱动型医学(Data Driven Medicine)》

    • 纽约大学的《基于优化的数据分析(Optimization-based Data Analysis)》

    • 约翰·霍普金斯大学的《数据产品开发(Developing Data Products)》。


    3.5
    曲解之五、课程名中必须有“大数据”字样

    在国内,从部分学校的大数据专业课程体系看,为了区分和凸显新专业的特殊性,在每个课程的名称中简单机械地增加了大数据字样,如《大数据系统与算法》等。但是,从国外经验可以看出,数据科学专业的课程不一定要打大数据的旗号,例如:

    • 华盛顿大学开设的课程《可扩展的数据系统与算法(Scalable Data Systems & Algorithms)》,虽没有注明“大数据(Big Data)”字样,但充分体现了大数据系统和算法的核心需求和主要矛盾——可扩展性(Scalability)。

    • 斯坦福大学开设的课程“基于数据的计算范式(Paradigms for Computing with Data)”,虽然没有“大(Big)”字样,但抓住了数据科学的核心问题——基于数据的计算范式。


    3.6
    曲解之六、数据科学与大数据技术专业亟待标准化

    目前,国内多所高校的数据科学专业的培养方案趋于同质,相互参照得过多,并没有体现所在高校的优势。从国外课程体系的设计看,不同学校的数据科学与大数据技术专业的人才培养方案并非相同,而主要区别体现在所在高校的学科优势和人才培养的定位。例如斯坦福大学结合自己在统计学、医学、生物学和商务智能的优势,开设出了一些特色课程:

    • 现代应用统计学:学习(Modern Applied Statistics: Learning);

    • 现代应用统计学:数据挖掘(Modern Applied Statistics: Data Mining);

    • 数据驱动型医学(Data Driven Medicine);

    • 现代统计学与现代生物学(Modern Statistics for Modern Biology);

    • 大数据商务智能(Business Intelligence from Big Data)。


    3.7
    曲解之七、数据科学专业纯属理工科          

    目前,国内部分学校的数据科学专业的课程设计中仅强调技术和工程问题,而忽略了人文和管理问题。但是,从国外数据科学专业课程设计看,数据科学不仅是技术和工程的问题,而且还涉及道德和法律的范畴,例如:

    • 加州大学伯克利分校的课程《大数据中的人与价值(Behind the Data: Humans and Values)》;

    • 华盛顿大学的课程《以人为中心的数据科学(Human-Centered Data Science)》;

    • 哥伦比亚大学的课程《》数据科学综合训练及伦理(Data Science Capstone & Ethics》。

    3.8
    曲解之八专业的主要受众学生群体来自计算机科学、统计学或数据科学专业

    目前,国内数据科学专业的课程设计是专门为计算机科学、统计学或数据科学专业的学生设计的,而忽略了其他专业学生的需求。但是,从国外大学数据科学专业或课程的选修生源看,主要生源并非是上述三个专业,而其他专业的生源占绝大多数。纽约大学的数据科学专业的多个培养方向也证明了这一点。因此,在数据科学专业的课程设计中应适当考虑学生来源和去向,加强数据科学与领域知识的高度融合。


    参考文献



    [1] 全国高校大数据教育联盟.2017申报数据科学与大数据技术专业本科院校数量再创新高[OL].http://www.sohu.com/a/168748806_589639

    [2] Steve Pierson.Master’s Programs in Data Science and Analytics[OL](2017-12-3) .http://magazine.amstat.org/blog/2017/06/01/masters-programs2/

    [3] New York University.Academics[OL].https://cds.nyu.edu/academics/

    [4] UC Regents. Data Science (DATASCI)[OL].(2017-11-21). http://guide.berkeley.edu/courses/datasci/

    [5] Johns Hopkins Engineering for Professionals. Data Science[OL].(2017-11-21). https://ep.jhu.edu/programs-and-courses/programs/data-science

    [6] University of Washington | Seattle, WA. Courses & Curriculum[OL].(2017-11-21). https://www.datasciencemasters.uw.edu/details/courses/

    [7] New York University. MS in Data Science Courses[OL].(2017-11-21). https://cds.nyu.edu/academics/ms-in-data-science/ms-courses/

    [8] Stanford University, Stanford, California 94305. M.S. in Statistics: Data Science. https://statistics.stanford.edu/academics/ms-statistics-data-science

    [9] Carnegie Mellon University. Data Science Overview. [OL].(2017-11-21). https://www.cmu.edu/graduate/data-science/

    [10] GraduateCurriculum.ColumbiaUniversity[OL].(2017-11-21).

    http://datascience.columbia.edu/course-inventory

    [11] City, University of London. Data Science[OL].(2017-11-21).https://www.city.ac.uk/courses/postgraduate/data-science-msc

    [12]  UC Regents. Master of Information and Data Science[OL].(2017-11-21) .https://www.ischool.berkeley.edu/programs/mids

    [13] Johns Hopkins Engineering for Professionals.Courses. Courses [OL].(2017-11-21). https://ep.jhu.edu/programs-and-courses/programs/data-science

    [14] Johns Hopkins Engineering for Professionals.Courses. About [OL].(2017-11-21). https://ep.jhu.edu/programs-and-courses/programs/data-science 

    [15] University of Washington | Seattle, WA. Career Outlook. [OL].(2017-11-21)                            https://www.datasciencemasters.uw.edu/details/

    [16] New York University.MS in DATA SCIENCE. [OL].(2017-11-21). https://cds.nyu.edu/academics/ms-in-data-science/

    [17]  Stanford University, Stanford, California 94305. M.S. in Statistics: Data Science [OL].(2017-11-21) https://statistics.stanford.edu/academics/ms-statistics-data-science

    [18] Columbia University. Mission[OL].(2017-11-21). http://datascience.columbia.edu/columbia-data-science

    [19] City, University of London. Objectives. [OL].(2017-11-21). https://www.city.ac.uk/courses/postgraduate/data-science-msc

    [20] Carnegie Mellon University.Overview: Carnegie Mellon's Interdisciplinary Approach to Data Science[OL][2017-11-22].https://www.cmu.edu/graduate/data-science/

    [21] 2017 University of Washington | Seattle, WA. Course Descriptions[OL].(2017-11-21).https://www.datasciencemasters.uw.edu/details/courses/course-descriptions/#DATA557

    [22] Stanford University, Stanford California 94305. STATS315B - Modern Applied Statistics: Data Mining[OL].(2017-11-21). http://scpd.stanford.edu/search/publicCourseSearchDetails.do?method=load&courseId=1164541

    [23] UC Regents. Info 251Applied Machine Learning[OL].(2017-11-21). https://www.ischool.berkeley.edu/courses/info/251

    [24] 2017 University of Washington | Seattle, WA. Course Descriptions[OL].(2017-11-21). https://www.datasciencemasters.uw.edu/details/courses/course-descriptions/#DATA557

    [25] 2017 UC Berkeley School of Information. Python for Data Science[OL].(2017-11-21). https://datascience.berkeley.edu/academics/curriculum/python-for-data-science/

    [26] Johns Hopkins Engineering for Professionals. 605.448 - Data Science[OL].(2017-11-21). https://ep.jhu.edu/programs-and-courses/605.448-data-science

    [27] Stanford University. BIOMEDIN 215: Data Driven Medicine[OL].(2017-11-21). http://explorecourses.stanford.edu/search?view=catalog&filter-coursestatus-Active=on&page=0&catalog=&academicYear=20172018&q=+Data+Driven+Medicine&collapse=

    [28] Stanford University. OIT 367: Business Intelligence from Big Data[OL].(2017-11-21) http://explorecourses.stanford.edu/search?q=OIT%2b367&academicYear=20172018

    [29] UC Berkeley School of Information. Data Visualization[OL].(2017-11-21). https://datascience.berkeley.edu/academics/curriculum/data-visualization/

    [30] Johns Hopkins Engineering for Professionals. 605.462 - Data Visualization[OL].(2017-11-21). https://ep.jhu.edu/programs-and-courses/605.462-data-visualization

    [31] City, University of London. Core modules[OL].(2017-11-21). https://www.city.ac.uk/courses/postgraduate/data-science-msc

    [32] Duke University.MIDS - Program Overview[OL].(2012-12-3).https:// datascience.duke.edu/content/course-schedule

    [33] Master of Computational Data Science. Masters - CDS - Curriculum[OL].(2017-11-21) https://mcds.cs.cmu.edu/masters-cds-curriculum

    [34] Stanford University, Stanford, California 94305. Paradigms for Computing with Data[OL].(2017-11-21) https://statistics.stanford.edu/courses/2014-2015-stats-290

    [35] UC Berkeley School of Information. Storing and Retrieving Data[OL].(2017-11-21). https://datascience.berkeley.edu/academics/curriculum/storing-retrieving-data/

    [36] Columbia University. Graduate Curriculum [OL].(2017-11-21). http://datascience.columbia.edu/course-inventory

    [37] University of Washington .Human-Centered Data Science[OL][2017-12-1].https://www.datasciencemasters.uw.edu/details/courses/course-descriptions/#DATA512

    [38] 朝乐门.数据科学理论与实践[M].清华大学出版社,2017.

    END

    版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。


    关联阅读:

    原创系列文章:

    1:从0开始搭建自己的数据运营指标体系(概括篇)

    2 :从0开始搭建自己的数据运营指标体系(定位篇)

    3 :从0开始搭建自己的数据运营体系(业务理解篇)

    4 :数据指标的构建流程与逻辑

    5 :系列 :从数据指标到数据运营指标体系

    6:   实战 :为自己的公号搭建一个数据运营指标体系

    7:  从0开始搭建自己的数据运营指标体系(运营活动分析)

    数据运营 关联文章阅读:  

    运营入门,从0到1搭建数据分析知识体系    

    推荐 :数据分析师与运营协作的9个好习惯

    干货 :手把手教你搭建数据化用户运营体系

    推荐 :最用心的运营数据指标解读

    干货 : 如何构建数据运营指标体系

    从零开始,构建数据化运营体系

    干货 :解读产品、运营和数据三个基友关系

    干货 :从0到1搭建数据运营体系

    数据分析、数据产品 关联文章阅读:

    干货 :数据分析团队的搭建和思考

    关于用户画像那些事,看这一文章就够了

    数据分析师必需具备的10种分析思维。

    如何构建大数据层级体系,看这一文章就够了

    干货 : 聚焦于用户行为分析的数据产品

    如何构建大数据层级体系,看这一文章就够了

    80%的运营注定了打杂?因为你没有搭建出一套有效的用户运营体系

    从底层到应用,那些数据人的必备技能

    读懂用户运营体系:用户分层和分群

    做运营必须掌握的数据分析思维,你还敢说不会做数据分析

    展开全文
  • 数据科学与大数据技术是一门偏向应用的学科领域,因此工具就成为重要的组成部分。在工作中,数据科学家如果选择有效的工具会带来事半功倍的效果。一般来说,数据科学家应该具有操作数据库、数据处理和数据可视化等...

    数据科学与大数据技术是一门偏向应用的学科领域,因此工具就成为重要的组成部分。在工作中,数据科学家如果选择有效的工具会带来事半功倍的效果。一般来说,数据科学家应该具有操作数据库、数据处理和数据可视化等相关技能,还有很多人还认为计算机技能也是不可或缺的,可以提高数据科学家工作的效率。

    互联网科技发展蓬勃兴起,人工智能时代来临,抓住下一个风口。为帮助那些往想互联网方向转行想学习,却因为时间不够,资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程,大数据学习群: 740041381就可以找到组织学习  欢迎进阶中和进想深入大数据的小伙伴加入

    开源社区多年来对数据科学工具包开发有着巨大贡献,这也让数据科学领域得以不断进步。这里我们收集了一些在数据库、编程语言、机器学习、可视化、计算机等方面的开源工具。希望可以帮助到更多数据科学家及对这个领域感兴趣的人。

    1.  数据库

    1.1 MongoDB

     

    MongoDB是一个以可伸缩性和高性能著称的NoSQL数据库。它提供了传统数据库的强大替代品,并使特定应用程序中的数据集成更加容易。特别适用于构建大型web应用程序。

     

    1.2 Apache HBase

     

     

    Apache HBase(Hadoop数据库)是一个分布式、可扩展的大数据存储。数据科学家在需要对大数据进行随机、实时读/写访问时,可以使用这个开源工具。

     

     

    2.  编程语言

    2.1 R

     

     

    R是一种用于数据处理和图形处理的编程语言,是数据科学家和分析人员使用的一种流行工具。根据数据科学家的说法,R语言是最容易学习的语言之一,因为有大量的包和指南可供用户使用。

     

    2.2 Python

     

    Python是数据科学家中另一种广泛使用的语言,它是一种通用编程语言,着眼于可读性和简单性。而且python中有非常多可以用于数据处理、机器学习和可视化的代码库。

    * 数据科学中常用的库见文章:https://mp.weixin.qq.com/s/dLrZWsqrZW7XqG6phS3R7g

     

    2.3 Scala

     

    Scala是一种运行在Java平台上的通用编程语言。它适用于大型数据集,主要用于Apache Spark和Apache Kafka等大数据工具。这种函数式编程风格带来了速度和更高的生产率,这导致越来越多的公司慢慢地将其作为数据科学工具包的重要组成部分加以适应。

     

    2.4 SQL

     

    SQL是用于存储在关系数据库中的数据的专用编程语言。SQL用于更基本的数据分析,可以执行组织和操作数据或从数据库检索数据等任务。在数据科学工具中,它是在数据库中过滤和选择数据的最佳工具之一。

     

    2.5 Julia

     

    Julia是一种用于技术计算的动态编程语言。它没有被广泛使用,但由于其灵活性、设计和性能,在数据科学工具中越来越受欢迎。

     

     

    3.  数据挖掘

     

    3.1 RapidMiner

     

    RapidMiner是一个具有可视化和统计建模功能的预测分析工具。该软件的基础是RapidMiner Studio,它是一个免费的开源平台。

     

    3.2 Data Melt

     

    Data Melt是一款数学软件,拥有先进的数学计算、统计分析和数据挖掘功能,而且可以通过编程语言进行补充,甚至包含一个广泛的教程库。

     

    此外,Python和R中都有很多用于数据挖掘的库,这里就不再赘述了。

     

     

    4.  机器学习

     

    4.1 Weka

    Weka是由怀卡托大学用Java编写的机器学习软件。它用于数据挖掘,允许用户处理大数据集。Weka的一些特性包括预处理、分类、回归、聚类、实验、工作流和可视化。

     

    4.2 TensorFlow

     

    TensorFlow是一个用于数值计算的软件库,它允许程序员在不需要理解其背后的一些复杂原理的情况下的应用深度学习,并被列为帮助数千家公司应用深度学习的数据科学工具之一。

     

    4.2 Apache Mahout

     

     

    Apache Mahout是一种构建可伸缩机器学习算法的环境。算法是在Hadoop上编写的。Mahout实现了三个主要的机器学习任务:协同过滤、聚类和分类。

     

    4.3 Orange

     

    Orange一个是简单的数据科学工具,它致力于使数据科学变得有趣和交互式,允许用户在不需要编码的情况下分析和可视化数据,也为初学者提供机器学习选项。

     

    4.4 MLBase

     

     

    MLBase是加州大学伯克利分校的AMP(算法机器人)实验室开发的一个开源项目。背后的核心思想是为机器学习应用于大规模问题提供一个简单的解决方案。

    互联网科技发展蓬勃兴起,人工智能时代来临,抓住下一个风口。为帮助那些往想互联网方向转行想学习,却因为时间不够,资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程,大数据学习群: 740041381就可以找到组织学习  欢迎进阶中和进想深入大数据的小伙伴加入

     

    5.  数据可视化

     

    5.1 D3

     

     

    5.2 Axiis

     

     

    在数据科学工具中,Axiis是一个鲜为人知的数据可视化框架。它允许用户以一种富有表现力和简洁的形式使用预先构建的组件构建图表和探索数据。

     

    6.  其他工具

     

    6.1 Linux

     

     

    Bash脚本是计算机科学中最基本的工具,并且数据科学中很大一部分需要编程,必须用一些命令行来处理包、框架管理、环境变量、访问路径($PATH)等等,因此Linux是必要的。

     

    6.2 Git

     

     

    在团队中编码时,可以借助 git解决团队成员代码冲突、修复bug、更新。将代码提交到开源或私有的repo(如Github)时,可以使用Coveralls之类的东西进行代码测试,还有帮助部署代码到生产中的其他框架。

     

    6.3 REST APIs

    REST APIs可以让本地的训练模型和可用程序无缝衔接。通过标准API调用或开发可用的应用程序真正让数据科学模型进行预测。这也是其在数据科学中的巨大作用。

     

    6.4 Docker & Kubernetes

     

    Docker让用户拥有一个生产就绪(production ready)的应用环境,不需要为每个运行的单个服务集中配置生产服务器。与需要安装完整操作系统的虚拟机不同,docker容器在与主机相同的内核上运行,并且轻量得多。一些高级的机器学习库(如Tensorflow)需要特定的配置,很难在某些主机上进行故障排除,docker就是一个很好地选择。

     

     

    Kubernetes(K8s)是一个在多主机上进行规模管理和部署容器化服务的平台。本质上,这意味着您可以轻松地通过跨水平可扩展集群,管理和部署docker容器。

     

    6.5 Apache Airflow

     

     

    Airflow是一个较为小众的Python平台,可以使用有向无环图(DAG)程序化地创建、调度和监控工作流。它能让你可以随时根据需要轻松地设置Python或bash脚本,并在用户友好的GUI中控制调度作业。

     

    6.6 Elasticsearch

     

    Elasticsearch也是一个比较小众的工具。Elastic通过Python客户端便捷地提供了所需的一切,让你可以轻松地以容错和可扩展的方式索引和搜索文档。你拥有的数据越多,启动的节点就越多,查询执行的速度就越快。它有很多功能,甚至支持多语言分析器等定制插件。

     

    6.7 Homebrew

     

     

    Homebrew是一个Mac OS系统的工具,可以帮助不能开箱即用的OS系统通过终端命令进行安装, 弥补了OS系统无包管理的缺陷。

    展开全文
  • 数据科学与大数据技术(十一周)-课件and课后习题-附件资源
  • 数据科学与大数据技术是一门偏向应用的学科领域,因此工具就成为重要的组成部分。在工作中,数据科学家如果选择有效的工具会带来事半功倍的效果。一般来说,数据科学家应该具有操作数据库、数据处理和数据可视化等...
  • 数据科学与大数据技术专业;Slide 5;学习目标;知识探究;1.3.1数据科学的兴起;1.3.1数据科学的兴起;数据科学工作角色;1.3.2大数据及其应用;1.3.2大数据及其应用;1.3.2大数据及其应用;1.3.2大数据及其应用;1.3.2大数据...
  • 数据科学与大数据技术专业的教材建设探索.pdf
  • 详谈数据科学与大数据技术专业

    千次阅读 多人点赞 2017-08-08 15:31:00
    专业名称:数据科学与大数据技术; 人才培养目标:以大数据为核心研究对象,利用大数据的方法解决具体行业应用问题。 学制:四年;学位:工学或理学学位。 目前已有35所高校申报了大数据专业: 第一批(3所):北京大学...
  • 数据科学与大数据通识导论题库及答案 数据科学的三大支柱五大要素是什么 答数据科学的三大主要支柱为 Datalogy (数据学)对应数据管理 (Data management) Analytics (分析学)对应统计方法 (Statistical method) ...
  • 数据科学与大数据技术专业实验实践教学探析.pdf
  • 数据科学与大数据技术研讨.pdf
  • 数据科学与大数据技术专业人才培养方案 一培养目标 本专业旨在培养德智体全面发展熟练掌握大数据采集存储处理分析传 输和应用技术能够承担政府电力教育金融信息产业以及其他国民经济部门 的大数据分析数据库管理...
  • 西藏高校数据科学与大数据技术人才培养模式研究.pdf
  • 数据科学与大数据技术专业程序设计课程教学初探.pdf
  • 数据科学与大数据技术专业指导性培养方案 门计算机信息学院 部门负责人汪军 专业负责人陶皖 审 校 核凤权 长王绍武 制 订 日 期 2018 年 8 月 一培养目标 学校培养目标培养德智体美劳全面发展具有社会责任感...
  • 概率论数理统计的教学研究——基于数据科学与大数据技术专业.pdf
  • 超 13 高校新增开设数据科学与大数据技术专业未 来年薪 50 万 出国留学高考网为大家提供超 1/3 高校新增开设数据科学与大数据技术专业未来年薪 50 万更多高考资讯请关注我们网站的更新 ! 超 1/3 高校新增开设数据...
  • 新工科背景下数据科学与大数据技术专业课程体系建设探索实践.pdf

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 84,239
精华内容 33,695
关键字:

数据科学与大数据技术