热门好课推荐
猜你喜欢
相关培训 相关博客
  • 教育数据挖掘中所使用的常用工具:(排名不分先后)-RapidMiner5.3-SAS-Matlab-java-waka-R-Excel教育数据挖掘目的:预测学生需要多少时间回答出问题预测学生在测试习题中会获得的分数预测学生会在Moocs上看多久视频会感觉到疲惫预测学生掌握的知识点(属性)预测题目包含的知识点(属性)预测学生在
    2015-07-14 08:34:04
    阅读量:1615
    评论:1
  •   随着文本信息的急剧增长,如何从这些海量的非结构化或半结构化的文本信息(如文档、客户电子邮件、问题咨询、网页等)中发现有效、新颖、潜在的有作用的、可理解的知识模式,成为人们急待解救的问题。这也正是文本挖掘所要解决的问题。文本挖掘不仅能从大量的文本信息中迅速发现对自己有用的信息,而且还能在一定程度上挖掘出文本信息与文本信息之间的关系,产生出人们未曾意识到的有用结果。因此,文本挖掘已成为一个日益重要...
    2018-07-31 11:24:00
    阅读量:1
    评论:0
  • 基于大数据挖掘----浅谈大数据与大数据挖掘一、大数据技术1.1大数据的定义大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。从某种意义上来说,大数据是为了更经济地从高频率的、大容量的、不同结构和类型的数据中获取价值而设计的新一代构架和技术。简而言之,...
    2019-01-21 14:38:51
    阅读量:7701
    评论:1
  • 大数据挖掘hjgc20012013-01-06325这本书已经由剑桥大学出版社出版。如果你购买精装版,可以享受20%的折扣。经出版方同意,你可以免费下载本书。但剑桥大学出版社拥有本书的所有权,如果你希望重印本书的全部或部分章节,需要得到出版社的授权。很遗憾需要特别指出这点,因为据我们目前掌握的证据表明,有人将我们以前在网上公开的书籍更换名字后重新出版。正如本书第三章所述,这种侵权行为是很容易...
    2013-01-07 08:21:00
    阅读量:18
    评论:0
  • 编者按:教育大数据是指整个教育活动过程中所产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合。在当前国际形势下,教育大数据从战略高度应定位为推动教育变革的新型战略资产、推进教育领域综合改革的科学力量以及发展智慧教育的基石。教育大数据的最终价值应体现在与教育主流业务的深度融合以及持续推动教育系统的智慧化变革上,具体表现在驱动教育管理科学化、驱动教学模式改革、驱动个性化学习
    2017-09-25 08:32:43
    阅读量:22122
    评论:0
  • 1、产品名称Stratifyd大数据分析平台2、所属分类金融科技·智能获客3、产品介绍Stratifyd大数据分析平台是Stratifyd大数据团队设计和研发的快速分析响应解决方案,其核心是以非结构化数据的AI处理为主,将非结构化文本数据和所有结构化数据有机的结合起来。Stratifyd平台是基于Stratifyd的大数据实践经验以及对大数据处理和分
    2017-09-30 10:10:36
    阅读量:4674
    评论:0
  • DBLP(DigitalBibliographyandLibraryProject)是一个计算机类英文文献的集成数据库系统。DBLP所收录的论文质量较高,文献更新速度很快,很好地反应了国际学术研究的前沿方向。DBLP数据可以为人们提供大量有用的知识,通过对DBLP数据的分析,可以找到权威作者。对权威作家的分析,可以挖掘出计算机研究的新领域。作者合著关系属...
    2013-11-10 22:16:00
    阅读量:9
    评论:0
  • 1、度量给定词语在少数文档中的重要性:TF.IDF得分其中:tfij指词项i在文档j的词项频率,idfi指词项i在文档集中出现的逆文档频率。词项频率:   逆文档频率:例如:文档集有2^20篇文档,w在其中2^10篇中出现,在文档k中,只出现1次,该文档任一赐予做多出现20次。于是有:tf(w,k)=1/20,idf(w)=log(2^20/2^10)=1
    2016-08-20 22:33:16
    阅读量:377
    评论:0
  • 大数据:数据流挖掘 下面是我看《大数据—互联网大规模数据挖掘与分布式处理》一书第四章的总结。1流数据模型:数据以某种速率达到处理引擎,该速率使得无法在当前内存存储数据。流处理一种策略是保留流的概要信息,使之足够回答数据的期望的查询。另一种是维持最近到达数据的滑动窗口。2流抽样:为创建某类查询创建的流样本。确定流中关键属性集合。对任一到达流的键值进行哈希处理,使用
    2013-02-23 16:18:54
    阅读量:1071
    评论:0
  • 第三章数据预处理3.1数据预处理3.1.1数据质量  数据质量涉及很多因素,包括准确性、完整性、一致性、时效性、可信性和可解释性。3.1.2数据预处理的主要任务  数据处理的主要步骤:数据清理、数据集成、数据归约和数据变换。数据清理通过填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性来清理数据。假设你想在分析中使用来自多个数据源的数据,这涉及集成多个数据库、数据立方体...
    2019-07-13 10:51:45
    阅读量:79
    评论:0