-
2017年湖北年鉴数据Word.rar
2020-06-13 16:38:552017年湖北年鉴数据Word版,分章节,侵删 1 目录和公告 2 综合 3 人口 4 就业人员和职工工资 5 固定资产投资 6 对外经济贸易和旅游 -
2018年云南省统计年鉴数据.zip
2020-05-03 19:20:082018年云南省统计年鉴数据,希望大家多多下载支持新人亲测好用,大家快来下载吧,挺不错的一个资源哦!! -
2018年中国统计年鉴数据,Excel版本。
2019-10-30 15:59:372018年中国统计年鉴数据,是Excel版本的,可以作为研究,欢迎大家下载。 -
深圳统计年鉴数据
2018-08-17 16:27:15深圳市2006年统计年鉴,包括人口、交通等各方面的统计数据 -
四川2017年统计年鉴数据整理.xlsx
2019-09-22 10:08:15四川省的2017年卫生统计年鉴中的数据整理,将所有精确到区县的数据都整理出来了,可以用于相关的区县级卫生医疗GIS分析。 -
中国县域统计年鉴数据合集2015~2019.rar
2021-03-01 23:38:03已整理合并为.xlsx和.dat文件,Excel或STATA均可以打开。根据2015-2019年《中国县域统计年鉴》,整理合并得到2014-2018年的2081个县市25个社会经济指标数据 -
全国大部分城市统计年鉴数据整理
2018-08-16 20:34:30含全国大多城市(地级市、副省级城市、直辖市)的经济、人口、面积等主要统计指标资料,另含一线城市、新一线城市的主要指标对比情况。 -
怎么找到各类年鉴数据
2020-11-12 23:47:24 -
上海能源与环境统计年鉴数据(2000-2012)
2014-08-19 20:11:28将上海市2000-2012年能源与环境部分的统计年鉴资料进行了整理 -
2017中国统计年鉴(数据不齐全,省市区的资料不完整))
2017-12-27 11:24:232017年中国统计年鉴数据,Excel版本,可做研究资料,比较权威 -
中国保险年鉴统计数据
2019-05-07 11:23:03非常好的保险年鉴,请各位大大放心下载。 -
2017河南统计年鉴县市数据
2018-04-09 13:09:562017河南统计年鉴 -
城市统计年鉴2008
2020-12-23 23:26:14中国城市统计年鉴数据 -
浙江省统计年鉴2017分享数据
2018-05-11 18:33:58最新浙江省统计年鉴2017年数据分享,2000-2017年都有,会陆续上传 -
2011年的统计年鉴完整数据
2012-05-06 16:24:26统计年鉴的数据很难弄到,这次批量上传了以享读者。 -
湖南统计年鉴2012
2013-08-21 04:24:50中国统计年鉴数据分省市数据 湖南统计年鉴数据2002 -
云南统计年鉴2012
2013-08-21 04:21:28中国分省市2012统计年鉴数据 云南省市数据 -
山东统计年鉴2018年各市数据.rar
2020-04-30 22:23:26《山东统计年鉴2019》中包含各市数据的指标内容,数据多为2018年,也有部分2017或2016年的数据 -
河北省统计年鉴 劳动力分析数据
2010-05-13 10:20:53河北省统计年鉴 劳动力分析数据河北省统计年鉴 劳动力分析数据主要介绍劳动力分析 -
广东统计年鉴2009
2011-12-30 10:07:44广东省统计年鉴2009,资源来源于本人当年年鉴数据 -
机器学习年鉴总结之数据集
2018-11-13 14:21:01三个数据集: 1.训练数据集 — 用来训练你的算法模型 2.开发数据集 — 用于调整学习模型,比如调整参数、选择特征等。这部分数据也称 作预留 交叉验证数据集。 3.测试数据集 — 用于评估模型性能,这部分数据集不...三个数据集:
1.训练数据集 — 用来训练你的算法模型
2.开发数据集 — 用于调整学习模型,比如调整参数、选择特征等。这部分数据也称 作预留 交叉验证数据集。
3.测试数据集 — 用于评估模型性能,这部分数据集不参与模型调整和参数更新。
- 选择最终实际要用的数据,作为开发和测试样本集。
- 使用同一分布的开发和测试数据集。
在开发测试集上表现很好,但是在测试集上表现得并不理想。
- 如果你的开发数据集和测试数据集的分布是一致时,这时你会有非常明确得错误诊断方法, 即:你的模型在开发数据集上发生了过拟合。这时解决方案也很清楚,增加开发数据集中得 样本数量即可。
- 但是如果开发数据集和测试数据集的分布不一致时,解决方案就会不那么清晰了。产生这种错误的原因可能有以下几种:
- 模型在开发数据集上发生了过拟合。
- 测试数据更难处理和预测,你的算法可能和预期是一致的,此时没有显著提升性能的可能性了。
- 测试数据也肯能不是更难,只是与开发数据集中的数据不同。所以在开发数据集上表现很好的模型, 在测试数据集上却并不管用,此时你在开发数据集上,所做的任何努力都白费了。
总结:构建开发和测试数据集
1.选择与实际数据(或你期望的数据)一致的开发和测试数据集,这些数据可能与你的训练数据不 同 。
2.开发数据集和测试数据集中的数据分布应当一致 。
3.选择单值衡量指标作为你的团队优化目标,如果要考虑多个目标,可以通过一个表达式(比如求平均)将多个指标合并成一个指标,也可以把指标分为约束性指标和优化性指标。 比如,为文件大小和执行时间设置一 个阈值,然后在此基础上,尽量优化准确率。
4.机器学习是一个高速迭代的过程,在目标满足前,你可能需要尝试数十个想法 。
5.拥有开发/测试集和单值衡量指标后,可以让你快速评估你的算法,从而加速迭代 。
6.当开始一个全新的应用时,尽量在一周内,快速的建立开发/测试集和衡量指标。如果时成熟的应用,花长一点时间也没关系。
7.当你有非常多的数据时,将数据按 7:3 的比例分成训练和测试样本集并不合适,此时开发和测试样本集中的数量要远低于 30% 。
8.你需要有足够大的开发数据集(但也不要太大),让你能看出算法精度上有意义的改变。测试样本集中的数据要尽可能的多,这样评估出的结论才能让人信服。
9.如果你的开发数据集和评估指标,已经不能再给你的团队指明正确的方向了,那你需要迅速的改变它们:
1).当开发数据集上发生过拟合时,此时添加更多的数据到开发数据集中
2).如果真实的数据与开发/测试集中的数据不一致时,更新开发/测试数据集即可
3).如果衡量指标不能衡量你所关心的最重要事情,则需要更换衡量指标
-
2018美国基金业年鉴-数据图表简版
2018-05-16 20:45:172018美国基金业年鉴版权归属美国投资公司协会(ICI),所谓投资公司其实就是基金,本文引用其中12张图片概述一下全球基金行业的变化。特别说明,在2018版中增加部分中国基金行业的数据,说明中国基金行业备受全球...2018美国基金业年鉴版权归属美国投资公司协会(ICI),所谓投资公司其实就是基金,本文引用其中12张图片概述一下全球基金行业的变化。特别说明,在2018版中增加部分中国基金行业的数据,说明中国基金行业备受全球同业的重视,另外本文中所以的货币单位均为美元。
-
2019 数据竞赛年鉴联合发布!250页竞赛方案合集
2020-02-17 20:15:52竞赛年鉴2019由于近期肺炎疫情严重,大家也只能在家的进行远程进行上班和学习。为了帮助更多小伙伴在长假期间继续学习,我们给大家整理了2019年数据竞赛的资讯和优胜者解决方案。电子版下载识...竞赛年鉴2019
由于近期肺炎疫情严重,大家也只能在家的进行远程进行上班和学习。为了帮助更多小伙伴在长假期间继续学习,我们给大家整理了2019年数据竞赛的资讯和优胜者解决方案。
电子版下载
识别下方二维码,回复 "2019",即可下载。
点击查看更多竞赛资讯
爱可可推荐!Datawhale数据竞赛Baseline开源分享!
-
广东建设年鉴2018(2017年数据)
2019-06-14 14:10:22其宗旨是及时、全面、系统、翔实地记录广东省住房和城乡建设事业发展状况,为各级领导决策和行业管理提供依据,为社会各界了解、研究广东省住房和城乡建设的历史发展及现实风貌提供信息资料和数据。 二、《广东建设... -
中国统计年鉴2018(excel版)
2018-12-18 19:54:292018年中国统计年鉴数据,Excel版本,可做研究资料,比较权威 -
世界统计年鉴,查找数据超级方便
2009-09-18 20:41:31世界统计年鉴,很难才找到的,自己买的话可是很贵的哦,本着好多西就晒的原则,快下 啊 -
这是一份不完整的数据竞赛年鉴
2021-02-07 21:10:40↑↑↑关注后"星标"Datawhale每日干货&每月组队学习,不错过Datawhale调研主题:关于竞赛选手的反馈摘要:2019年的数据竞赛年鉴主要关于竞赛... -
中国卫生统计年鉴2010 国家统计局数据
2011-01-06 22:24:36中国卫生统计年鉴,2010中国卫生调查情况 -
中国城市统计年鉴2018(基于2017年数据).zip
2019-11-30 16:59:44此文件为中国城市统计年鉴2018,共有412页,覆盖城市全面,可为数学建模,经管专业学生提供数据查找,可以直接进行复制粘贴操作。 -
云南统计年鉴2007-2018年.rar
2020-06-14 20:26:53从云南政府信息化平台收集打包的10年的统计年鉴数据,从2007年到2018年近10年,希望对大家有些帮助
-
华为1+X——网络系统建设与运维(高级)
-
NFS 实现高可用(DRBD + heartbeat)
-
calculator-源码
-
Galera 高可用 MySQL 集群(PXC v5.7+Hapro)
-
0304-01如何搭建自己的前端脚手架cli
-
入党自传材料模板.pdf
-
VS WPF 整理XAML代码
-
C和C++课程
-
Web_Scrapping_bs4-源码
-
Node-Jenkins:Jenkins与Node Js集成-源码
-
具有执行器故障的柔性超音速飞行器的滑模容错跟踪控制
-
python Flask+scrapy+人工智能 实现高性能搜索引擎
-
windows访问不了github或者访问速度很慢
-
GO语言 实现端口扫描
-
为什么用企业微信做私域运营
-
C语言零基础入门(详细讲解)
-
vegan:朋友的登陆页面。 一些引导-源码
-
如果你想尝试使用此编辑器,
-
医疗直播有什么应用场景?其所需功能是什么?
-
用Go语言来写区块链(一)