精华内容
下载资源
问答
  • 对于都市人而言,每天着朝九晚六的生活,承受着工作与生活上的压力,总会有那么一刻想逃离的冲动。然而出去一看,到处都是人头,风景也没有想象中的美,出去一趟也是舟车劳顿,本来是想出去放松一下,结果感觉比...

    提到旅行,首先映入你脑海的是什么?是没钱没时间,还是从一个人呆腻了的地方到别人呆腻了地方?对于都市人而言,每天过着朝九晚六的生活,承受着工作与生活上的压力,总会有那么一刻想逃离的冲动。然而出去一看,到处都是人头,风景也没有想象中的美,出去一趟也是舟车劳顿,本来是想出去放松一下,结果感觉比上班还累。

    总有那么一群人,他们好像永远充满激情,享受着旅行的快乐,而且随着中国经济的发展,这样的人越来越多。看着他们发到朋友圈的照片,总是那么诱人。这是一群什么样的人?他们不需要工作吗?他们是怎样踏上旅程,心路历程又是怎样的?

    image

    这是一本特殊的书,作者是十八个爱好旅行的奇葩(实际上是十七名,最后一章留给了读者自己书写)。为什么说是一群奇葩呢?他们之中有用自行车丈量了我国边境线的,有玩高空跳伞的,有驾船在大海上流浪的,甚至还有怀着宝宝的辣妈。

    在我们想象中,爱好旅行的人应该都是自由职业,比如摄影师、记者、作家之类的,另外有着超高的收入。然而这本书的一群作者大部分都是和我们一样有着普通的职业,也不是富二代。比如作者之一贝爷贝克斯,就是一名苦逼的程序员,每次旅行的时间都是挤出来的。

    与最好自己的距离,只差那一点点上路的勇气

    image

    有的人可能会认为绕着国境线骑行一圈挺傻的,高空跳伞这种运动太刺激,纯粹是作死。对于这种想法,只能说生活从来不是遵循一种方式从生到死。如果你希望过一种画地为牢、没有变化的生活,自己喜欢就好。如果你渴望生活有些变化,是什么阻止了你的行动呢?打开这所牢狱的钥匙不是钱,也不是时间,而是你想要推门而出的勇气。这个远方,并没有像你想的那么遥远和路途艰难。

    独自一个人骑行中国边境线,会不会害怕?有没有危险?当然会有担心和害怕,这是人之常情。面对旅途中有太多的未知和不确定,面对理想和现实相冲的纠结,面对旅途中设想的种种可能的危险,有多少人能够淡定自若毫不介怀?

    待到行动起来,一切问题都会有解决的方法。路上有危险么?就中国目前的治安状况,最大的威胁来自交通事故。然而即便呆在都市里,交通事故一样是最大的危险。

    有了小孩,是不是会被困住,让你感觉寸步难行?对于热爱旅行的人来说,根本不是问题,可以带娃一起旅行。娃还在肚子里,只要做好充分准备,一样可以的。不信你读一下本书,两个妈妈的亲身经历,看看她们是怎样“疯狂”的。

    当然,旅行并不是头脑一热就出门,那叫作死。如果你连自己所在的城市都没骑行过,一开始就挑战全国,可行么?如果你有恐高症,去尝试高空跳伞,你也不会感受到丝毫乐趣。总之要的是量力而行,旅行的方式有千万种,总有合适你的。

    被钱羁绊了旅行的脚步,是人生最遗憾的事情

    image

    钱在旅行中重不重要?很重要。资深的旅行者会鄙视那些不顾一切,毫无目的的流浪。要知道,一次次旅行不会即刻给生活带来翻天覆地的变化。旅行不是逃避,不是远离现实,而是塑造一个更好的自己。

    那是不是非要攒够钱才能旅行呢?

    旅行,一定要乘飞机吗?火车、动车呢?你一定回答不,火车太脏,动车太硬,还是等我存够钱来一次旅行吧。等你攒足了钱,已经错过太多的风景。

    免费旅行可能吗?还真有人享受到了。他们是如何做到的,一部分是由于幸运,更多的是靠的实力。比如,某些旅游局会提供免费的体验机会,条件是写出精彩的游记。比如参加一些征文活动。

    文笔不好咋办,那就努力挣钱吧!做一个旅行者,首先需要的就是谋生的技能,旅行不能替代生活。你可以尝试澳洲和新西兰的打工旅行,起码你得英语过关才行啊。梦想,每个人都有,而且人生的不同阶段总会有不同的梦想,但要实现不同的梦想却需要走艰辛的道路。

    朋友圈里的人都在旅行,你的时间都去哪儿了?

    image

    旅行是需要时间的,对于大多数上班族而言,没有大片的时间来旅行。但本书的作者就有这样一群人,也是普通的上班族,然而却走遍世界。在《如果你也是一名苦逼的上班族》一文中,作者分享了他的旅行经历,其实都是利用了国家法定假日,加上年休假,毫无秘诀可言。

    在《不要辜负了最好的年华》,一名程序员以工程师特有的严谨分享了他的规划。“若是你没有实力支撑你的梦想,那你就得先安静下来去努力,千万不要在最该努力的时候却选择了安逸。”在完成好人生规划之后,就有实力选择不同的生活方式。休假,也不用看老板的眼色。这个时候,还会哀叹没有时间么?

    在最美好的年华里该多疯狂就多疯狂,该多努力就多努力,该多放肆就多放肆……


    有的人会习惯按固定的轨迹来画圈,他们害怕变化却又羡慕着别人画出的圈绚丽多姿。别人的都是故事,自己的才是人生。

    image

    展开全文
  • ​(Python是什么?Python教程,Python就业,Python爬虫,Python入门以及Python数据分析史上最全学习路线图 生活不止眼前的苟且,还有诗和远方。...大学期间,参加学生会参加社团,懵懵懂懂得

    ​(Python是什么?Python教程,Python就业,Python爬虫,Python入门以及Python数据分析史上最全学习路线图

    生活不止眼前的苟且,还有诗和远方。如果你连苟且都做不到,何来的诗和远方呢?

    分享一下我从内心厌恶程序员到毕业后找不到工作的无奈,参加培训,再到两年Python程序员的心路历程。

    我大学考上的是普通二本,学习的专业是经济学(~嗯,这个大家应该懂,普通二本理工院校的文科专业,我们系有2000人,你们猜猜=几个理工系的人数?)。大学期间,参加过学生会参加过社团,懵懵懂懂得度过了大一大二的浪漫校园生活,那时候的生活真的是无忧无虑,现在每次看英雄联盟的比赛都很怀念那段校园时光,你能想象几个人围一圈指导一个人打游戏,在嘲讽与被嘲讽的边缘疯狂徘徊的感受吗?那时候大家好像对成绩都没有很高的要求,只要不挂科就可以了。我们都在极力安排好自己除了学习以外的校园生活来弥补高中的遗憾。

    大三到毕业前的那段时光里,有准备考研的,有准备考公务员的,这时候就有些残酷了,你会发现以前和你一起睡到十点多的舍友有六点就起床的,会发现你逃课睡懒觉醒来后宿舍已经空无一人,会发现每天晚上不再是所有人都会回宿舍了(此处省略一万字),会发现大家开始讨论今天在图书馆抢到座位了吗?我还是一如既往地每天躺在宿舍,中午让舍友帮忙带饭,下午起床LOL,晚上王者荣耀。这个时候的自己是有些孤独的,但心里还是会自我安慰:没事,大学浪完了以后到社会上好好工作,就像早上起来跑步就应该是已经工作的人该做的事。

    20年毕业后的三个月里我都还很迷茫,一个人来到北京也不知道自己想要找什么工作,也不知道自己想去什么样的公司。投简历锻炼面试能力吧,简历上写啥?这个时候你会发现自己好像什么都不会,就算你写上了去面试的时候,面试官还会问你,你经历过的最痛苦的事情是什么,你是怎么克服它的?(我真的很想告诉他,我现在回答你这个问题就很痛苦,我正在努力在记忆里搜索曾经的鸡毛小事,还得想好怎么去克服它。)投简历的时候就会发现:工资高、应届生的是编程;工资低、应届生的一大堆,去面试过几家,我还去某农业电商公司做了一星期的运营专员,入职后发现每天的工作是电话处理客诉,内心还会去想这种高中毕业都可以做的工作,我何必上四年大学呢,所以辞职了。辞职后,我后悔了,因为没有工作经验,上家公司的工作时间、上班距离相对来说还是比较合适的(这个时候我已经不再考虑要想hr要多少薪资了),所以我又迷茫了一个月。这一个月里,越是面试越是后悔从上家公司辞职,这时候我开始给自己重新定位了,靠自己先活着,活下去最重要!

    就这样,我开始边找工作边了解编程(注意是了解,内心由厌恶开始因为钱而感兴趣),浏览了各大招聘平台薪资,平台大小,平台需求发现IT至今仍是投入产出比最高的行业之一,金融IT男并不是空穴来风。我开始通过百度,知乎,联系学长学姐去了解程序员的状态,得出结论发现这个行业没有我凭空想象和听别人说的那么苦,那么累,只是需要动脑子去思考。有个学长说,程序员闲的没事时候,总编一些自黑的段子,包括找不到媳妇之类,本来并没有的事,传的人多了也就有人信了,直到我工作一年的时间里我都还是这么认为的。

    想要真正的去了解它,而且想通过它赚钱就不能只听别人怎么说了。隔行如隔山呀(只有翻过这座山,才能让别人听到我的故事,S9我支持翻山队!)真的是人生苦短,我学python!而且python对英语的要求比较低,这里我为大家提供当时我从了解python到用python找工作的视频学习资料,感兴趣的小伙伴可以先码后看。

    有小伙伴可能会问,自学编程也能找到工作?你这不是蒙人吗?我想说的是从小到大,你现在掌握的东西哪个不是你自学的?你多向别人低头哈腰一次,你就少学一门本事。(原话是你多学一门本事,你就少向别人低头哈腰一次。)

    程序员的编程教室

    • 微信公众号ID:编程从0学起

    Python自学入门基础:

    Python入门教程完整版(懂中文就能学会)

    python网络爬虫第一天

    python网络爬虫第二天

    python网络爬虫第三天

    爬虫思路图

    Python练手项目:

    2小时利用Python实现一个聊天器

    Python从零基础到大牛项目实战:

    不可以放链接,就把资料名称放上来啦,

    先打好基础,后用项目练习,全套的学习路线图:

    新年已经到来,给大家发一次干货吧,相信有很多的小伙伴都不想浪费寒假这个提升自己的机会,那今天小编给大家一个福利了,就是我给大家整理了一套全套的python的学习教程,今天无偿分享给大家,这一套视频是从华为的麒麟团队极力推荐的一套python410集和学习电子书!

     


    视频教程

    程序员的编程教室

    • 微信公众号ID:Python入门学习资料

     

    展开全文
  • 作者:David K(来自知乎)排版:杰少,kaggle竞赛宝典小编“听很多道理,却依然不好一生;看很多分享,却依然做不好比赛。”如今,数据科学竞赛(大数据竞赛,机器学习竞赛,人...

    作者: David K(来自知乎)

    排版:杰少,kaggle竞赛宝典小编

    “听过很多道理,却依然过不好一生;看过很多分享,却依然做不好比赛。”

    如今,数据科学竞赛(大数据竞赛,机器学习竞赛,人工智能算法竞赛)已经成为各大知名互联网企业征集解决方案和选拔人才的第一选择,很多同学为了拿到大厂offer,纷纷加入了数据竞赛的浪潮之中。遗憾的是,大部分同学都在激烈的竞争中成为炮灰,许多人不停地上网浏览各类竞赛开源分享,却依旧感到困惑迷茫。

    在过去几年时间内,笔者靠着个人天赋和不懈努力,从0到1地走通了数据科学竞赛方法论,培养了一直数据科学竞赛的团队,并作为队长率多名选手参与了近20次数据科学竞赛,获得前5名5次,前10名8次,赛题方向包括金融、交通、信息安全、广告推荐、运筹优化等。考虑到近几年在数据科学竞赛里取得的丰厚的成果,我将自己的独门秘笈进行了详细总结并开源之,希望可以帮助更多同学快速上手相关比赛。

    我认为这份竞赛秘笈与市面上流传的各种竞赛分享相比,更real,更direct,更cunning。如果你想快速成为竞赛高手,这份文档是你必须要认真研究的参考资料。

    下面,我将从三个方面来详细介绍数据科学竞赛,然后在结尾处谈一点个人的感悟。建议不熟悉机器学习建模套路的同学先搞清楚流程,熟悉建模套路的同学,直接看经验干货即可。

    目录

    一、数据科学家竞赛是什么?

    二、为什么要做数据科学竞赛?

    三、怎样做数据科学竞赛?

    • 3.1 武器库

    • 3.2 赛题分析

    • 3.3 数据探索

      • 3.3.1 数据整体认知

      • 3.3.2 数据质量分析

      • 3.3.3 数据统计量分析

      • 3.3.4 数据分布分析

      • 3.3.5 数据探索小结

    • 3.4 特征工程

      • 3.4.1 数据预处理

      • 3.4.2 特征构造

        • 3.4.2.1 思想方法

        • 3.4.2.2 特征构造举例

        • 3.4.2.3 特征构造 注意事项

      • 3.4.3 特征选择

      • 3.4.4 特征工程总结

    • 3.5 模型选择

    • 3.6 模型优化

      • 3.6.1 评估方法

      • 3.6.2 性能度量

      • 3.6.3 参数调整

    • 3.7 模型融合

    • 3.8 迭代策略

    • 3.9 其他

    四、总结

    一、数据科学竞赛是什么?

    数据科学竞赛是由企业或者研究机构通过竞赛平台发布商业和科研难题,通过高额奖金的悬赏,吸引全球的数据科学家参与,利用众包方式解决建模问题的一种游戏。这个游戏本质上就是一种打擂台的玩法,符合各种有限游戏的规则设计,不过你同时要与成百上千的人PK。

    数据科学竞赛一般通过各类数据竞赛平台进行发布,最著名的数据科学竞赛平台是Kaggle和天池,Kaggle的背后是Google,天池的背后是阿里巴巴。当然,还有很多公司自己组织的比赛和顶级学术会议筹办的比赛。如果你想做比赛的话,去下面这些平台上寻找适合自己的比赛即可:

    1. Kaggle,天池

    2. 京东智汇平台,DataFountain,DataCastle,科赛网,创新工场AIChallenger等

    3. 腾讯,滴滴出行,第四范式,中国平安,融360,中国农业银行等

    4. SIGKDD,ICDM,CIKM,IJCAI等

    二、为什么要做数据科学竞赛?

    第一,让你100%清楚哪些算法在实际应用中更有效。解释一下,这里的“有效”包括算法的性能和效率。现在很多人往往是看过了周志华的西瓜书,就觉得自己懂机器学习了,这是很可笑的。最典型的例子就是很多人觉得SVM是最好用的分类器。包括很多发过会议论文的同学,其实也是停留在理论的乌托邦,而且论文的results部分有多real也很难判断。做比赛你可以拿到工业界的数据,而且这些数据都是头部互联网大厂的实际业务数据,所以在实战的过程中,我们可以逐渐井底之蛙蜕变为翱翔在天空的雄鹰,很清楚地知道哪些算法好用,哪些方法靠谱,哪些人在吹逼和忽悠。

    第二,结识朋友,提升人脉。做比赛时如果你运气比较好,可以和优秀的同学组队,当然前提是你自己足够牛逼。另外,如果你拿到了某个竞赛top5或top10,你的team有可能被邀请去参加线下的答辩,这绝对是认识技术大牛,提升人脉的好机会。比如笔者就去过像阿里云、京东、滴滴、马上金融,中国平安、中国农业银行这样的单位参与线下答辩,在紧张的答辩之余,利用吃吃喝喝的时间进行social,运气好的话,你还能加到某些公司中高级管理者的微信。截止目前,国内竞赛圈一半以上的头部大佬都是我的朋友,有些还在一起玩比赛、做课题。

    第三,训练和提高自己快速写代码的能力。要知道每场比赛你要在短时间内实现很多很多的idea,有时候一天之内你要想出三到四个上分的办法。这个过程讲究的是速战速决,不仅可以训练自己快速写代码和实现idea的能力,也可以很好地训练你的判断力和决策能力。

    第四,实习机会 & 高薪工作。像我之前就拿到过多家大厂的直通终面机会。统计了一下跟我做过比赛的学弟学妹的工作情况,目前大部分就职于知名国企和互联网企业,比如阿里、腾讯、京东、滴滴、美团、中国农业银行、中国交通建设股份有限公司、中国人寿资产管理有限公司、一汽大众等等。

    第五,奖金。一般的比赛都会有奖金,不给钱的比赛就别做了,那种比赛除了练手,没有任何价值可言。钱是体现赛题困难程度的重要指标。具体的钱数,最少1万起,多则税前30万到50万。但悲哀的是,奖金一般人是拿不到的,因为任何一个圈子都是1%的人赚走了99%的利润,小白们只能跟着长点见识,苦逼陪跑。

    三、怎样做数据科学竞赛?

    3.1 武器库

    俗话说,台上一分钟、台下十年功。虽然参加数据科学竞赛不需要十年的修炼,但还是需要一些基础的知识技能作为支撑的,我讲以下几个方面。

    基础知识

    • 数学基础:微积分、线性代数、概率论与数理统计、优化理论

    • 机器学习理论:周志华《机器学习》、李航《统计机器学习》、Ian Goodfellow和Youshua Bengo《Deep Learning》、Bishop的PRML

      • 目前国内大大小小的课程和博客都在讲周志华的西瓜书和李航的书,但这里我想补充一点个人的看法:

        • 我认为我看过的最好的讲传统机器学习理论的书籍是K. P. Murphy的《Machine learning: A Probabilistic Perspective》,其次是Bishop的PRML

        • 另外,台大李宏毅老师的网课,真的是十分良心,建议大家去B站学习

    • Python:《Python基础教程》《利用Python进行数据分析》《机器学习实战》

    文献资料

    • Paper

      • 主要关注CCF A里的顶级会议论文

      • arxiv要好好利用

    • Csdn、知乎、GitHub等开源知识分享平台

    • Kaggle、天池里的各种kernel

    软件配置

    • 开发环境

      • Anaconda

      • Jupyter Notebook

      • Pycharm

        • 虽然Jupyter Notebook的交互性更好,但个人更喜欢用Pycharm

    • 开源库

      • 数据处理包:Numpy Scipy Matplotlib Pandas等

      • 机器学习包:Sklearn XGBoost LightGBM Keras TensorFlow Pytorch等

    硬件配置

    • 高性能PC:

      • 强推Macbook Pro,资金不足的话可以自己搭Linux。这个时代Windows也可以了其实,但用起来总有些地方让你不爽。

      • 早年很多关键的包比如lightgbm不支持Windows,笔者也是画了一两个月的时间才熟悉了Linux,用熟了还是很顺滑的

    • 服务器

      • 注:现在越来越多的比赛平台提供运算资源了,但除非是必须,能不用就不用,因为大家一起抢资源导致写了代码不能跑的滋味真的很酸爽

    关于以上这些知识技术储备,我建议大家不要一直看书,计算机科学和机器学习的相关应用都是实践性很强的项目。任何一门有关编程语言的教材,看一周的时间足够了。关键在于动手实践,做项目做比赛,也就是任务驱动型学习。关于编程我还想说一个原则,就是“天下文章一大抄,看你会抄不会抄”。在做一个任务时,你的代码能复制粘贴就不要自己敲。这些年我见过很多喜欢耍小聪明的同学,试图通过自主实现一些算法来证明自己的智商。这其实是一种十分幼稚的心理,编程本质上是一个结果导向十分明显的活动,解决问题远比证明你自己有多么优秀更重要。

    除了以上这些武器之外,你还需要知道做比赛的流程。参与一个数据科学竞赛,大致需要这么几个步骤:赛题分析,数据探索,数据预处理,特征构造,特征选择,模型选择,模型优化,模型融合,预测提交。其中数据预处理、特征构造、特征选择合起来可以称之为特征工程。然后,还需要一个有效的迭代策略来管理你的idea和代码。做比赛之前一定要将此流程牢记于心并一步一步地进行,下面就让我为大家介绍图中的每一步具体是如何操作的。

    3.2 赛题分析

    在我看来啊,赛题分析其实是在解决战略层面的问题,这一块其实是非常重要的,但市面上的很多开源的经验分享往往有意回避这一块内容,只谈各种具体的方法和技巧。殊不知,真正做成一件事,不仅需要“术”,还需要“道”,但可惜的是,懂“道”的人实在是不多。为了让大家更好地理解数据科学竞赛中的“道”,我将赛题分析部分总结为以下这些内容,包括对赛题背景的理解,对重要时间的把握,组队的规则,评测机会的多少,以及对赛方提供训练数据的理解。

    关于赛题背景。你需要仔细阅读官方给出的赛题背景,然后查阅相关资料,对问题场景做深入的理解。因为对于我们这些学生来讲,我们可能对机器学习和数据挖掘的理论知识掌握的很好,但缺乏对具体的问题场景理解。这就好比你只会做算术题却不会做应用题。希望大家记住一句话,解决问题的第一步是认识问题。你只有把问题背景认识清楚,看清出题者的动机,才有可能在比赛中取得好成绩。

    关于重要时间。一个数据科学竞赛一般要持续两到三个月甚至更长的时间,你在这么长的时间内肯定还会有其他的事情要做,所以时间管理是很重要的。所以要根据赛方给出的重要时间节点(包括初赛开始时间、组队完成时间、复赛开始时间、复赛结束时间、线下答辩时间),规划好比赛与其他工作的时间安排。这里要插一句,其实并行工作是很难的,也是很扯淡的。如果你想取的好成绩,还是需要专注在一件事上。

    关于组队规则。你一定要想清楚和什么样的人组队。我真心想告诉大家的一句话是,不怕神一样的对手,就怕猪一样的队友。这句话什么意思大家应该很清楚了。希望大家不拒绝猪队友,也不要当猪队友坑别人。还有一点就是,搞清楚这个比赛能不能利用小号。每多一个小号,意味着多一倍的评测机会。你的评测机会越多,你上分的可能性越大。因此,每场比赛都会有很多人拿不同的手机号去注册竞赛平台的账号以求增加自己的评测机会,排行榜上也存在大量的小号。有时候你虽然线上测评的分数在提高,但名次依然再下降,这时候不要灰心,说不定是前排大佬的小号把你踢了下来。

    关于评测机会。搞清楚每天有几次评测机会、几点开始评测。较大的比赛受限于计算资源,每天只有一次评测机会,这种情况下还是得好好做线下的测试,珍惜每一次提交的机会。同时,基于评测次数,设计每天的模型迭代策略。另外要注意的是,评测次数多不一定是好事,因为次数多了之后对自己有利,但对手也有利。所以在同样的游戏规则下,如何充分利用各方面的条件提高自己的排名,的确是个需要你认真琢磨的事情。

    关于赛题数据。你需要搞清楚,赛方提供了什么数据?要解决的问题:分类问题 or 回归问题?用什么软件工具:个人PC or 官方计算平台?提交什么样的结果?也就是结果的数据格式要求。我在刚刚做比赛的时候经常出现因为提交数据文件格式不正确而浪费评测机会。

    3.3 数据探索

    主要包括四个方面:数据整体认知、数据质量分析、数据统计量分析、数据分布分析

    3.3.1 数据整体认知

    所谓的整体认知就是,研究训练集、测试集、表数、记录数、用户数、变量数、变量类型、变量属性值、标签等内容,然后绘制实体-关系图。实体-关系图(E-R图)包括三个组成部分:实体、属性、关系。学过数据库的同学应该熟悉E-R图这个概念。

    比如我在做IJCAI2018阿里妈妈国际广告算法大赛时,就绘制了如下图的实体关系图来帮助我们理解数据。


    把这个图画出来之后,对每个属性变量,施以哲学中的三大灵魂拷问:

    • 你是谁?

    • 你从哪儿来?

    • 你要到哪里去?

    也就是搞清楚每一个变量包含了什么信息,搞清楚它的来龙去脉,搞清楚变量和变量之间的关系。通过这个过程,让你对整个问题背景和原始数据有一个深入地了解,为后续工作做准备。

    3.3.2 数据质量分析

    所谓数据质量分析,就是分析数据的缺失值、重复值、异常值、歧义值、正负样本比例(样本不平衡)等特性。由于这些东西都会影响到模型的学习效果,所以在后面做数据预处理时需要做相应的工作。

    图片来自网络

    3.3.3 数据统计量分析

    数据统计量分析主要分为三块:

    第一,对单个变量的统计分析。比如考察单个变量的均值、中位数、众数、分位数、方差、变异系数等。常用的工具有:直方图、箱线图、小提琴图等。

    第二,对两个变量的统计分析。这里主要考察的是两个变量统计分布之间的关系。常用的工具包括散点图、相关性分析图、热力图等。

    第三,对多个变量的统计分析。可以使用彩色的散点图,或者RadViz(详见scikit-yb.org/en/latest)。

    图片来自网络

    3.3.4 数据分布分析

    数据分布分析指的是考察某个字段或某些字段的统计分布。包括频数、时间、空间三个方面。

    频数统计。用概率论的语言讲叫累积分布函数CDF。比如在IJCAI2018阿里妈妈国际广告算法大赛中,我们就统计了不同点击次数下各有多少用户。基于类似的累积分布函数图我们就可以知道用户行为的分布情况,进而可以帮助我们充分理解数据。

    时间维度上的统计分布。我们可以观察事件发生的趋势和周期性,这里会涉及不少时间序列的知识。比如下图所示的“每天的点击数趋势”,就是在时间维度上考察点击数的变化情况。

    空间维度上的统计分布,我们可以寻找某个变量在地理位置上的相关关系。比如2020年以来我们十分熟悉的疫情地图,就是一种空间上的分布分析。

    另外,以上三种分析常常结合分组or聚类方法,对细分的业务场景进行考察,为后面的数据建模做铺垫。

    3.3.5 数据探索小结

    对于数据探索,我总结了几个需要牢记在心的关键点,分别是:对比,分组,频数,抓大放小和可视化。

    所谓对比,指的是在做数据探索时,考虑对比训练集不同样本之间的特征分布,还要考虑对比训练集和测试集中每一个特征的分布。

    所谓分组,就是在做数据探索时,常常用到按类别标签、某个离散变量的不同取值groupby后的sum、unique。

    所谓频数,就是要注意考察并自行计算某些变量的概率累积分布。诸如“事件发生次数”这样的的统计量需要自己计算;有时还要关注“同id下某个事件多次发生”的统计。

    所谓抓大放小,就是对于那些特征重要性较高的变量,要做重点分析。因为这些变量对你模型预测能力的影响是较大的。

    所谓可视化,就是建议大家在做数据探索的时候多画图(尤其是各种趋势图、分布图),图形给人的冲击力往往是要大于数字本身的。

    3.4 特征工程

    下面我们来讲特征工程。这也是做数据竞赛时最重要的一项内容。

    首先说一下为什么要做特征工程。

    在我们解决一个机器学习问题时,输入机器学习模型的数据必须是标准的向量形式。但当我们处理现实世界的数据时,数据并不会以格式规范的特征向量的形式呈现在我们面前。相反,呈现给我们的数据是数据库记录、时间序列、图像、音频、文字等形式,同时还存着在大量的噪声数据。所以我们需要一定的方法把非结构化的数据转化为结构化的数据。

    结合维基百科,我给特征和特征工程做了如下定义:

    特征:An variable useful for your modeling task,which describe/represent our data

    特征工程:A process of using domain knowledge, techniques, experiences or even tricks to create features that make machine learning algorithms work well.

    为了说明特征工程的重要性,这里聚一个小例子。下图中有一些蓝色的点和一些绿色的点,在直角坐标系下它们的分布如左图所示,肉眼看上去,它们显然是属于两个类别,但是如果你想用一个机器学习的线性分类器去做分类的话是很困难的。但是你把这些点转移到极坐标系下,它们就可以很容易用一个线性分类器做分类了。从这个地方我们就能看出数据的表示方式对机器学习模型的效果的影响还是很大的。

    图片来自Yoshua Bengio《Deep Learning》

    我希望大家记住一点,就是在解决一个机器学习问题时,最关键的就是去研究如何表示你的样本,而特征工程解决的就是representation的问题,Feature engineering is a representation problem。这里把传统的软件开发和机器学习项目做一个简单的比较:在编程开发项目中,很关键的地方在于如何优化你的代码;而在机器学习项目中,关注点变成了表示。也就是说,开发者通过添加和改善特征来调整模型。

    所以,这也是我们圈内经常说的,“数据和特征决定了机器学习的上限,而模型和算法只能去逼近这个上限”。我希望大家应该牢牢地记住这句话。不管是做机器学习的比赛还是实际的项目,特征工程都是最最重要的一部分。这里引用了两句英文来进一步证明这个道理:

    Coming up with features is difficult, time-consuming, requires expert knowledge. "Applied machine learning" is basically feature engineering.
    — 吴恩达Andrew Ng, Machine Learning and AI via Brain simulations

    “...some machine learning projects succeed and some fail. What makes thedifference? Easily the most important factor is the features used.”
    —《终极算法:机器学习和人工智能如何重塑世界》作者 Pedro Domingos

    我将特征工程分为三个部分,分别是数据预处理、特征构造和特征选择。下面分别介绍这些内容。

    3.4.1 数据预处理

    首先来说一下为什么要做数据预处理。首先,考虑到海量原始数据中存在大量信息缺失、不一致、冗余值、异常值等,会影响我们模型的学习效果。另外,在用各种模型算法时也要牢记监督学习的假设,即正负样本要平衡且训练集和测试集样本是独立同分布的。第三,在模型训练时,数据规范化的操作可以让梯度下降算法收敛得更快,也就是更快地找到最优超参数。

    传统意义上的数据预处理一般包括数据清洗、数据集成、数据重采样、数据变换(特征编码)和数据规范化(特征缩放),这一块的内容也是网络上流传最广、介绍最多的数据分析技巧,因此我不做具体的解释,仅仅把各自常用的处理技巧罗列一下。

    数据清洗

    • 缺失值插补

      • 均值、中位数、众数插补

      • 固定值插补

      • 最近邻插补

    • 离群值

      • 直接删除

      • 替换法

    • 异常、冗余值

      • 直接删除

    • 小技巧:用训练集数据学习一个模型,然后用它预测训练集的标签,删除预测结果偏差较大的样本

    数据集成

    • 多表数据整合

      • 一对一

      • 一对多

      • 多对一

      • 多对多

    数据重采样

    • 滑窗法:

      • 对于时间序列数据,选取不同的时间窗间隔,可以得到多份训练数据集

      • 该方法可以增加训练样本,也方便做交叉验证实验

    • 非平衡重采样:调整正负样本量

      • 欠采样

      • 过采样

      • 组合采样

    数据变换

    • 连续变量离散化(分箱)

      • 等频

      • 等宽

      • 聚类

    • 离散变量编码

      • One-hot Encoding

      • Label Encoding

    • 长尾分布

      • Ln、Log

    数据规范化

    • Min-Max

    • Z-score

    • MaxAbs

    网络上罗列的这些方法,如何更高效地使用,详见t.zsxq.com/IMfe2vB。

    3.4.2 特征构造

    在一个机器学习比赛中,很多的有效特征都不是直接给出的,需要自己去挖掘。不要以为实际中的训练数据都像UCI开源的数据集那样简单直接好用。

    我把基于对原始数据的数据探索,不断构造新特征的过程定义为特征构造(Feature Construction)。在这个过程中,你需要深入了解场景知识,并做大量开脑洞的工作。但仅凭开脑洞和无脑地堆砌并不能真正解决问题,如果你想构造出具有可解释性且丰富的特征,需要一套思想方法。

    在此我给出一种特征构造的思想方法,希望能给大家一定的启发。

    3.4.2.1 思想方法

    1. 理解字段

    2. 抽取实体

    3. 分析实体关系

    4. 设计特征群

    5. 按特征群分别构造特征

    6. 考察特征群关系,进一步构造新特征

    3.4.2.2 特征构造举例

    t.zsxq.com/IMfe2vB

    3.4.2.3 特征构造 注意事项

    t.zsxq.com/IMfe2vB

    3.4.3 特征选择

    前面你构造了很多特征,但这些特征不一定都是有用的,需要用特征选择的办法把有用的特征选出来。Feature selection is a process that chooses an optimal subset of features。特征选择可以帮你筛选有效特征,消除冗余信息,提高训练效率,避免模型发生过拟合。

    常用的特征选择方法如下图所示:

    我一直觉得特征选择是那种烂大街的知识。可问题是,这些方法都要用吗?哪个好用?哪个效率最高?t.zsxq.com/IMfe2vB

    3.4.4 特征工程总结

    这样整个特征工程部分就讲完了。我最后想提醒大家,在数据科学竞赛中,特征工程是一个需要不断迭代测试的过程,也就是说,数据探索、数据预处理、特征工程要反复多次进行。所以,一定要把75%以上的时间放在特征工程的工作上。

    3.5 模型选择

    我知道每个机器学习小白在做比赛前都把周志华的西瓜书和李航的《统计机器学习》翻了一遍又一遍。那我想问大家一个问题:书上讲的算法模型,比如LR,GLM,SVM,KNN,NN,Tree,RF,Adaboost,在机器学习比赛中,到底用什么,哪个好用,哪个效率最高?

    答:都不用!!!!!!!!

    我想这个答案可能有点出乎大家的意料吧。毕竟大家学了大半学期的机器学习,都是在讲这些玩意儿的原理。你是不是忽然觉得有些迷茫了呢?自己学了大半学期的书本竟然像垃圾一样没用。

    然后我想告诉大家,数据科学竞赛的模型大杀器是:基于决策树的集成学习模型,例如LightGBM、XGBoost、CatBoost等。

    从好用程度上来看:LightGBM > XGBoost > CatBoost。你甚至可以只用LightGBM来学习你的训练数据。

    下面我想解释两个问题:

    一,为什么梯度提升树打数据挖掘竞赛优势明显?

    看一个机器学习模型的开源工具好不好用,主要是看训练效率和学习能力的trade-off。像LightGBM这样的模型,训练速度快,效率高,还支持并行和GPU计算;同时能够处理大规模的数据,算法的学习能力更强,预测精确度高。

    二、为什么深度学习模型打数据挖掘竞赛优势不大?

    在此引用吴恩达老师在Coursera公开课中的一张图。

    该图横轴表示的是训练数据的条数,纵轴显示的是多种模型的学习效果。从这个图可以看出,当你的数据规模比较小时,深度学习模型的效果甚至还不如普通的机器学习模型。所谓的数据规模比较小,我给一个判断标准:2000万训练样本。也就是说,没有两千万的训练样本,深度学习模型根本无法施展它的威力。所以在传统的机器学习比赛中,我们还是用lightGBM这种集成树,简单粗暴却又威力无穷。

    3.6 模型优化

    模型优化主要分为三块,在此以一个思维导图呈现:

    3.6.1 评估方法

    周志华老师的西瓜书中讨论了三种模型优化的方法,分别是留出法,自助法和交叉验证法。在我看来这也属于烂大街的知识。还是老问题,在打比赛时,我们应该如何使用这些方法,有哪些关键性的技巧?这里有几条经验跟大家分享。

    K折交叉验证法

    来点干货:

    1. 比赛中最常用的模型评估方法是留出法和K折交叉验证法。

    2. t.zsxq.com/IMfe2vB

    3.6.2 性能度量

    在比赛中常见的指标(性能度量)包括AUC、Logloss、K-S、F1、Kappa系数等,这些指标都是综合考量模型对正类和负类的预测能力,更具有说服力。

    来点干货:

    1. 线下测试时,应多使用几种指标,单刷赛题给定的指标容易发生过拟合

    2. 如果几个指标同时上涨,则可以证明你的特征&模型取得了实质性的改进

    3. 针对赛题使用的性能度量指标,推导其数学原理,思考特殊的优化策略

    3.6.3 参数调整

    主要方法:

    • 网格搜索(Grid Search)

    • 贝叶斯优化(Bayesian Optimization)

    • 启发式算法(Heuristic Algorithms,如GA、模拟退火,PSO)

    工具包:Hyperopt等

    关于调参我实在不想讲太多东西,虽然网上这一块可能扯的很多。但一般扯的越多的东西,一般都是扯淡。事实上,用一用网格搜索就足够了。

    来点干货:t.zsxq.com/IMfe2vB

    3.7 模型融合

    所谓的模型融合,主要是指对不同子模型的预测结果的融合。江湖上有人说,“Feature决定了模型效果的上限,而ensemble就是让你更接近这个上限”。

    模型融合的方法网上有很多,在此我简单罗列一下。

    方法:

    • 简单加权平均:0.5*result_1+0.5*result_2

    • Bagging:对训练集随机采样,训练不同的base model,然后投票;可以减少方差,提升模型的稳定性(随机森林就是这个原理)

    • Boosting:弱分类器提升为强分类器,并做模型的加权融合;可以减少学习误差,但容易过拟合

    • Blending:拆分训练集,使用不重叠或者部分重叠的数据训练不同的base model,然后分别预测test数据,并加权融合(这是个好办法)

    • Stacking:网上讲的很多,但极易造成过拟合,尤其是数据量小时过拟合严重,不建议使用

    Stacking融合方法

    其实网上的资料总会给你各种误导,所以我想直接讲干货,告诉你如何更高效地用这些方法。

    t.zsxq.com/IMfe2vB

    3.8 迭代策略

    t.zsxq.com/IMfe2vB

    每日结果提交记录表

    3.9 其他

    还有一些内容是我想强调的,这些东西依然是战略层面的。不得不说,它们对你很重要。

    第一,做比赛的第一步是完成一个从0到1的原型设计。这是一种原型思维。也就是说,你要先做出一版能提交的结果,并提交成功。走完这一步,你才算刚刚上路。做任何事,完成从0到1的过程都是最重要的。

    第二,一定保证自己的代码是正确的,所谓正确指的是,正确地表达了你的idea而不仅仅是没有语法逻辑bug。这一点也是小白常常犯的错误。

    第三,写一个较为自动化的、高效率的代码框架。在数据预处理的部分,一定要少用暴力的for循环。一个入门级的baseline在这里:github.com/yzkang/My-Da,大家可以直接基于此代码做特征工程即可。

    第四,关于时间和精力的分配。做比赛是一件很辛苦的事情,每天压力很大,常常昼夜颠倒,没日没夜地写代码。所以,一定要善于抓住主要矛盾。数据探索+特征工程的部分要分配75%的时间和精力。模型优化及调参占15%,模型融合占10%。另外,珍惜你的每一次提交机会。

    第五,在闲暇时间,及时更新你的武器库,多阅读开源经验分享,多跟大佬们请教和学习。当然,大佬们都很忙,付费买时间是最佳的方式。

    四、总结

    最后我想谈一谈自己这几年做比赛、做项目、做论文、做团队的一点收获,希望大家批评指正。

    首先,我认为不管是在学校做事情还是在公司做事情,结果导向、以终为始是十分重要的思维方式。牢记邓公所讲的黑猫白猫论,通过不断地磨练让自己成为一只好猫。当然,这种思维方式可能不太适合体制内的工作人员。

    其次,编程的目的不是秀自己的智商,而是盖一栋房子,解决一个问题,实现一个目标。所以不重复造轮子是很重要的,我一直坚持的一个观点是,能抄别人的代码坚决不自己写,不到万不得已坚决不自己写。我们的手机,每个零件都有专门的厂家进行加工,编程做比赛也是一个道理。如果华为不购买别人家的芯片,一百年也造不出一个手机。通过借鉴吸收别人的经验成果,安全避坑,高效率地完成自己的目标,才是快速创造价值的真谛。

    第三,很多事情都是实践出真知。就拿编程来讲,你把编程语言的课本翻烂也学不会编程。机器学习的理论学的再好,你依然不会解决实际问题。很多工科性质的知识,你看过但没有用过,跟没看过一样。如果你是工科生,一定要注意多动手,多实践。

    第四,有竞争的地方就有江湖。在江湖上混,打铁还需自身硬。希望你知道,优秀的人只会和优秀的人合作,想升级你做事的圈子,先把自己搞成相对优秀的人。世界上绝大多数的合作都是强强联合。

    第五,靠天赋、努力还是运气?我认为做比赛最需要的是强烈的兴趣和自我驱动力,和智商的高低其实没有太大关系。一个比赛,你想做到Top50,我猜用这份资料讲述的经验应该足够了。你想做到Top10,需要坚持不懈的努力。你想做到Top5,多多少少还是需要一点运气的,毕竟在一个比赛的最后几天,提交机会相对越来越少,怎么把握这些提交机会,还是需要你与生俱来的判断力。

    最后,送给大家一句话吧:胜利后的复盘可能非常精彩,但实现的过程则枯燥而艰难。

    祝大家都能在数据科学竞赛中取得好成绩!

    往期精彩回顾
    
    
    
    适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
    AI基础下载机器学习的数学基础专辑
    获取本站知识星球优惠券,复制链接直接打开:
    https://t.zsxq.com/qFiUFMV
    本站qq群704220115。
    
    加入微信群请扫码:
    
    
    展开全文
  • 文 诗词君壹你是谁?你身边都有谁?这两个问题,决定了你一生会怎样。和不一样的人在一起,就会有不一样的人生。你和谁在一起,的确很重要,甚至能改变你的成长轨迹,决定你的人生成败。科学家认...

      文 诗词君

    你是谁?你身边都有谁?

    这两个问题,决定了你一生会怎样。

    和不一样的人在一起,就会有不一样的人生。

    你和谁在一起,的确很重要,甚至能改变你的成长轨迹,决定你的人生成败。

    科学家认为:

    “人是唯一能接受暗示的动物。”

    所以和勤奋的人在一起,你不会懒惰;和积极的人在一起,你不会消沉。

    与智者同行,你会不同凡响;与高人为伍,你能登上巅峰。

    与靠谱的人在一起,我们总是如沐春风,格外安心。

    如何判断一个人是否靠谱呢?

    通常有这9个特点:守信、守时、勇于认错、不在背后谈论八卦、心中有他人、

    不吹嘘、足够真诚、不占小便宜、有一定的能力。

    李嘉诚曾说:“做事要找靠谱的人,聪明的人只能聊聊天。

    《后汉书》里记载着这样一个故事:

    范式年轻时在太学求学,与汝南张劭是同窗好友,两人同时离开太学返乡,两人约定两年后,范式去张劭家里做客,探望老友。

    约好的日子快到的时候,张劭把这件事告诉他母亲,请他母亲准备酒菜招待范式。

    张劭的母亲说:“分别两年了,千里之外约定的话,你怎么会如此肯定地相信呢?”

    张劭回答说:“范式是讲信用靠谱的人,肯定不会违背约定的。”

    张劭的母亲说:“如果真是那样,当然得替你们准备酒食。”

    约定的日子到了,范式果然前来赴约,登堂拜见张劭母亲后,接着开怀畅饮,兴尽才离开。

    有句歇后语说得好:“场上的石磙子——落地一个坑。”

    一个靠谱的人,就像一座不倒的靠山,无论什么时候提起他,心里总是满满的踏实。

    这个世界上,聪明人很多,靠谱的人却是凤毛麟角。能与靠谱的人在一起,就是你最大的福气。

    惟愿我们都知道踏实做事、靠谱做人的真实积极意义,坚信不久的将来,内心

    所散发的踏实靠谱感,岁月和伯乐都不会亏待你们。

    与积极的人在一起,总能感受正能量,如同被阳光围绕。

    积极的人像太阳,照到哪里哪里亮;消极的人像月亮,初一十五不一样。

    有人说,人生有三大幸运:上学时遇到好老师、工作时遇到一位好师傅、成家遇到一个好伴侣。

    有时他们一个甜美的笑容,一句温馨的问候,就能使你的人生与众不同,光彩照人。

    一父亲在公司受到了老板的批评,回到家就把沙发上跳来跳去的孩子臭骂了一顿;

    孩子心里窝火,狠狠去踹身边打滚的猫;

    猫逃到街上,正好一辆卡车开过来,司机赶紧避让,却把路边的老板撞伤了。

    这就是心理学上著名的“踢猫效应”,典型的负能量传染所导致的恶性循环。

    有这样的一句话——大多数人带着未演奏的乐曲,走进了坟墓。

    原本你很优秀,由于周围那些消极的人影响了你,使你缺乏向上的压力,丧失前进的动力,而变得俗不可耐,如此平庸。

    生活中最不幸的是:由于你身边缺乏积极进取的人,缺少远见卓识的人,使你的人生变得平平庸庸,黯然失色。

    和负能量的人在一起心田慢慢荒芜,杂念丛生;而和正能量的人在一起,你会被激发出对生活的热爱,发现人生的美好。

    与相爱的人在一起,仿佛心生力量,眼里有了光,笑里全是坦荡。

    最好的相遇都是久别重逢,我一点都不遗憾没有在最好的时光遇到你,因为遇到你之后最好的时光才刚刚开始。

    在美国,一位93岁的老爷爷每天中午都到同一家餐厅吃饭。

    时间久了,大家都认识他,好奇地问:“你餐桌上放的照片是谁?”

    原来,照片中漂亮的女士是他4年前去世的妻子,这家餐厅,是妻子生前最喜欢的餐厅。

    老爷爷深爱妻子,63年婚姻,从未分离。妻子去世后,也时刻携带照片在身边。

    妻子怕黑,他就在家里留了一盏灯,从白天到黑夜,从未熄灭,唯恐爱人找不到回家的路……

    十年生死两茫茫,不思量,自难忘。千里孤坟,无处话凄凉!

    4年间,无论雨、雪、狂风,老爷爷每天都要去扫墓,抚摸着爱人的照片,不停地亲吻冰冷的墓碑,哽咽着诉说心头的爱恋与眷念:

    宝贝,我真想带你回家……

    冰心曾说:“有了爱,就有了一切。”

    就像她和丈夫吴文藻风雨同舟、患难与共56年。因为有爱的支撑,他们始终相互扶持,不离不弃,直至生命的尽头。

    生命的繁华之期,奔波于流年,有一个陪伴自己的人,眼中的春秋日月,枯荣山河,都因此而栩栩生辉。

    愿有岁月可回首,且以深情共白头。

    有句话说,人生的奥妙之处就在于与人相处,携手同行。

    如果你想像雄鹰一样翱翔天空,那你就要和群鹰一起飞翔,而不要与燕雀为伍;

    如果你想像野狼一样驰骋大地,那你就要和狼群一起奔跑,而不能与鹿羊同行。

    正所谓“画眉麻雀不同嗓,金鸡鸟鸦不同窝”,这也许就是潜移默化的力量和耳濡目染的作用。

    俗话说:“物以类聚,人以群分。”

    余生不长,和不一样的人在一起,就会有不一样的人生。和优秀的人同行,能帮助你遇见更好的自己。

    爱情婚姻也如此,家庭事业如此,人生道路也如此。

    推荐阅读:

    11 月全国程序员平均工资出炉

    一个CEO的忠告:你那么牛逼,怎么还是打工人

    关于年薪百万,聊聊年薪380万的研发人是什么样子的

    华为内网最火的文章:什么是内卷?

    太赞了!华为工程师整理的一套Linux学习资料和笔记,提供下载

    展开全文
  • 这条路上,我们从未停歇! 距离我退出提高班已经半年了,当时本以为我会为这个决定后悔一段时间呢,现在想想好像也没有那么后悔了,记得当时刚退出的时候我也是颓废了两个月呢,感觉每天不知道干什么,当时是真...
  • ◆ 和对的人在一起,连你的植物都会变得好起来 “每一盆多肉都是独一无二的,正如每一个人都有独一无二的灵魂。” ◆ 忘记那些非如此不可的人生指南 其实不仅仅是小路,只要你稍微有点特立独行,都会受到来自...
  •  那些年,我们一起错过的机会  文 本刊记者/邢力 尹娟 甄爱军 徐卓航  “珍惜”与“错过”的矛盾交织,恩怨起伏,是每个人的生命中都难以回避的重大主题。  《大话西游》中,至尊宝错过了紫霞,于是只能...
  • 从未离开,永远的爱

    2009-12-20 10:21:08
    姥姥家农村,我诞生后,妈妈没有时光照料我,就常常送我去姥姥家。从我记事起,姥姥,姥爷就成了我最亲的人。 童年的记忆就这样开端了, 娱乐行销 。街里离姥姥家并不算太远,大约有七十多里地远。每次回姥姥家...
  • 倚天的结局处,周芷若曾这样问张无忌,小昭、蛛儿、赵敏和她四个人中,他真正爱的人是哪...虽然期间曾产生误会,他对赵敏是又爱又恨,但心里从未放下对她的牵念。然而,芷若的介入总让他内心摇摆不定,始终无法
  • 点击上方“Python大本营”,选择“置顶公众号”python大本营 IT人的职业提升平台关于「程序员最大的遗憾是什么?」这个问题,我想每个人都有属于自己不同的答案。比如:没有选择尽早...
  • 我没回老家春节的那4点原因

    千次阅读 热门讨论 2019-02-04 22:40:21
    九朝古都洛阳,父母就洛阳市与三门峡市的交界处——洛阳市洛宁县河底乡郭头村——这也是生我养我的地方——上小学五年级到洛阳参加奥林匹克数学竞赛之前,我从未离开这里半步。 我和父母的距离一点也不远,...
  • 鲍尔默说他很多时候反应太慢,以至于没能...其中最遗憾的是没能把微软变成世界级的硬件公司。 从2000到2014,鲍尔默微软CEO的位子上坐了超过14年。这期间,个人电脑迅速向全世界普及,微软的Windows 一直是最多人...
  • 深圳之行---错过

    2015-06-22 22:17:49
    深圳之行若用两个字表达就是错过,错过飞机航点,错过最世界之窗,错过欢乐谷,错过红树林,错过看海,错过与最好的两位朋友见面,错过创客的硬件封坛,因有错过,虽有遗憾,也有其得。  1、因为错过飞机,让我...
  • 你是否有这样的经历: 1、有时正做一件事,一瞬间脑子里突然感觉自己曾做这件事,相同的场景与感觉,一切都相同。 2、有时到一个地方,明明第一次去,却感觉非常熟悉,强烈感觉自己曾来这里。 3有时做一个...
  • 2016年总结:教师路的开启,爱情味的初尝 (上)

    万次阅读 多人点赞 2017-01-13 15:13:34
    哎!2016年终于结束了,感觉这是自己二十五年生命中最漫长的一年,发生的事情真的太多太多。有毕业母校、同学、老师和...有为了自己从小的教师梦,来回奔波京黔,最终放弃互联网、离开北京,虽然遗憾,但从未后悔...
  • 很难想象哪个学习计算机技术的人是没看这方面书籍的,如果只是网上看看技术贴,那样得来的知识绝对是离散的,不系统的。而要真正学好一门学问(比如一门计算机语言或者一门技术),一本好书的作用是不言而喻的。...
  • 东京爱情故事

    2018-02-09 18:20:53
    (1)人生只若初见有个22岁的男孩,他来自一个不知名的小地方:爱媛县,他从出生到高中毕业,他从未离开那里,也从未学,镇上所有的小孩都互相认识都是好朋友,里美就是他从...
  • 人的一生中只有七次机会,平均每七年拥有一次,大概25岁到75岁,第一次通常抓不到,因为太年轻,最后一次也抓不到,因为太老。中途还有2次因为自己错过,所以抓不到。所以对于人来说人真正才会有三次机会,人的...
  • 身体与灵魂,总有一个路上

    千次阅读 2018-03-21 22:00:00
    在我看来,既然是四个人一起来玩,理论上这几天也应该一起,而性格独立的猫同学提出想要单独行动,去她想去的地方转转,另两位平时就常黏在一起,对此倒没什么异议。那么,如果大家都单独行动的话,没错,我就会成为...
  • 牵手一起慢慢变老

    2014-07-25 18:35:24
    牵手一起慢慢变老     惘然之中,邂逅了你,从此便孤立了自身,为你守侯。漭漭撞撞,磕磕碰碰,小心翼翼地留了你的身旁。默默之中,你的容颜欢笑,你的心伤疼痛处处牵制着我的心情。从你的不屑一顾,旁若无心到...
  • EVER17剧情简介,之前玩,回忆下

    千次阅读 2013-02-27 23:58:46
    但是集中数天时间玩了《EVER17》(简体中文版又名《时空轮回》,繁体中文版又名《时光的羁绊》)后,连续几天之内,有多游戏的场景、对白始终脑中挥之不去,这种感觉我玩游戏的几年来还从未。所以我觉得有...
  • 这使得我变成了校园里那些不安分学生的头头,我 们互相粘在一起,做出一种拒绝所有正常学生的姿态。  Radcliffe was a great place to live. There were more women up there, and most of the guys were ...
  • 首先我比较喜欢读书的,有段时间竟然要求自己每周都要读一本书,并且还要求自己加快阅读速度,希望能够阅读多的书。 可突然有天想到一问题,自己读书的方法是不是本末倒置了呢?一直追求读书的数量,从来没有思考...
  • 青春 就此别

    2014-06-03 17:58:00
    此时听着Eason新专辑写下这篇文章,怀着一颗复杂的心情,既有着即将毕业的喜悦,又有着...随着时间慢慢溜走,心智慢慢成熟,再见证没有传说中的报告会和运动会不是学生自愿参加而是被迫出观众,也见证了一个大学...
  • 如今,几乎所有的事情都离不开软件,当你开车时,脚踩上油门,实际上是车载计算机通过力度感应等计算输出功率,最终来控制油门,你从未这会是某个工程师的代码。...
  • 谷歌 机器学习速成课程

    千次阅读 2018-07-18 22:42:04
    监督式学习,通过学习如何组合输入信息来对从未的数据进行分类。   机器学习术语: 标签 特征:输入变量 样本:数据的特定实例  有标签样本:labeled examples: {features, label}: ...
  • 蓝桥杯的题就更新到这里了,对于一个参加javac组的比赛者来说,只要把这些都做懂了,拿个省赛...作为一个成绩平平的专科生,也没有什么很大的理想,但是参加此次比赛却让我感觉到了一种从未感受的感觉,也许是努力

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,495
精华内容 2,198
关键字:

从未在一起过更遗憾