精华内容
下载资源
问答
  • 对工作的回顾和评价
    千次阅读
    2017-08-16 14:42:23

    回顾和总结的重要性

    一段时间的紧张开发结束了,作为一个技术开发者,不知道大家是不是和我一样,在每次开发新项目的时候都会用到一些新的技术,新的知识点,遇到一些技术难点,一些很奇怪的bug。或许你在当时解决了,但是几个月之后你只记得你用过某个技术或者遇到错某个错误,但是已经想不起当时是怎么解决的了。因为我们每天都要接触很多很琐碎的东西,除了工作你还有生活。所以总结的作用就变得非常重要了。

    该记录一些什么?
    - 新技术的使用,常见的坑
    - 遇到的问题以及解决方案
    - 对技术的感悟和总结
    - app性能优化的过程
    - 一个项目开发完后自己的得失

    现在走很多的弯路,以后就少走弯路。总结也是一个回顾的过程,将加深你的影响。经常总结也有助于我们自身的提高。

    更多相关内容
  • 教育者残疾儿童态度的回顾和将 390 心理学纳入学校主流的概念,1978 年 7 月,卷。 16, No. 3. 塑造自我接纳也有助于增加积极的自尊。 更有条理的情感技巧也被用来帮助孩子们接受“他们所处的位置”,并他们的...
  • 报告系统评价指南的首选报告项目用于搜索,选择评估46篇已发表的作品。 明确了组织弹性弹性工程这两个术语,并使用功能主义解释性研究框架来分析文章。 这项审查表明,没有关于弹性工程的普遍认可的定义。 ...
  • 学习永无止境 学习永无止境 专业的学习 专业的学习 学习永无止境 专业的学习 XX年网络安全宣传周网络安全信息化工作总结 ...总结一年来的网络安全信息化工作主要抓了以下几方面工作 一XX年工作回顾 一信息化推进方
  • 工作环境在全球任何组织的员工绩效中都扮演着至关... 因此,本文根据影响阿联酋政府实体工作环境幸福感的因素回顾相关文献。 这篇评论指出了这些因素,并详细解释了它们如何影响阿联酋政府实体在工作环境中的幸福感。
  • 感恩与你同行 回顾我们这一年——个人年终总结汇报ppt模板,本模板共13P,目录:工作总结、存在问题、改正措施、自我评价、未来展望、感恩致谢,红色暗格子背景,渐变圆线条几何风简约封面、过渡页,简约大气版式,...
  • 知识点讲解修改评价中差评会跨境电子商务卖家店铺的声誉及刊登商品的销售带来不良影响。有些跨境电子商务平台是支持卖家客户协调一致后,进行中差评修改的。知识点讲解售后客户服务中差评工作处理流程:收到中...
  • 正常课堂中青少年 A 型行为模式的自我评价与教师评价 ...项研究,这些研究报告了父母、教师、观察员心理健康工作儿童/青少年行为的评分与儿童/青少年行为评分之间的相关系数。儿童/青少年自己给
  • 这项工作对“自我调节策略清单-自我报告(SRSI-SR)”进行了系统的回顾。 SRSI-SR理论上基于Zimmerman的自我调节学习(SRL)的三相模型,可提供有关学习者使用三种广泛的自我调节策略的信息。 搜索Google Scholar,...
  • 审查了约28个数据源,占78.5%,这表明增加宫颈癌的认识认识将大大提高筛查服务的利用率。 在肯尼亚已发表的工作中,收集到的信息中有87%以上表明对子宫颈癌筛查的重要性知识不足。 这项研究的主要结果表明,...
  • ui设计师的自我评价 从事一份新的工作就有新的挑战新的历练在工作 上也让我了解到以前不同的思维设计交互方式的差异 更加完善了我 ui设计的理解以下是小编为大家整理的 范文欢迎阅读参考希望您有所帮助 ui设计师...
  • 用于该评价的数据库包括护理相关健康文献的累积指数(CINAHL:registered:),Ovid MEDLINE,PuMed,Ovid OLDMEDLINE,Embase Classic + EMBASE(Ovid),科学网络(Thomson Reuters)。 结论:多项研究表明,与...
  • 2018年回顾和收获

    千次阅读 2019-01-01 08:20:16
    回顾过去的一年时间,工作到年尾不是那么顺利。在大环境的寒冬来到,互联网行业没有以前那么好了,每天都看到大厂裁员,小的公司倒闭。 在工作的技能方便,没有学到什么新的技能,还是靠以前的技术解决工作中的问题...

    现在时刻已经是2019年开始了1个半小时,才打开电脑写一篇流水账。想了几天都不知道写点什么记录,但是在2019年的到来凌晨回来的路上思绪万千,还是决定记录一下吧。

    2018年回顾:

    回顾过去的一年时间,工作到年尾不是那么顺利。在大环境的寒冬来到,互联网行业没有以前那么好了,每天都看到大厂裁员,小的公司倒闭。

    在工作的技能方便,没有学到什么新的技能,还是靠以前的技术解决工作中的问题。买了几本书,也是草草了事的翻阅了一下,不过也学到了他们的设计模式和软件框架的合理设计。没有完成给自己的学习计划,现在出去找工作就遇到问题,要综合性人才(这只是小公司,要什么都会),但是大公司是要专一(在某一技术领域精通)的员工。这反正是多学点东西没有坏处,技不压身哦。

    生活方面没有什么要回顾的,就是打工单身一个人,吃不完的快餐和猪脚饭,喝不完的大瓶矿泉水。(为什么每年 每天都是重复这样的方式呢,也是想了很多年,每个人都基本情况一样,心态好一点多看几本成功学,洗脑的书籍其实也没什么)只要身体健康,那就是万事大吉,什么都会有的。

    再就是国庆节去了父母那边(那是偏远的村庄,引用某人说的话“那是18线城市的级别”,我个人觉得还是可以的,毕竟是开发区和平原(因为我是山沟沟))。去了那边亲人就比较多,反正加起来差不多20个左右哦 。那几天时间也是过的很快的,也有烦恼在耳边,那就是个人问题,看着二叔他们一家人都在一起,也是生活的一种乐趣,小孩多 ,事情也多。每天都忙碌着 ,心里是开心的。所以又想到自己,感慨万千,总的来说是失败的(30岁而立),没有事业和自己的家庭。突然想起了老罗的一句话“人应该是在不同年龄端就要做相应的事”。已经落后别人一截了,好的心态,去面对一切。

    2018年收获:

    年龄又大了一岁晒,2019年就是31岁,只能感叹时间之快。就是身体健康,这收获不小哦。

    再就是遇到人生中自己觉得喜欢的女孩子(适合结婚的对象),认识的时间不长 2个多月,总的来说是和平相处,就是吃饭的时间聊一下,其他也基本没时间再一起,也是晚上聊一下(我是脸皮厚),也就逛了一次公园,去了几次图书馆,看了几次电影。还有好多次都是她付钱搞的我都不好意思。10月24 我过生日,也是去吃的比较简单(潮汕砂锅粥),那是我不懂,心比较大,没有注意观察(本来就感冒,不能说出话来,全程没说10句以上)没有考虑那么多(点了3个冷菜),有时想起都感觉自己(不知到用什么言语形容好)。反正事情过去了哦,她是说不在乎(当时挺感动,肚里能开航母)。大概过了一个星期左右,给我送的生日礼物(这是我31年收到的第一个礼物(我们那边都不过生日,也没什么礼物的)),但是还是开心的。

    在一起也谈论过现在,以后的发展方向和职业规划,人生规划。她比较上进,这是值得我学习的地方。也有很多时候比较尴尬,说话不知道说什么好(可能对方在思考自己的问题和事) ,自我感觉三观(人生观,价值观,家庭观)还是一样的(这就不知道她怎么想)。每个人的想法都不一样(见解也不一样)。由于我还年轻(资历和阅历)不能去评价一个人。

    和她一起走路,还是逛啊,看到一对对的都是拉着手,其实我也是想拉她手一起走(时机不成熟,还没有确定关系,搞的大家都尴尬不好意思)。时间还很长,我们还有活很久。保持好的心态对待事和人。

    2019年就是实现2018年没有实现的计划哦,关心和爱护自己爱的人,不管事态怎么变化,保持好的心态和脚步。

     

    展开全文
  • 一、工作回顾(近年来工作情况) 二、自我评价自己的看法) 三、工作体会(工作的感悟) 四、目标展望(未来的规划) ... ... ... 本模板设计精致实用,适合用于制作各类通用工作汇报PPT、年度工作总结PPT等...
  • 这是一款中国风剪纸狗年吉祥大吉大利个人工作总结PPT模板,适用于年终工作回顾、自我评价、工作经验分享、明年工作规划等相关工作总结汇报PPT制作,欢迎大家下载参考!该文档为中国风剪纸狗年吉祥大吉大利个人工作...
  • A:准备环节: 团队在回顾会前一天的站会上选出1名回顾...无论我们发现了什么,考虑到当时的已知情况、个人的技术水平能力、可用的资源,以及手上的状况,我们理解并坚信:每个人自己的工作都已全力以赴。 ...

    https://mp.weixin.qq.com/s/WNK6oKKdvo8a0pmjPlskxA

    A:准备环节:

     

    团队在回顾会前一天的站会上选出1名回顾会引导人,通常是轮流,团队初期由教练来进行引导。

     

    引导者准备道具和数据资料。

     

    B:开始

     

    一:宣读宗旨

     

    引导者宣读敏捷回顾会最高宗旨,团队自由选择跟读。

     

    如下:

    无论我们发现了什么,考虑到当时的已知情况、个人的技术水平和能力、可用的资源,以及手上的状况,我们理解并坚信:每个人对自己的工作都已全力以赴。

     

    我的观点:

    非常有必要且充满能量的一个环节,注意用标准的普通话,饱含坚定的意志去宣读这句话。可怕的是,这种能量可以传染,快速的复制到每个人的身上,这种仪式感可以让大家迅速进入状态。

     

    二:改进成果回顾

     

    对上个迭代制定的改进措施执行情况及取得的成果进行评价(匿名1-5分)

    引导者:“请大家对上一个迭代的回顾会所制定改进措施的执行情况进行评价,这是问卷网匿名评价,请大家扫码提交评价。”出示二维码。

     

    打分选项如下:

        1:好像没做什么改进

        2:有改进,但有较多不足

        3:改进措施对我的工作有帮助

        4:我在改进中受益,我认为改进有效

        5:我们明显受益,我会持续守护我们的改进成果

     

    展示评价结果平均分。并邀请大家进行1分钟发言,阐述自己的看法。

     

    我的观点:

    让大家对于上次迭代的改进情况进行一次主观的评价,检视一下上次的改进成果是否深入人心,承前启后。

     

    这个检视有两层含义:

     

    1:回忆一下我们都改进了些什么,大家看下我们都是怎么看待上次的改进,大家一起照照镜子,这次我们要如何做的更好?

    2:每个人的角度不同,也许自己从改进中受益,但却伤害了他人,集体的视角往往更加全面

     

    三:看图说话

     

    引导者同屏展示如下几个图,或者发到群里,团队自己看。

     

        1:燃尽图

     

     

     

     

        作为一个懒人,我就不解释什么是“燃尽图”了,不明白的小伙伴可以自行百度,GOOGLE,BING。我们有2个燃尽指标,1个是PBI,达到DOD。1个是SBI,达到DOD。但凡达到DOD大家就可以在看板上移动它。

     

     

        2:情绪彩虹

     

     

      “情绪彩虹”这个名字是我起的,源自于“情绪曲线”,“情绪测震仪”。玩法有点有区别。我来跟大家说道说道。

     

    首先,团队的每个人都会领取一只颜色别致彰显自己个性的白板笔,颜色自选,先来后到。

     

    然后,看板上找一块区域,纵轴标记出笑脸,一般,生气,3个表情,横轴标记迭代的天数。每天站会结束时,大家用自己的水笔,在看板上画出能体现出你此刻感觉的图形或者打点,此时不连线。

     

    如果遇到有事件影响了你,绿色代表技术类事件,黄色代表组织类事件,红色代表个人事件,撕下小报事贴,写上并贴在当天情绪点的最上方区域。变化并不可怕,可怕的是无视这些变化,把所有团队认为有影响的事情记录下来,会发现很多惊喜以及被忽略的一些重要事物之间的联系。

     

    最后,回顾会前,大家清理看板的时候,用标志自己颜色的水笔将自己画的图案连成一条线。

     

    团队连完线,远远看去,是不是感觉像大家一起画出一道属于团队的靓丽彩虹呢?

     

     

        3:团队时间表

     

     

    团队时间表,用来分析大家时间都花去了哪里,哪些地方坑,哪些地方比预想的情况要好,在回顾会之前,引导者会组织大家花几分钟时间清理看板,将看板上的报事贴撕下来进行整理,并形成这种可视数据,这样做可以尽可能的客观的了解每天时间的使用情况。

     

    这种时间数据建议按照事项或者工作项来统计,如果团队自组织不是很完善,千万不要统计到个人头上,避免内耗,大家需要时刻意识到我们是一个整体。

     

        4:缺陷趋势+看板自留地

     

     

    缺陷趋势用来警示团队,质量是我们的生命线。

     

    自留地可以有任何团队想要表达的内容,包括遗留问题等。

     

    上面左图所示是尚未上线前的某段时间缺陷的情况,统计的是导致集成构建失败以及自动化测试完成,进入手工测试阶段以后所发现的缺陷。右图是上线后近期一次回顾会展示的自留地。大家把生产问题支持所花费的时间,修改BUG,新增商户等需要消耗团队资源支撑的事情也做了记录。

     

    我告诉大家,这些时间趋势如果每个迭代在逐步变少,那么我们的债务就越少。如果在变大,那么我们的债务和利息就越多,大家自己看着办。

     

    5:用户评审感受

     

     

    用户评审感受纵轴是打分标准,横轴是迭代次数。

     

    在评审会的时候,用户给本次迭代评审展示的成果进行打分。迭代计划会的时候,我们会和最终用户爸爸/PO一起确认迭代计划。迭代结束时,团队会给用户爸爸展示我们迭代的成果,有时候是开发人员演示,有时候是测试人员演示,用户爸爸如果在现场,我们还会邀请用户爸爸现场体验新功能,演示结束之后,我们邀请用户爸爸给我们匿名(用户爸爸有可能是多人)打分。

     

    以下是评分标准

    1:真烂

    2:无言以对

    3:凑合

    4:满意

    5:特别棒

     

    (小贴士:正式功能上线之后,也可以参考此方法让用户对正式功能进行打分,我们现在有在做这样的实践,发现效果不错,用户的反馈持续变好,团队更加有信心)

     

    引导者将以上几个图展示完之后,会让团队团队,思考5分钟,并把自己的看法记在纸上,如果是新增加的图或者第一次看图,引导者会讲这个图怎么看,但是不评论图上的数据。

     

    然后我们进行轮流发言,每个人1分钟,讲自己的观点。“我的观点是,……完毕,下一个XXX”

     

    发言结束之后进入下一个环节

     

    我的观点:

    1:数据驱动和持续改进是一对好基友,但是切莫因为数据搜集,建模困难而不去做,刚开始尝试难免会有数据不准确,维度不丰富,反馈不客观等等的情况,只要继续尝试下去,逐渐丰富起来,相信大家一定会找到适合自己团队的数据。

     

    2:在这个环节,有个点比较让人容易忽视,就是团队的主观感受。

     

    绩效=能力*意愿。在这个环节,除了让大家从不同角度观察客观的业绩数据(跟能力相关)之外,还需要观察主观的情绪数据(跟意愿相关),对情绪变化明显的同学表示关心和好奇。很多团队在做数据驱动的时候,过于强调结果和客观的业绩数据,导致忽视了个人情绪和意愿反而会让组织变得僵化。

     

    四:聚焦问题

     

    这个环节我们主要通过共创的方式让大家结合之前对迭代看法的上下文,背对背思考之后提出需要聚焦问题。

     

    引导者:“通过刚才的发言,大家刚才分别阐述了对本次迭代的一些看法,我们都知道,回顾是为了聚焦问题,提出改进,下面让我们进行提问,格式是“如何……?”例如“如何提高自动化测试的覆盖率?”,围绕如何改进,大家每个人最多能提3个问题,请将问题写在报事贴上,1张报事贴,写1个问题,2分钟。”

     

    引导者也参与写,写完之后,大家进行交流讨论10分钟,重要的是,每个人提出的问题能让其他人听到,并且知道你为什么认为这个问题如此重要。

     

    我们的做法通常是3人一组,交流一轮,然后每组选择1个人留在那组,其他人换组再交流一轮。大家充分碰撞思路。

     

    思路碰撞完之后,给大家1分钟,做问题调整,再次列出你认为最重要的3个问题,如果依然跟之前写出的没有差异,那么可以不用做调整。

     

     

     

    最后大家一起把问题合并同类项。针对有争议的可以放在一边,一般来说大家的问题相似度会比较高。下图是我们有一次在星巴克做回顾贴出的问题。选择出最长的那一列,就是大家最关注的问题了。如果有2列都一样,那么则进行投票,每人1票,投票结果相同进行一轮交流,之后再投票。找出这个最关注的问题之后,就要进入下一个环节,改进措施。

     

    我的观点:

    团队共同认为什么问题是最重要的,就解决什么问题。每个迭代只聚焦1个问题,最重要的问题解决了,其他的问题可能会随之发生变化,也许就变得不再重要了。团队应该把当前的精力集中在解决大家共同认为的最重要的问题上。

     

    五:改进措施

     

    改进措施的形成原则,遵守“奥卡姆剃刀”,少即是多。所以我们团队约定,我们只针对最重要的问题,制定一条大家都认可的改进措施,所有人对这条改进措施负责。其余的好的改进措施和想法,也都列示出来,有想帮助大家做的更好的同学可以积极的践行。

     

    引导者:“既然我们大家共同找到了那个最重要的问题,接下来,大家一起来思考,我们如何能够有效解决这个问题。”

     

    具体行程改进项的方式和上一环节“聚焦问题”是一样的,找到聚焦的问题之后,大家集中精力,思考5-10分钟。列出1-3条改进的措施,要求简单有效即可。

     

    例如曾经有一次关于“如何提高工作计划的合理性”这个问题,团队有提出两种思路:

     

    一种是通过JIRA,建立一些数据模型,录入数据分析,生成报表,balabala。。。

     

    另外一种是直接采用SBI报事贴,直接把报事贴上的时间统计下来展示给大家,大家再来探寻。

     

    这样的情况下,我们通常会直接采用第二种方式,尽可能简单并且能产生效果的方式。

     

    我的观点:

    1:为了避免受害者情绪,只有大家自己认可的东西,大家内心才会接受,改进措施制定的前提条件是尊重团队的选择,如果大家都选择了复杂的,那么就用复杂的,下个迭代我们再来看这个改进的有效性如何。复杂的改进也未必不好,只要有效,并且大家认可就好。

     

    2:那么什么是有效呢?有效的改进是指客观上有衡量的标准,主观上感受也有改善,如果只是要求客观上的数据指标达到要求,主观上的感觉很糟糕,我们也不认为这个改进有效。

     

    六:我要点赞

     

    完成了行动项的输出,我们通常需要一些激励,以便面对接下来的困难。彼此感谢,彼此欣赏最为重要。

     

    点赞的规则是每个人只有一次机会点赞,必须说出为什么感谢那个人,点赞不能给自己,可以给团队任何人。然后记录这次迭代回顾点赞的数据,每个月团队内公布一次获赞的榜单。

     

    我的观点:

    点赞是给非常有必要的环节,可以提振团队士气,但是要注意,团队的安全感足够高的情况下,我建议跟我们一样,采用当场实名,“说出来”的方式点赞,这种“说出来”的方式不仅是对被赞赏人的肯定,更是自我的一种积极表达。

     

    我们希望在职场中要不吝赞美,好的情绪和能量可以扩大。

     

    反之,如果安全感不够,或者极度缺乏安全感,可以匿名的方式,例如用匿名投票,匿名卡片等等。

     

    七:回顾评价

     

    最后,引导者宣布回顾会结束,感谢大家参与,并邀请大家评价。

     

    引导者:“感谢大家参加这次回顾会,下面请在赞扬声中用你的反馈来帮助我进行持续改进,以便我以后更好的为大家服务。”出示反馈二维码。

     

    以下是回顾评价打分选项:

    1:并没有什么用

    2:希望有用吧

    3:找到了解决问题的方向

    4:感觉不错

    5:我觉得充满力量

     

    我的观点:

    追求透明,检视,调整是Scrum的核心支柱,可以通过大家的反馈帮助自己迅速提高引导技巧,收获认可,发现不足。团队就是教练的镜子,教练也是团队的镜子,同时教练也可以根据反馈来辅导引导者,共同成长。

     

    以上就是我的回顾会教练经验,另外,友情提示以下2个需要注意的地方。

    1:上述方法较多,不一定适合您现在的团队,如果觉得对您有帮助的话,请考虑酌情导入,我们形成上面的套路也是经过了一段时间的迭代。

    2:注意感受打分的极值(极值就是指打5分或1分的情况出现),虽然是匿名打分,但是极值依然重要,极值的出现可以辅助判断团队在某些方面感受强弱的明显信号。

     

    展开全文
  • 学习器的泛化性能进行评估,不仅仅需要有效可行的实验估计方法,还需要有衡量模型泛华能力的评价标准,这就是性能度量。我们通常会根据不同的业务选出适合的业务指标。 评价指标大概有 1、回归的有:RMSE(平方根...

    对学习器的泛化性能进行评估,不仅仅需要有效可行的实验估计方法,还需要有衡量模型泛华能力的评价标准,这就是性能度量。我们通常会根据不同的业务选出适合的业务指标。

    评价指标大概有

    1、回归的有:RMSE(平方根误差)、MAE(平均绝对误差)、MSE(平均平方误差)、Coefficient of determination (决定系数)。

    2、分类的有:精度、召回率、精确率、F值、ROC-AUC 、混淆矩阵、PRC。

    3、聚类的有:兰德指数、互信息、轮廓系数。

     

    分类

     

    1.精度(Accuracy)

              意义:被正确分类的样本占总样本的比。

                           

             优点:简单

             缺点:精度只是简单地计算出比例,但是没有对不同类别进行区分。因为不同类别错误代价可能不同。例如:判断这个病人是不是病危,如果不是病危错误判断为病危,那只是损失一点医务人员的时间和精力,如果是把病危的人判断为非病危状态,那损失的就是一条人命。他们之间存在重要性差异,这时候就不能用精度。对于样本不均衡的情况,也不是用精度来衡量。例如:有A类1000个,B类5个,如果我把这1005个样本都预测成A类,正确率=1000/1005=99.5%。

     

    2. 混淆矩阵

    混淆矩阵(Confusion Matrix)

     

    预测为正样本

    预测为负样本

    标签为正样本

    TP(True Positive对的正样本)

    FN(false Negative错的负样本)

    标签为负样本

    FP(False Positive错的正样本)

    TN(true Negative 对的负样本)

    (1).True Postitve Rate(真正率):正样本中被预测对比例。

    (2).False Negative Rate(假负率):正样本被预测错的比例。

    (3).False Positive Rate(假正率):负样本被预测错的比例。

     

    (4).True Negative Rate(真负率):负样本被预测对的比例。

    (5).Accuracy(准确率):就是精度。

    (6).Average per-class accuracy(平均准确率):每个类别下的准确率的算术平均。

     

    3.精确率(Precision)

    意义:查准。就是预测出来为正样本的结果中,有多少是正确分类。

    通俗理解:做个谨慎认真的人,分类阈值较高

     

    4.召回率(recall)

    意义:真实为正样本的结果中,有多少是正确分类。

    通俗理解:宁杀错不放过,分类阈值较低

    但是,两者有时候就比较难去平衡到。

    怎么说?

    比如说,10个好苹果,10个坏苹果。

     

    预测为好苹果

    预测为坏苹果

    标签为好苹果

    2

    8

    标签为坏苹果

    0

    10

    准确率为(2+10)/20=0.6;

    精确率为(2)/2=1

    召回率为(2)/10=0.2

    虽然 精确率很高,但是不能说明这个模型很好。

     

    再举个栗子。

    10个好苹果,10个坏苹果。

     

    预测为好苹果

    预测为坏苹果

    标签为好苹果

    10

    0

    标签为坏苹果

    10

    0

     

    准确率为(10)/20=0.5;

    精确率为(10)/20=0.5

    召回率为(10)/10=1

    虽然召回率很高,但是不能说明这个模型很好。

    所谓鱼与熊掌不兼得。(虽然这两个栗子都有点极端)。但是如果你想检测更多准确地正样本出来,出错是必不可少的。

    这时候下面几个指标就出来了~~~

     

     

    5.F值(F1-score)

    通俗的语言就是:β 越大,Recall的权重越大, 越小,Precision的权重越大。

    由于Fβ Score 无法直观反映数据的情况,同时业务含义相对较弱,实际工作用到的不多。

    意义:精确率与召回率的调和平均值,它的值更接近于Precision与Recall中较小的值

    (β=1)

    补充:调和平均数是各变量值倒数的算术平均数的倒数,因而也称为倒数平均数。其计算形式也有简单调和平均数和加权调和平均数两种。加权调和平均数按照调和平均数的定义,是各变量值倒数的加权算术平均数的倒数。

     

     

     

     

     

     

    6.ROC

    ROC叫作受试者工作特性曲线,反应敏感度和特异度连续变量的综合指标。纵坐标为敏感度,横坐标是特异度。

    ROC是一个以TPR为纵坐标,FPR为横坐标构造出来的一幅图。

    我们当然希望TPR越高越好,因为证明覆盖率高;我们也希望FPR越低越好,这证明精确率高。

    在鱼与熊掌不能兼得的时候,我们找一个界值,这个值越靠近左上角越好。

    简单,直观,可以通过图直接判断。而且把灵敏度和特异性结合,可以同时衡量两者关系。一般来说,如果ROC是光滑的,那么基本可以判断没有太大的overfitting。

    ROC曲线和它相关的比率

    (a)理想情况下,TPR应该接近1,FPR应该接近0。

    ROC曲线上的每一个点对应于一个threshold,对于一个分类器,每个threshold下会有一个TPR和FPR。

    比如Threshold最大时,TP=FP=0,对应于原点;Threshold最小时,TN=FN=0,对应于右上角的点(1,1)

    (b)随着阈值theta增加,TP和FP都减小,TPR和FPR也减小,ROC点向左下移动;

     

    注:ROC可以在正负样本非均衡中使用原因是:纵坐标TPR只是正样本的正确预测概率,而FPR只是负样本中预测错误的概率,和比例没有关系。

     

    7.AUC

    AUC(Area under Curve):Roc曲线下的面积,介于0.1和1之间。Auc作为数值可以直观的评价分类器的好坏,值越大越好。

    Auc = 1 ,完美分类,对应于roc可以完全做到(1,1)的点。

    0.5<Auc<1,优于随机猜测。

     

    AUC的物理意义是任取一个正例和任取一个负例,正例排序在负例之前的概率。AUC反应的是分类器对样本的排序能力。另外值得注意的是,AUC对样本类别是否均衡并不敏感,这也是不均衡样本通常用AUC评价分类器性能的一个原因。

     

     

    8.比较PR曲线,F1值,ROC曲线,AUC值

    PR线是以Precision为纵坐标、Recall为横坐标。ROC是以为TPR为纵坐标、FPR为横坐标。在ROC空间,ROC曲线越凸向左上方向效果越好,因为这说明精确率高且覆盖率大。与ROC曲线左上凸不同的是,PR曲线是右上凸效果越好。

     

    ROC和PR曲线都被用于评估机器学习算法对一个给定数据集的分类性能,每个数据集都包含固定数目的正样本和负样本。而ROC曲线和PR曲线之间有着很深的关系。

     

      定理1:对于一个给定的包含正负样本的数据集,ROC空间和PR空间存在一一对应的关系,也就是说,如果recall不等于0,二者包含完全一致的混淆矩阵。我们可以将ROC曲线转化为PR曲线,反之亦然。

     

    定理2:对于一个给定数目的正负样本数据集,一条曲线在ROC空间中比另一条曲线有优势,当且仅当第一条曲线在PR空间中也比第二条曲线有优势。(这里的“一条曲线比其他曲线有优势”是指其他曲线的所有部分与这条曲线重合或在这条曲线之下。)

     

    当正负样本差距不大的情况下,ROC和PR的趋势是差不多的,但是当负样本很多的时候,两者就截然不同了,ROC效果依然看似很好,但是PR上反映效果一般。解释起来也简单,假设就1个正例,100个负例,那么基本上TPR可能一直维持在100左右,然后突然降到0.如图,(a)(b)分别为正负样本1:1时的ROC曲线和PR曲线,二者比较接近。而(c)(d)的正负样本比例不为为1:1,这时ROC曲线效果依然很好,但是PR曲线则表现的比较差。这就说明PR曲线在正负样本比例悬殊较大时更能反映分类的性能。

    两者都要看光不光滑,如果不光滑说明有很大问题是过拟合。

    AUC(Area Under Curve)即指曲线下面积占总方格的比例。有时不同分类算法的ROC曲线存在交叉,因此很多时候用AUC值作为算法好坏的评判标准。面积越大,表示分类性能越好。

    F1兼顾了分类模型的准确率和召回率,可以看作是模型准确率和召回率的调和平均数,最大值是1,最小值是0。

    --摘自

    http://www.fullstackdevel.com/computer-tec/data-mining-machine-learning/501.html

    参考:

    https://blog.csdn.net/heyongluoyao8/article/details/49408319

    https://blog.csdn.net/a819825294/article/details/51699211

    https://www.zhihu.com/search?type=content&q=RMSE%20MAE%20MSE

    https://zhuanlan.zhihu.com/p/36305931

     

    展开全文
  • 网页设计专业学生的自我评价 珍贵的大学生活已接近尾声感觉非常有必要总结一下得失从中继承做得好的方面改进不足的地方使自己回顾走过的路也更是为了看清将来要走的路 性格开朗大方做事认真负责能吃苦耐劳勤奋刻苦...
  • 本文开展企业安全性评价的原则及重要意义进行了论述,并应用实例西南兵工企业开展安全性评价工作做了回顾和总结,可供从事生产安全管理工作的人员参考。
  • 这是一套红色微立体个人工作述职报告PPT模板,共26页; PPT模板封面使用了低...一、工作回顾 二、自我评价 三、工作体会 四、工作规划 ... 关键词:红色微立体PPT模板,个人工作述职报告PPT模板免费下载,.PPTX格式;
  • 个人总结ppt模板,目录:工作回顾,自我评价,工作体会,目标展望,淡雅灰背景,齿轮创意灯泡连接鼠标封面,简约扁平化小清新设计,灯泡创意扁平化小清新个人工作总结ppt模板。
  • 21年6月阿里巴巴Java暑期实习面经回顾(已上岸)

    万次阅读 多人点赞 2021-11-21 14:01:15
    不要管别人怎么评价,自己坚持去积累下去,不光可以增加自己某些知识的进一步理解,而且随着粉丝量的增多,写博客给我们带来了一些额外的收益,以及一些人脉,在CSDN上结识了很多同届大三拿到BAT Offer的牛鬼蛇神...
  • 个人总结ppt模板,目录:工作回顾、自我评价、工作体会、目标展望,45度角旋转矩形与圆点创意封面,蓝绿小清新配色,简约大气微立体设计,适合个人总结报告的ppt模板。
  • 「实在智能」简介 「实在智能」(杭州实在智能科技有限...2018 年,来自纽约大学、华盛顿大学、DeepMind 等机构的研究者创建了一个多任务自然语言理解基准分析平台——GLUE(General Language Understanding Evalua.
  • 考虑到所有可能影响煤层气项目发展的因素,已经进行了理论回顾和最新描述。 此后,技术可行性已用于评估可回收气体的总量。 最后一步是评估经济可行性,以了解有多少天然气可以在经济上获利。 结论已被用来开发一种...
  • 相比传统的软件测试,敏捷测试更强调持续改进,根据上下文不断调整测试计划设计,因此更需要在测试过程中测试质量提供持续反馈。这一讲就来介绍如何敏捷测试过程进行评估,如何实现量化管理,以及如何分析测试...
  • 述职报告ppt模板,个人工作回顾,工作自我评价,岗位竞争优势,未来工作规划,仰视视觉商务大楼特写封面背景,几何图形线条创意封面,简约扁平化设计,几何图形线条扁平风述职报告工作汇报ppt模板。
  • 个人工作总结报告ppt模板,目录:工作回顾总结,自我鉴定评价,经验反思总结,改进实施措施,粉色的小花儿、花朵、花瓣、木纹背景,文艺范小清新风格设计,适合个人工作总结报告的通用ppt模板。
  • 项目回顾案例

    千次阅读 2015-09-09 11:10:07
    截止到8月中旬结束,投入的开发人员、测试人员、管理人员达到60多人,2015年8月31日,由咨询顾问作为主持人带领该团队的10多名核心人员,整个项目进行了系统回顾总结,整个回顾总结的过程如下: 1 咨询顾问花了1...
  • 近日,思码逸企业版 3.0 正式发布,从新场景、新数据、新架构等三方面产品进行了升级。 新场景:思码逸从高管、技术负责人、项目经历、开发者角色需求出发,丰富并梳理了用户的角色功能使用场景,根据不同研发...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 21,467
精华内容 8,586
热门标签
关键字:

对工作的回顾和评价