精华内容
下载资源
问答
  • 作品中人物的特点包括外在和内在两方面。外在指人物的外貌、职业、生活习惯等,内在指性格特点、精神品质、典型意义。内在的特点不是简单直白的显露,而是通过刻画人物的艺术技巧来表现的,赏析人物形象,就是要抓住...
    ee9371c849d90d1c986bcda81ec1cd93.png

    [知识清单]

    小说创作的核心就是塑造典型人物,通过对典型人物的刻画,来表现主题,揭示生活的某些本质。作品中人物的特点包括外在和内在两方面。外在指人物的外貌、职业、生活习惯等,内在指性格特点、精神品质、典型意义。内在的特点不是简单直白的显露,而是通过刻画人物的艺术技巧来表现的,赏析人物形象,就是要抓住这些艺术技巧,由表及里地把握人物特点。

    赏析人物形象可从以下方面入手:

    1.从小说情节发展中总体把握小说人物形象特点

    情节一般是通过描写人物思想性格和情感欲望的冲突以及由此引起的人物关系、人物命运的变化来展开的。在情节的展开中,通过人物的外貌、行为和心理状态,再现活生生的鲜明个性。因此,欣赏人物形象,应从情节入手,据情论人。

    2.从人物间的关系和矛盾冲突中把握人物性格

    在激烈的矛盾冲突中,人物的思想性格往往反映得最充分、最深刻。

    3.通过分析具体的描写理解人物

    小说对人物的外貌、语言、动作、心理等的描写,能揭示人物的思想感情和性格特征。除正面的直接的描写外,还可以通过其他人物或景物来侧面描写。应重视小说中人物的身份、地位、经历、教养、气质等,因为它们直接决定着人物的言行,影响着人物的性格。

    4.根据特定的时代环境、活动场景以及景物(包括物象)认识人物

    人物形象的典型意义往往要根据故事发生的历史背景思考,如《祝福》中的社会环境描写即能表现祥林嫂的典型意义。对于小说中时空距离较远的人物,要能把他放在特定的历史、时代、国别、文化等背景下认识,不可以今律古,以中律外。

    5.借助作者的议论或者借作品中其他人物对他的评价的语句来分析人物

    作者对待人物的态度至关重要。这种情感态度和评价有两种方式:对人物的思想倾向与性格特征进行直接评论,或者借作品中某一人物之口说出。因此,把握作者或直接或侧面的介绍与评价(该人物)的言语态度,是鉴赏人物最直接的一个方法。

    [典题导学] __________________ _______________________________________________________________

    题型一 整体分析概括型

    【题型分析】“整体分析概括型”,即从文本和人物的整体上概括分析人物形象,有的只概括不分析,有的先概括再分析。“整体分析概括型”主要有以下考查形式:

    1.×××是一个怎样的人物?

    2.×××有哪些优秀的品质?

    3.文中某人的性格特征怎样,请简要概括。

    4.评价×××这一人物形象。

    例1 [2016·浙江卷]阅读下面的文字,完成11~15题。

    母  亲

    何家槐

    看见一阵人穿得清清楚楚的打她身边走过,母亲亮着眼睛问:

    “你们可是看火车去的?”

    “是的,阿南婶!”

    “我也想去。”

    “要去就去,又没有谁阻止你。”

    可是母亲摇摇头,她不能去,虽则没有谁阻止。她成年忙碌,尤其是在收豆的时候。这几天一放光她就起身,把家事料理妥当以后,她又忙着跑到天井里,扫干净了地,然后取下挂在泥墙上,屋檐下,或者枯树枝中间的豌豆,用一个笨重的木槌打豆。

    这几天天气很好,虽则已是十一月了,却还是暖和和的,象春天。

    母亲只穿着一身单衣,戴一顶凉帽,一天到晚的捶着豌豆,一束又一束的。豆非常干燥,所以打豆一点不费力,有许多直象灯花的爆裂,自然而然的会裂开,象珍珠似的散满一地。可是打完豆以后,她还得理清枯叶泥沙,装进大竹篓,而且亲自上楼去。这些本来需要男子做的事,真苦够她了。

    催,催,催,催;催,催,……

    她一天打豆,很少休息,连头也难得一抬。可是当她听到火车吹响汽笛的时候,她就放下了工作,忘神地抬起头来,倾听,闭着眼思索,有时还自言自语:

    “唉,要是我能看一看火车!”

    车站离我们家里并不很远,火车经过的时候,不但可以听到汽笛的声音,如果站在山坡上,还能够看见打回旋的白烟。因为附近有铁路还是最近的事,所以四方八面赶去看火车的人很多。

    母亲打豆的天井,就在大路旁,村里人都得经过她的身边,如果要去火车站。一有人过去,她总要探问几句,尤其当他们回来的时候:

    “看见了没有?”

    “自然看见了,阿南婶!”

    “象蛇一样的长吗?”

    “有点儿象。”

    “只有一个喷火的龙头,却能带着几十节几百节的车子跑,不很奇怪吗?”

    “真的很奇怪。”

    因为她象小孩子似的,不断地问长问短,有许多人简直让她盘问得不能忍受:

    “我们回答不了许多的,阿南婶,最好你自己去看!”

    “我自己?”

    她仿佛吃了一惊,看火车,在她看来象是永远做不到的事。

    “是的,你要去就去,谁也不会阻止你!”

    可是母亲摇摇头,她不能去,虽则没有谁阻止。她一生很少出门,成年累月的给钉在家里,象钉子一样。

    在这呆滞古板,很少变化的生活中,她对火车发生了很大的兴趣。那悠长的,古怪的汽笛,尤其使她起了辽远的,不可思议的幻想,飘飘然,仿佛她已坐了那蛇一样长的怪物飞往另一世界。不论什么时候一听到那种声音,她就闭上眼睛,似乎她在听着天外传来的呼唤。完全失神一样地,喂猪她会马上放下麦粥桶,洗衣服她会马上放下板刷,在煮饭的时候,她也会立刻抛开火钳,有时忘了添柴,有时却尽管把柴往灶门送,以致不是把饭煮得半生不熟,就是烧焦了半锅。

    “你也是坐着火车回来的吗?”

    她时常问从省城回来的人。

    “是的,阿南婶!”

    “火车跑得很快吗?”

    “一天可以跑一千多里路,我早上还在杭州,现在却在这儿跟你讲话了。”

    “那末比航船还快?”

    “自然自然。”

    “它是怎样跑的呢?”

    “那可说不上来。”

    “哦,真奇怪——”她感叹着说:“一天跑一千多里路,如果用脚走,脚胫也要走断了。这究竟是怎样的东西,跑得这样快,又叫得这样响!”

    “……”

    跟她讲话的人唯恐她噜,急急想走开,可是母亲又拉住问:

    “你想我能坐着火车去拜省城隍吗?”

    “自然可以的,阿南婶,谁也不会阻止你!”

    可是母亲摇摇头,她不能去,虽则没有谁阻止。她举起木槌,紧紧地捏住一束豌豆,很想一槌打下去,可是一转念她却深深地叹息了。

    (原载《文学》一九三四年一月一日第二卷第一号)

    15.联系全文,评价母亲这一人物。

    答:_______________________________________

    【示例】 ①母亲是朴实、坚忍、勤勉持家的传统女性;②母亲受到新事物的感召,具有尝试新生活的内在倾向;③母亲受传统和现实的羁绊,缺乏将希望变为行动的自觉和勇气。

    【解析】 从情节和构思的角度看,《母亲》中母亲和行人的对话在文中出现了三次,如此行文不仅有线索的作用,而且能体现母亲复杂的心理。且这种重复,也丰富了母亲的形象。单就情节而言,本文有这样几个回合:开端——问来往的人,说自己想去看火车。发展——农活忙,但还是想看。再发展——问来往的人火车的模样,并想象火车的样子。高潮结局——问省城回来的人,但就是不能去。就人物的外貌、行为和心理状态来分析,文章写了母亲劳作的场景,问来往的人时的神态动作和想象火车幻觉,重在突出母亲想去又不能去的心理。从人物间的关系和矛盾冲突来看,母亲与来来往往的人有对照有冲突,来来往往的人可以去看,母亲也可以去看,来来往往的人都去看了,而母亲却没去。第一次问人的时候,人们回答:“要去就去,又没有谁阻止你。”第二次因为她像小孩子似的,不断地问长问短,有许多人简直让她盘问得不能忍受。第三次,人们急急想走开,并说,阿南婶,谁也不会阻止你。从母亲的角度仔细揣摩这些冲突,我们就知道,母亲很想看火车,但因农活忙,不好走开。由此分析出母亲形象中的另一点:母亲的行动力不够,没有追求新事物的勇气。对人物的评价离不开文本中的时代背景,本文写作时间是1934年1月1日,那时的母亲多半是家庭妇女,大都是勤劳苦做的。

    题型二 局部分析概括型

    【题型分析】 “局部分析概括型”,即分析概括片段文字中人物的性格或心理。主要有以下考查形式:

    1.××××××语句,可以看出人物怎样的心态?

    2.小说人物×××的行为折射出人物怎样的心情?请结合文本分析。

    3.结合画线的文字,分析×××的心理变化过程。

    例2 文本《母亲》见本专题学案3题型一【例1】

    11.根据文中画波浪线的部分,用两个词概括母亲劳作的特点。

    答:_______________________________________

    【示例】 ①忙碌 ②辛苦

    【解析】 本题是通过局部文段的品读,要求考生概括人物的个性特点。

    12.简析“催,催,催,催;催,催,……”对表现人物的作用。

    答:_______________________________________

    【示例】 ①透露了母亲内心的急迫;②表现了母亲劳作的忙碌;③反映了母亲对家庭的责任感。

    【解析】 本题是从重要语句丰富含意的体会的角度命制的,考查考生对人物心理活动和精神品质的把握。

    14.结合上下文,赏析文中画横线部分。

    答:_______________________________________

    【示例】 ①通过比喻、排比,渲染了火车的神奇与母亲对火车的痴迷;②通过神态、动作等细节,细腻描写了母亲好奇、陶醉和渴望的心理;③叙事上有过渡、舒缓节奏等作用。

    【解析】 本题是从赏析文章重要语段的角度命制的,考查考生对人物心理活动和个性特征的把握。当然这类题目考查的角度是综合的,还包括语言表达技巧的赏析。

    例3 [2016·江苏卷]阅读下面的作品,完成第14题。

    会  明

    沈从文

    ①会明是三十三连一个火夫。提起三十三连,很容易使人记起国民军讨袁时在黔湘边界一带的血战。事情已十年了。如今的三十三连,全连中只剩会明一人同一面旗帜十年前参加过革命战争,光荣的三十三连俨然只是为他一人而有了。旗在会明身上谨谨慎慎地缠裹着,他忘不了蔡锷都督说过“把你的军旗插到堡上去”那一句话。

    ②这十年来的纪录是流一些愚人的血升一些聪明人的官。这一次,三十三连被调到黄州前线。会明老早就编好了三双草鞋,绳子、铁饭碗、成束的草烟,都预备得完完全全。他算定热闹快来了。在开向前防的路上,他肩上的重量不下一百二十斤,但是他还唱歌,一歇息,就大喉咙说话。

    ③驻到前线三天,一切却无动静。白天累了,草堆里一倒就睡死,可是忽然在半夜醒来,他就想,或者这时候前哨已有命令到了?或者有夜袭的事发生了?或者有些地方已动了手?他打了一个冷战,爬起身来,悄悄走出去望了一望帐篷外的天气,走近哨兵身边,问:“大爷,怎么样,没有事情么?”“没有。”“我好像听见枪声。”“说鬼话。”他身上也有点发冷,就又钻进帐篷去了。他还记得去年鄂西战役,时间正是六月,人一倒下,气还不断,糜碎处就发了臭,再过一天,全身就有小蛆在爬。为了那太难看、与鼻子太不相宜的六月情形,他愿意动手的命令即刻就下。

    ④然而前线的光景和平了许多。这和平倘若当真成了事实,真是一件使他不大高兴的事情。人人都并不欢喜打仗,但期望从战事中得到一种解决:打赢了,就奏凯;败了,退下。总而言之,一到冲突,真的和平也就很快了。于是,他逢人就问究竟什么时候开火,他那样关心,好像一开火就可以擢升营长。可是这事谁也不清楚,看样子,非要在此过六月不可了。

    ⑤去他们驻防处不远是一个小村落,看看情形不甚紧张,就有些乡下人敢拿鸡蛋之类陈列在荒凉的村前大路旁,同这些军人冒险做生意。会明常常到村子里去,一面是代连上的弟兄买一点东西,一面是找个把乡下上年纪的人谈一谈话。他一到村落里,找到谈话的人,就很风光地说及十年前的故事。有时也不免小小吹了一点无害于事的牛皮,譬如本来只见过蔡锷两次,说顺了口,就说是四五次。他随后把腰间缠的小小三角旗取了下来。“看,这个!”看的人露出吃惊的神气,他得意了。“看,这是他送我们的,他说‘嗨,勇敢点,插到那个地方去!’你明白插到哪个地方去吗?”听的人自然是摇头,他就慢慢地一面含着烟管一面说……

    ⑥因为这慷慨的谈论,他得到一个人赠送的一只母鸡,带回帐篷,用一个无用处的白木子弹箱安置了它。到第二天一早,木箱中多了一个鸡卵,第三天又是一个。他为一种新的兴味所牵引,把战事的一切完全忘却了。他同别人讨论这只鸡时,也像一个母亲与人谈论儿女一样。他夜间做梦,就梦到有二十只小鸡旋绕脚边吱吱地叫。鸡卵到后当真积到了二十枚,就孵小鸡。小鸡从薄薄的蛋壳里出到日光下,一身嫩黄乳白的茸毛,啁啾地叫喊,把会明欢喜到快成疯子。白天有太阳,他就把小鸡雏同母鸡从木箱中倒出来,尽这母子在帐篷附近玩,自己却赤了膊子咬着烟管看鸡玩,或者举起斧头劈柴,把新劈的柴堆成塔形。遇到进村里去,他把这笼鸡也带去,给原来的主人看,像那人是他的亲家。从旧主人口中得到一些动人的称赞后,他就非常荣耀骄傲还极谦虚地说:“这完全是鸡好,它太懂事了,它太乖巧了。”看样子,为了这一群鸡雏发育的方便,会明已渐渐地倾向于“非战主义”了。

    ⑦后来,和议的局势成熟,照例约好各把军队撤退。队伍撤回原防时,会明的财产多了一个木箱,一个鸡的家庭。无仗可打,把旗插到堡子上便一时无从希望。但他喂鸡,很细心地料理它们,他是很幸福的。六月来了,这一连人没有一个腐烂,会明望着这些人微笑时,那微笑的意义,是没有一个人明白的。

    (有删改)

    14.文中两处画线句分别表现了会明什么样的精神状态?请简要分析。

    答:_______________________________________

    【示例】 第一处,向别人吹嘘过去的荣耀,满足虚荣心,体现内心的空虚;第二处,从喂鸡的成就中获得满足,体现内心的充盈。

    【解析】 本题既考查“理解文中重要句子的含意”“赏析作品内涵”的能力,又考查对局部人物精神状态的理解。答题时,要重在从人物语言描写体现人物的性格、心理、品质特点等方面入手。第一处,会明跟别人所谈的是北伐战争期间的事,他对那场战争充满了自豪感,他对把旗帜插到敌人的阵地上同样充满了自豪感,加上三十三连只剩下他这个火夫,他“有时也不免小小吹了一点无害于事的牛皮”,满足自己的虚荣心。第二处,写的是会明对待鸡的态度,一个经历了多次战争生死的人,却对喂鸡充满了兴趣,看到鸡长大而感到骄傲荣耀,这中间饱含了会明对生活的热爱,体现了他内心的充实。

    [解题指津] __________________ _______________________________________________________________

    一、“整体分析概括型”答题方法

    解“整体分析概括型”类的试题应注意:①要求概括人物形象或性格特点,只要分点列出即可,点与点之间不能交叉;②整体分析,要在概括的基础上结合文字分析。

    1.判断小说的主人公

    (1)主人公应贯穿小说情节的始终。主人公出场并与周围的人或事物发生矛盾冲突是小说情节的开端。主人公性格的发展推动小说情节的展开,主人公是小说各种矛盾冲突的中心人物,是小说中主要矛盾的主导方面。有些作品的标题就指明了主人公。

    (2)主人公的表现及其性格决定小说的主题。小说诸多人物中最能表现主题的人物是主人公,作者极力刻画出的栩栩如生的人物是主人公,作者用墨最多的人物往往是主人公。其他人物则起陪衬、烘托、补充的作用。

    2.弄清人物形象在文中的作用

    (1)主要人物的作用。即赏析人物形象的社会意义。首先要结合情节分析人物形象的典型性,然后结合社会现实分析人物形象折射的社会现象及给人带来的启示,也就是要从作者塑造主要人物所反映的主题和意图考虑。

    (2)次要人物的作用。次要人物即陪衬人物或线索人物,其作用一般有:①对主要人物起陪衬作用;②贯穿全文的线索,特别是以第一人称叙述的“我”,多起到叙述者和见证人的作用,增加小说的真实性;③同主要人物一同揭示或凸显主旨;④推动情节发展。

    (3)物象的作用。小说引入特别重要的物象,基本作用有:①突出人物性格,深化小说主题;②反复出现、串起相关情节,从而成为全文的线索,兼有使结构更加严谨的作用;③衬托环境,或者具有象征意义;④丰富小说内容。

    3.准确地概括人物形象

    (1)读懂故事情节,了解作者对小说中的人物是赞扬还是批判,是肯定还是否定。

    (2)抓住文中某处具体的人物言行、细节进行分析。分析时,应着眼全篇、前后观照,要结合作品的大背景和具体的情境来分析。

    (3)分析时要参考人物的身份、地位及所处的环境,防止任意拔高或贬损。

    (4)概括形象特点的词语要字斟句酌,认真推敲,最好能借用原文中的词语。

    (5)注意题干要求,如要区别“性格特点”与“形象特点”的不同。“性格特点”包括人的心理情感、待人接物、品行操守、生活态度和价值观等较宽泛的内容。而“形象特点”主要以“性格特点”为中心,可以把人的外在形象(肖像)、身份、地位、职业等考虑进去。

    (6)筛选好有关人物的正面与侧面信息。人物形象特点主要通过人物自身的言行举止、所思所想表现出来。首先把这方面内容一点不漏地筛选出来加以分析评判。再者,注意将有关人物的侧面信息结合起来考虑,如次要人物的言行神态、环境特点等。

    (7)注意在情节中把握人物。大多数考生只注意与人物言行举止有关的描写性文字,但都忽略了在情节中把握人物。情节是人物的性格发展史,这一点恰是文中无相关文字说明而又要好好把握的地方。

    (8)注意人物的角色定位,认识到人物性格的多面性。人在社会中扮演多种不同的角色,角色不同,其言行举止、个性特征也不一样。可以通过不同的角色定位来全面把握人物。

    4.答题规范

    ①题干若问“××是一位怎样的人”,常用的答题模式为:

    总分:先用一句话从整体上对该人物作一个定性分析,然后再从几个方面作定量分析。

    分总:先从几个方面作定量分析,然后再用一句话作定性式的总括。

    ②题干若问“××具有怎样的性格特点”,常用的一般模式为:

    ××的性格特点:①××;②××。(分条作答)

    解答人物形象题要针对试题设题的角度具体灵活作答,且忌拘泥于一成不变的模式。

    二、“局部分析概括型”答题方法

    1.要读懂小说,一定要能梳理小说的情节,从整体上理解小说的结构。因为片段离不开整体。

    2.锁定具体语境,抓关键词。要理解所给的片段,分清是哪类描写,描写了什么,抓住其中的关键词语。

    3.瞻前顾后,联系上下文。看看在人物的这一片段言行举止之前或之后发生了什么,哪些情节与这些描写有关系,从而揣测出人物的内心活动。

    4.要设身处地地替小说中的人物想想:此时此刻,他做了什么?他为什么要这样做(这样说、这样想)?是在什么情态下做的?

    5.充分把握人物内心活动的复杂性和情感的丰富性。因为命题者的“题材”都是包含人物复杂内心的“这一点”。

    [即学即练] __________________ _______________________________________________________________

    阅读下面的文字,完成1~2题。

    铁  圈

    [俄]索洛杜布

    一天清晨,一位妇人带着一个4岁的小男孩在郊区的街道上散步。那孩子天真活泼,面色绯红。那妇人年龄不大,穿着考究。她一边幸福地微笑着,一边细心地照看着自己的儿子。孩子正在滚着一个黄色的大铁圈,他穿着短裤,挥动着棍棒欢快地笑着,跟在铁圈后面跑。他把棒子举得高高的,本来没有那种必要,可他就是那么做的。

    真开心!方才他还没有铁圈,可是现在有了,真叫人高兴!

    一个双手粗糙、衣服褴褛的老头,身体紧靠栅栏站在十字路口,好让那女人和小孩走过去。(1)老头用那昏花的两眼凝视着孩子,脸上露出呆痴的笑容。

    “一个富户人家的公子,”老头心里思忖道,“是个好孩子,你看他多么天真可爱,毕竟是阔人家的孩子!”

    当他——这个老头儿——还是个孩子的时候,他过的是苦难的日子。即使现在,他虽然不再挨打受饿了,但生活还谈不上美好。在他的孩提时代,他过的是挨打受骂、饥寒交迫的生活。那时,他没有铁圈,也没有其他这类阔少爷的玩具。他整个一生都是在艰辛困苦中度过的。他没有什么值得回忆的事,也没有一件让人高兴的事。

    他咧开没有牙齿的嘴朝那小孩微笑着,心里不禁产生了嫉妒,心想:“这种玩意没有意思。”嫉妒又转而变成了烦恼。于是他回到工作的地方——一家他从幼年起一直工作到现在的工厂。

    那小孩边跑边笑追逐铁圈的情景萦绕在他的脑际,不管机器声多么嘈杂,他都忘不了那个孩子和铁圈,晚上也总梦见他们。

    第二天早晨,他又做起白日梦来。机器隆隆地响,工作机械单调,没有必要过多操心,再说他已干惯了这种活。厂房里的空气充满了灰尘,传送带平稳地运转着,远处各个角落声音嘈杂,光线晦暗。人们像鬼魂一样地走来走去,人的说话声淹没在机器声里。

    这个老头仿佛觉得自己也变成了一个小男孩,他的母亲也是一位贵妇人,他也有一个铁圈和滚铁圈的棒子,他也在穿着白裤衩滚着铁圈玩耍。

    天天干着同样的活,做着同样的梦。

    一天晚上下班回家时,老头在街上看见一个从旧木桶上掉下来的又大又脏的圆箍。老头高兴得发抖,昏花的老眼流下了泪水。一种意外的,几乎没有想过的愿望进入了他的心灵。他小心地朝四面张望了一下,然后弯下腰哆哆嗦嗦地捡起那个圆箍,虽然他面带笑容,但还是不大好意思把它拿回家去。

    没人看见他,也没有人问他。这与别人有什么相干?一个小穷老头捡了一个无论对谁都没有用处的旧箍,谁会管呢?可他还是提心吊胆地偷偷把它拿走了。他为什么要捡?为什么要把它拿回家?他自己也说不清。只是由于它像那个小男孩的玩具,所以他才把它带回家来。

    圆箍在老头家破旧的房子里放了几天,闲着没事的时候,他就把它拿出来看看,因为这个肮脏的铁箍对他是个安慰,使那个经常出现在他梦境中的幸福的小男孩,终于变得更加真实了。

    一个晴朗、温暖的早晨,当城里树上的鸟正叫得比往常更加欢快的时候,老头早早起了床,洗漱完毕,便拿着他捡来的铁箍出了城。

    他一路咳嗽,穿过了枝叶茂密的森林。他不明白这些阴暗的树木为何这样寂静,还散发着奇特的香气,那些昆虫也令他惊奇。露水正像童话中描述的那样。那里既没有嘈杂声,也没有灰尘,树林后面是一片柔和、奇妙而暗淡的景色。

    老头折下一根干树枝穿上铁箍。

    他眼前展现出一片明亮寂静的田野,青草叶上的露珠闪闪发光。老头突然用那根树枝做成的木棒滚起铁箍来,铁箍轻松地在田野里滚动,老头跟在后面跑,他笑逐颜开,像那个跟着铁圈跑的小男孩一样,有时也将木棒高高地举过头去。

    他觉得自己仿佛再一次变成了一个有教养的幸福的小孩,并且好像感到母亲慈祥地微笑着跟在后面。灰白的胡须在憔悴的脸庞上颤抖着,不住的笑声和咳嗽声同时从他那没有牙齿的嘴里迸发出来。

    老头喜欢早晨到树林里来滚铁箍,有时他也怕人看见笑话他,一想到这里,他便感到有一种难堪的羞愧。羞愧又进而发展为恐惧,致使双腿开始发软,他一面滚铁圈,一面警惕地看着四周。

    可是没人看见他,也没人听见他……

    他尽情地玩够了之后,平安无事地走回城去,嘴角上流露出轻松愉快的笑容。

    由于没出什么事,他太太平平地一连玩了好几天。可是有一天清早他着了凉,卧病不起。(2)在工厂的医院里,当他在陌生的人们中间咽下最后一口气的时候,脸上还是堆着宁静的微笑。他感到欣慰,因为在他的想象中,自己也曾一度做了小孩,由亲爱的妈妈照看着,在树荫下的青草地上嬉戏笑闹。

    1.指出文中两处画线句反映出来的人物心理。

    (1)老头用那昏花的两眼凝视着孩子,脸上露出呆痴的笑容。

    答:_______________________________________

    (2)在工厂的医院里,当他在陌生的人们中间咽下最后一口气的时候,脸上还是堆着宁静的微笑。

    答:_______________________________________

    【示例】 (1)羡慕、向往。羡慕、向往幸福的童年,安逸舒适的生活。 (2)满足、欣慰。满足于自己在想象中终于成为幸福的孩子,拥有了亲情和美好童年。

    【解析】 首先找出画线句的位置,然后结合前后的语境分析人物的心理。第(1)处,“老头用那昏花的两眼凝视着孩子,脸上露出呆痴的笑容”,找出上文所写的有关“孩子”的内容,即可发现此时的老人对孩子的快乐是羡慕和向往的;第(2)处,“在工厂的医院里,当他在陌生的人们中间咽下最后一口气的时候,脸上还是堆着宁静的微笑”,联系后文“他感到欣慰,因为在他的想象中,自己也曾一度做了小孩,由亲爱的妈妈照看着,在树荫下的青草地上嬉戏笑闹”,可知此时老人对于自己在想象中拥有了快乐和幸福是非常欣慰和满足的。

    2.简析老人的形象。

    答:_______________________________________

    【示例】 ①善良。小男孩有了铁箍,“真叫人高兴”;②胆小谨慎,略带羞怯。“身体紧靠栅栏站在十字路口”“他小心地朝四面张望了一下,然后弯下腰哆哆嗦嗦地捡起那个圆箍,虽然他面带笑容,但还是不大好意思把它拿回家去”,最初并不好意思玩;③劳苦、虚弱。“他整个一生都是在艰辛困苦中度过的”“没有牙齿”。

    【解析】 首先给人物定位,从文中来看,“老人”是生活在社会底层的普通人;然后找出描写“老人”的行为、心理等内容,从文中对老人生活状况的叙述中可知,老人一生都处于困苦中;对老人面对铁圈时的描写中,如他看到“那个圆箍”时,他“小心地朝四面张望了一下,然后弯下腰哆哆嗦嗦地捡起”,可见他为人胆小而谨慎的;小男孩有了铁圈时,他的反应是“真叫人高兴”,可见老人是善良的。

    展开全文
  • 特征工程

    2019-08-09 18:07:16
    特征衍生 特征衍生是现有的特征进行某种组合,生成新的具有...对于总体特征选择来说,主要可以划分为三种选择方法 过滤法:按照发散性或者相关性对各个特征进行评分,设定阈值,选择特征。 常见的过滤方式包括方...

    特征衍生

    特征衍生是现有的特征进行某种组合,生成新的具有含义的特征。一般情况下,对于给的数据中,缺少必要的条件,我们需要将已知的特征进行组合,然后得到新的特征,这样能够让我们对数据的认识更加清晰。

    比较好的例子

    查看怎么样才能使用到我们的任务中

    特征选择

    对于总体的特征选择来说,主要可以划分为三种选择方法

    1. 过滤法:按照发散性或者相关性对各个特征进行评分,设定阈值,选择特征。
      常见的过滤方式包括方差分析、相关系数、假设检验、互信息等

      ​2. 包装法:根据目标函数(通常是预测效果评分),每次选择若干特征,或者排除若干特征。

      ​3. 嵌入法:先使用某些机器学习的算法和模型进行训练,得到各个特征的权值系数,根据系数从大到小选择特征。
      ​1.IV值进行特征选择

      ​1.1 基本介绍

      ​在二分类问题中,IV值(Information Value)主要用来对输入变量进行编码和预测能力评估。

      ​IV 值的取值范围是[0, ​),其大小表示该变量预测能力的强弱。通常认为:

      ​IV值 预测能力
      ​<0.02 无用特征
      ​0.02-0.1 弱预测
      ​0.1-0.3 中等预测
      ​0.3-0.5 强预测
      ​0.5 可疑特征
      ​一般选择中等和强预测能力的变量用于模型开发。

      ​1.2 计算公式

      ​1)WOE

      ​WOE(weight of evidence,证据权重),是对原始变量的一种编码形式。
      ​对一个变量进行WOE编码,首先要把变量进行分组处理(分箱或离散化)。常用离散化的方法有等宽分组,等高分组,或利用决策树来分组。
      ​分组后,对于第 i 组,WOE的计算公式见下式:


      ​它衡量了"当前分组中响应用户/所有响应用户"和"当前分组中未响应用户/所有未响应用户"的差异。

      ​2)IV值

      ​IV值的计算以WOE为基础,相当于是WOE值的一个加权求和。
      ​假设变量分了n个组。对第i组,计算公式如下:


      ​计算了变量各个组的 IV 值之后,我们就可以计算整个变量的 IV 值:


      ​IV值主要用于特征选择,如果想对变量的预测能力进行排序,可以按 IV 值从高到低筛选。

      ​IV在WOE前多乘了一个因子:
      ​1)保证了IV的值不是负数;
      ​2)很好的考虑了分组中样本占整体的比例(比例越低,这个分组对变量整体预测能力的贡献越低)。

      ​2.随机森林进行特征选择

      ​随机森林提供了两种特征选择的方法:mean decrease impurity和mean decrease accuracy。

      ​2.1 平均不纯度减少(mean decrease impurity)

      ​利用不纯度可以确定节点(最优条件). 对于分类问题,常采用基尼不纯度/信息增益;对于回归问题,常采用方差/最小二乘拟合。

      ​训练决策树时,可以计算每个特征减少了多少树的不纯度。对于一个决策树森林来说,可以算出每个特征平均减少了多少不纯度,并把它平均减少的不纯度作为特征选择的值。

      ​【缺点】
      ​1)该方法存在偏向, 对具有更多类别的变量更有利(也是信息增益的缺点);
      ​2)label存在多个关联特征(任意一个都可以作为优秀特征), 则一旦某个特征被选择, 其他特征的重要性会急剧降低。这会造成误解:错误的认为先被选中的特征是很重要的,而其余的特征是不重要的。

      ​2.2 平均精确率减少(Mean decrease accuracy)

      ​直接度量每个特征对模型精确率的影响。

      ​打乱每个特征的特征值顺序,并且度量顺序变动对模型的精确率的影响。
      ​对于不重要的变量来说,打乱顺序对模型的精确率影响不会太大,但是对于重要的变量来说,打乱顺序就会降低模型的精确率。

      ​遇到的问题
      ​1)求IV值遇到极端值时怎么处理?
      ​将WOE标记为0/无穷或平滑处理,对IV值有较大大影响。已经无法从0.2—0.5的取值来删除特征了(除了可疑预测,其余都在0.2—0.5之间)。

      ​2)虽然已经求得IV值或feature_importance,但不知道是不是取值不合常规就一定要删除该特征。
      ​代码参见我的github
    展开全文
  • 构建特征是一个很大的工程,总体来讲包括特征选择”、“特征表达”和“特征评估”3 个部分。我们也按这 3 个部分,并结合自己的具体实践,用 3 篇文章来和大家聊一下特征工程的相关问题。 本篇文章,我们讨论...

    特征质量的好坏,直接影响到最终的模型结果。构建特征是一个很大的工程,总体来讲包括 “特征选择”、“特征表达 和 “特征评估”3 个部分。我们也按这 3 个部分,并结合自己的具体实践,用 3 篇文章来和大家聊一下特征工程的相关问题。

    本篇文章,我们讨论一下特征选择。特征选择指的是,在全部的特征中,挑选出对最终的机器学习任务有用的特征。

    整体来讲,从特征选择的过程中有没有模型的参与,可以将特征选择的方法分为:基于统计量的选择和基于模型的选择

    (在本文的讨论中,默认所有的特征取值已经去除量纲的影响,或者说已经做过归一化处理。)

     

    基于统计量的特征选择

    如果把每个特征看做一个随机变量,在不同的样本点处该随机变量可能会取到不同的值。可以用统计的方法,基于样本集的统计结果,对特征做出选择。

    选择特征的标准主要有两个,一是特征本身取值的分散程度;二是该特征与要预测的结果之间的相关程度。

    常用的四个统计量和方法包括方差、相关系数、假设检验和互信息,下面依次说明。

    方差

    方差衡量的是一个随机变量取值的分散程度。如果一个随机变量的方差非常小,那这个变量作为输入,是很难对输出有什么影响的。因此在进行特征选择时,可以丢弃那些方差特别小的特征。

    例子:

    如果你手上有 5 个 offer,年收入水平分别是 100 万、100.01 万、100.02 万、100.03 万和 100.04 万,我想你最终会选择哪个 offer,年收入这个因素基本对你没太大影响吧。

     

    相关系数

    相关系数取值在 - 1 到 1 之间,表征的是两个随机变量之间的线性相关关系。相关系数为 0,表明两个变量之间线性无关;相关系数大于 0,说明两个变量之间是正相关;相关系数小于 0,代表两个变量之间负相关。

    特征与输出的相关系数的绝对值越大,说明对输出的影响越大,应该优先选择。

    例子:

    1. 收入和学历有关系吗?高学历完全不能保证高收入。但从统计总体来看,学历较高,收入也会相对较高。如果要你对一个陌生人的收入做预测,那么学历肯定是要关注的因素之一。

    2. 健康状况和吸烟多少有关系吗?我想,绝大多数人会认同,吸烟对健康是负相关,即有害的。

    3. 个人成功和家庭背景有关系吗?“当然没有”,前总理的女儿曾说过,“能力之外的资本等于 0”!

     

    假设检验

    假设检验是一种统计推断方法,简单来说就是先做一个假设,然后再基于某个量来判断该假设是否成立。比如,可以假设某个特征和输出是有显著相关性的,如果假设成立,即选择该特征;反之,丢弃该特征。

    例子:

    淑女品茶是一个有关假设检验的著名例子,这里换一下描述。

    如果你有一个同事,宣称他对咖啡非常有研究,可以喝出来是先加的奶还是先加的糖。

    你当然不信,所以你的假设是他没有这种判断能力。

    检验方式是,给他 10 杯咖啡,不告诉他制作过程,让他通过喝来判断。设他判断正确的杯数为 N,如果 N 超过了 9,你可能就要拒绝当初的假设了,他可能真的有这个能力。

     

    互信息

    互信息,也叫信息增益。用过决策树模型的同学,对这个应该都不陌生。

    简单来说,如果一个系统的信息熵为 A,在某一个特征的已知的情况下,系统的信息熵变成 B,则信息增益为 A-B。

    互信息越大,证明这个信息对系统的分类越有帮助,相应的特征应优先选择。

    (决策树用于回归问题时,互信息最大的标准变成了平方误差损失最小)

    咦?不是说基于统计量的方法吗,怎么这里用到树模型了?

    决策树模型分为树的生成和树的剪枝两个阶段,在树的生成阶段采用的是贪心策略,可以看做是基于统计量的。而 “模型学习” 的过程,更多的是树的剪枝。

    当然,如果把这种方法看做是基于模型的特征选择,也完全没有问题。

     

    基于模型的特征选择

    基于模型的特征选择,可以直接根据模型参数来选择,也可用子集选择的思路选出特征的最优组合。

    模型参数

    对具有线性结构的模型,如线性模型(如 Linear Regression)和对数线性模型(Logistic Regression,最大熵、线性链条件随机场等)等,都可以直接根据权重参数的大小来衡量对应特征的重要程度。

    因为模型的线性结构,某个维度上的特征如果对应的参数绝对值大,这个维度的特征就相对重要;反之,参数绝对值小,则特征相对不重要。

    对基于树结构的模型,如决策树、梯度提升树、随机森林和 XGBoost 等,每一颗树的生成过程,都对应了一个特征选择的过程。如上面关于信息增益一段的描述,可以对模型中涉及的树求平均,来表示特征的重要程度。与其他模型比,树模型的方差较大,因此选出来的特征也相对更不稳定。

    因此,用树模型选择特征时,建议综合多次的模型训练结果。

    如果我们想要得到稀疏特征或者说是对特征进行降维,可以在模型上主动使用正则化技术。使用 L1 正则,调整正则项的权重,基本可以得到任意维度的稀疏特征。

     

    子集选择

    基于模型,我们也可以用子集选择的思路来选取特征。假设特征的维度为 N,要从中选出 n 个(n < N)特征,目标是让模型在选出的特征上效果最好。显然,n 可以取不超过 N 的任意整数值,这就带来了组合爆炸的问题,总共要考虑的情况多到无法计算。解决组合爆炸问题,最常用的思路就是贪心策略(比如,决策树的生成过程中要选择切分特征和切分点,也是组合爆炸问题),常见的有前向搜索和反向搜索两种思路。

    前向搜索::如果我们先从 N 个特征中选出一个最好的特征,然后让其余的 N-1 个特征分别与第一次选出的特征进行组合,从 N-1 个二元特征组合中选出最优组合。之后,再次在上次的基础上,添加一个新的特征,考虑 3 个特征的组合。这种思路有很多种叫法,可以被称为 “递归式特征添加”、“前向搜索” 或“自下向上的搜索”等。

    反向搜索:反之,如果我们的目标是每次从已有特征中去掉一个特征,并从这些组合中选出最优组合。可以称为 “递归式特征消除”、“反向搜索” 或“自上向下的搜索”等。

    显然,子集选择是需要很大的计算量的,因为每种特征组合都要用模型训练一遍。因此,这种方法基本不适合大规模使用,可以用于最后的精挑细选。

     

    小结

    本文从基于统计量和基于模型两个角度,笼统地介绍了特征选择的各种方法和思路。

    基于统计量的特征选择,因为没有模型的参与,计算起来相对简单,可以作为一个特征预处理的过程;

    基于模型的方法,要对模型参数进行学习,因此计算量相对较大,但也更接近于最终目标,即可以训练出一个泛化能力很好的模型。

    因此,这两种方法可以结合起来使用。

    展开全文
  • 图像局部特征(一)--概述

    万次阅读 2016-06-25 21:42:22
    本文根据下面这篇文章,做下简单修改。 原文: ... 研究图像特征检测已经有一段时间了,图像特征...总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易...

    本文根据下面这篇文章,做下简单修改。

    原文:

    http://www.cnblogs.com/ronny/p/4260167.html

    研究图像特征检测已经有一段时间了,图像特征检测的方法很多,又加上各种算法的变形,所以难以在短时间内全面的了解,只是对主流的特征检测算法的原理进行了学习。总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。

    1. 局部特征点

    图像特征提取是图像分析与图像识别的前提,它是将高维的图像数据进行简化表达最有效的方式,从一幅图像的M×N×3 M×N×3的数据矩阵中,我们看不出任何信息,所以我们必须根据这些数据提取出图像中的关键信息,一些基本元件以及它们的关系。

    局部特征点是图像特征的局部表达,它只能反正图像上具有的局部特殊性,所以它只适合于对图像进行匹配,检索等应用。对于图像理解则不太适合。而后者更关心一些全局特征,如颜色分布,纹理特征,主要物体的形状等。全局特征容易受到环境的干扰,光照,旋转,噪声等不利因素都会影响全局特征。相比而言,局部特征点,往往对应着图像中的一些线条交叉,明暗变化的结构中,受到的干扰也少。

    而斑点与角点是两类局部特征点。斑点通常是指与周围有着颜色和灰度差别的区域,如草原上的一棵树或一栋房子。它是一个区域,所以它比角点的噪能力要强,稳定性要好。而角点则是图像中一边物体的拐角或者线条之间的交叉部分。

    2. 斑点检测原理与举例

    2.1 LoG与DoH

    斑点检测的方法主要包括利用高斯拉普拉斯算子检测的方法(LOG),以及利用像素点Hessian矩阵(二阶微分)及其行列式值的方法(DOH)。

    LoG的方法已经在斑点检测这入篇文章里作了详细的描述。因为二维高斯函数的拉普拉斯核很像一个斑点,所以可以利用卷积来求出图像中的斑点状的结构。

    DoH方法就是利用图像点二阶微分Hessian矩阵:

     

    H(L)=[L xx L xy  L xy L yy  ] H(L)=[LxxLxyLxyLyy]

     

     

     

    以及它的行列式的值DoH(Determinant of Hessian):

     

    det=σ 4 (L xx (x,y,σ)L yy (x,y,σ)−L 2 xy (x,y,σ)) det=σ4(Lxx(x,y,σ)Lyy(x,y,σ)−Lxy2(x,y,σ))

     

     

     

    Hessian矩阵行列式的值,同样也反映了图像局部的结构信息。与LoG相比,DoH对图像中的细长结构的斑点有较好的抑制作用。

    无论是LoG还是DoH,它们对图像中的斑点进行检测,其步骤都可以分为以下两步:

    1)使用不同的σ σ生成(∂ 2 gx 2  +∂ 2 gy 2  ) (∂2g∂x2+∂2g∂y2)或∂ 2 gx 2  ,∂ 2 gy 2  ,∂ 2 gxy  ∂2g∂x2,∂2g∂y2,∂2g∂x∂y模板,并对图像进行卷积运算;

    2)在图像的位置空间与尺度空间中搜索LoG与DoH响应的峰值。

    2.2 SIFT

    详细的算法描述参考:SIFT定位算法关键步骤的说明

    2004年,Lowe提高了高效的尺度不变特征变换算法(SIFT),利用原始图像与高斯核的卷积来建立尺度空间,并在高斯差分空间金字塔上提取出尺度不变性的特征点。该算法具有一定的仿射不变性,视角不变性,旋转不变性和光照不变性,所以在图像特征提高方面得到了最广泛的应用。

    该算法大概可以归纳为三步:1)高斯差分金字塔的构建;2)特征点的搜索;3)特征描述。

    在第一步中,它用组与层的结构构建了一个具有线性关系的金字塔结构,让我们可以在连续的高斯核尺度上查找特征点。它比LoG高明的地方在于,它用一阶高斯差分来近似高斯的拉普拉斯核,大大减少了运算量。

    在第二步的特征点搜索中,主要的关键步骤是极值点的插值,因为在离散的空间中,局部极值点可能并不是真正意义上的极值点,真正的极植点可以落在了离散点的缝隙中。所以要对这些缝隙位置进行插值,然后再求极值点的坐标位置。

    第二步中另一关键环节是删除边缘效应的点,因为只忽略那些DoG响应不够的点是不够的,DoG的值会受到边缘的影响,那些边缘上的点,虽然不是斑点,但是它的DoG响应也很强。所以我们要把这部分点删除。我们利用横跨边缘的地方,在沿边缘方向与垂直边缘方向表现出极大与极小的主曲率这一特性。所以通过计算特征点处主曲率的比值即可以区分其是否在边缘上。这一点在理解上可以参见Harris角点的求法。

    最后一步,即为特征点的特征描述。特征点的方向的求法是需要对特征点邻域内的点的梯度方向进行直方图统计,选取直方图中比重最大的方向为特征点的主方向,还可以选择一个辅方向。在计算特征矢量时,需要对局部图像进行沿主方向旋转,然后再进邻域内的梯度直方图统计(4x4x8)。

    2.3 SURF

    详细的算法描述参考:1. SURF算法与源码分析、上  2.SURF算法与源码分析、下

    2006年,Bay和Ess等人基于SIFT算法的思路,提出了加速鲁棒特征(SURF),该算法主要针对于SIFT算法速度太慢,计算量大的缺点,使用了近似Harr小波方法来提取特征点,这种方法就是基于Hessian行列式(DoH)的斑点特征检测方法。通过在不同的尺度上利用积分图像可以有效地计算出近似Harr小波值,简化了二阶微分模板的构建,搞高了尺度空间的特征检测的效率。

    SURF算法在积分图像上使用了盒子滤波器对二阶微分模板进行了简化,从而构建了Hessian矩阵元素值,进而缩短了特征提取的时间,提高了效率。其中SURF算法在每个尺度上对每个像素点进行检测,其近似构建的Hessian矩阵及其行列式的值分另为:

     

    H approx =[D xx (σ)D xy (σD xy (σ)D yy (σ) ] Happrox=[Dxx(σ)Dxy(σ)Dxy(σ)Dyy(σ)]

     

     

     

     

    c(x,y,σ)=D xx D yy −(0.9D xy ) 2  c(x,y,σ)=DxxDyy−(0.9Dxy)2

     

     

     

    其中D xx ,D xy  Dxx,Dxy和D yy  Dyy为利用盒子滤波器获得的近似卷积值。如果c(x,y,σ) c(x,y,σ)大于设置的门限值,则判定该像素点为关键字。然后与SIFT算法近似,在以关键点为中心的3×3×3 3×3×3像素邻域内进行非极大值抑制,最后通过对斑点特征进行插值运算,完成了SURF特征点的精确定位。

    而SURF特征点的描述,则也是充分利用了积分图,用两个方向上的Harr小波模板来计算梯度,然后用一个扇形对邻域内点的梯度方向进行统计,求得特征点的主方向。

    3. 角点检测的原理与举例

    角点检测的方法也是极多的,其中具有代表性的算法是Harris算法与FAST算法。

    这两个算法我都有专门写过博文来描述其算法原理。Harris角点FAST特征点检测

    3.1 Harris角点特征提取

    Harris角点检测是一种基于图像灰度的一阶导数矩阵检测方法。检测器的主要思想是局部自相似性/自相关性,即在某个局部窗口内图像块与在各个方向微小移动后的窗口内图像块的相似性。

    在像素点的邻域内,导数矩阵描述了数据信号的变化情况。假设在像素点邻域内任意方向上移动块区域,若强度发生了剧烈变化,则变化处的像素点为角点。定义2×2 2×2的Harris矩阵为:

     

    A(x)=∑ x,y ω(x,y)[C 2 x (x)C x C y (xC x C y (x)C 2 y (x) ]=[ab bc ] A(x)=∑x,yω(x,y)[Cx2(x)CxCy(x)CxCy(x)Cy2(x)]=[abbc]

     

     

     

    其中,C x  Cx和C y  Cy分别为点x=(x,y) x=(x,y)在x x和y y方向上的强度信息的一阶导数,ω(x,y) ω(x,y)为对应位置的权重。通过计算Harris矩阵的角点响应值D来判断是否为角点。其计算公式为:

     

    D=detAm(traceA) 2 =(acb) 2 −m(a+c) 2  D=detA−m(traceA)2=(ac−b)2−m(a+c)2

     

     

     

    其中,det和trace为行列式和迹的操作符,m m是取值为0.04~0.06的常数。当角点响应值大于设置的门限,且为该点邻域内的局部最大值时,则把该点当作角点。

    3.2 FAST角点特征提取

    基于加速分割测试的FAST算法可以快速地提取出角点特征。该算法判断一个候选点p p是否为角点,依据的是在一个像素点p p为圆心,半径为3个像素的离散化Bresenllam圆周上,在给定阈值t t的条件下,如果在圆周上有n n个连续的像素灰度值大于I(p)+t I(p)+t或小于I(p)−t I(p)−t。

    针对于上面的定义,我们可以用快速的方法来完成检测,而不用把圆周上的所有点都比较一遍。首先比较上下左右四个点的像素值关系,至少要有3个点的像素灰度值大于I(p)+t I(p)+t或小于I(p)−t I(p)−t,则p p为候选点,然后再进一步进行完整的判断。

    为了加快算法的检测速度,可以使用机器学习ID3贪心算法来构建决策树。这里需要说明的是,在2010年Elmar和Gregory等人提出了自适应通用加速分割检测(AGAST)算法,通过把FAST算法中ID3决策树改造为二叉树,并能够根据当前处理的图像信息动态且高效地分配决策树,提高了算法的运算速度。

    4. 二进制字符串特征描述子

    可以注意到在两种角点检测算法里,我们并没有像SIFT或SURF那样提到特征点的描述问题。事实上,特征点一旦检测出来,无论是斑点还是角点描述方法都是一样的,可以选用你认为最有效的特征描述子。

    特征描述是实现图像匹配与图像搜索必不可少的步骤。到目前为止,人们研究了各种各样的特征描述子,比较有代表性的就是浮点型特征描述子和二进帽字符串特征描述子。

    像SIFT与SURF算法里的,用梯度统计直方图来描述的描述子都属于浮点型特征描述子。但它们计算起来,算法复杂,效率较低,所以后来就出现了许多新型的特征描述算法,如BRIEF。后来很多二进制串描述子ORB,BRISK,FREAK等都是在它上面的基础上的改进。

    4.1 BRIEF算法

    BRJEF算法的主要思想是:在特征点周围邻域内选取若干个像素点对,通过对这些点对的灰度值比较,将比较的结果组合成一个二进制串字符串用来描述特征点。最后,使用汉明距离来计算在特征描述子是否匹配。

    BRIEF算法的详细描述可以参考:BRIEF特征描述子

    4.2 BRISK算法

    BRISK算法在特征点检测部分没有选用FAST特征点检测,而是选用了稳定性更强的AGAST算法。在特征描述子的构建中,BRISK算法通过利用简单的像素灰度值比较,进而得到一个级联的二进制比特串来描述每个特征点,这一点上原理与BRIEF是一致的。BRISK算法里采用了邻域采样模式,即以特征点为圆心,构建多个不同半径的离散化Bresenham同心圆,然后再每一个同心圆上获得具有相同间距的N个采样点。

    image

    由于这种邻域采样模式在采样时会产生图像灰度混叠的影响,所以BRISK算法首先对图像进行了高斯平滑图像。并且使用的高斯函数标准差σ i  σi与各自同心圆上点间距成正比。

    假设在(N2) (N2)个采样点中任意选取一对采样点(p i ,p j ) (pi,pj),其平滑后的灰度值分别为I(p i ,σ i ) I(pi,σi)和I(p j ,σ j ) I(pj,σj),则两点间的局部梯度为:

     

    g(p i ,p j )=(p j −p i )I(p j ,σ j )−I(p i ,σ i )∥p j −p i ∥ 2   g(pi,pj)=(pj−pi)I(pj,σj)−I(pi,σi)∥pj−pi∥2

     

     

     

    假设把所有采样点对构成的集合记为A A,则

     

    A={(p i ,p j )∈R 2 ×R 2 |i<Nj<ii,jN} A={(pi,pj)∈R2×R2|i<N且j<i且i,j∈N}

     

     

     

    那么短距离采样点对构成的集合S以及长距离采样点构成的集合L分别为:

     

    S={(p i ,p j )∈A|∥p j −p i ∥<δ max }⊆A S={(pi,pj)∈A|∥pj−pi∥<δmax}⊆A

     

     

     

     

    L={(p i ,p j )∈A|∥p j −p i ∥>δ min }⊆A L={(pi,pj)∈A|∥pj−pi∥>δmin}⊆A

     

     

     

    其中,通常设置距离阈值为δ max =9.75δ,δ min =13.67δ δmax=9.75δ,δmin=13.67δ,其中δ δ为特征点的尺度。

    由于长距离采样点对含有更多的特征点角度信息,且局部梯度相互抵消,所以可以在集合L中计算出特征点的特征模式方向为:

     

    g=(g x g y  )=1L ∑ (p i ,p j )∈L g(p i ,p j ) g=(gxgy)=1L∑(pi,pj)∈Lg(pi,pj)

     

     

     

    然后将采样模式围绕特征点旋转角度α=arctan2(g y ,g x ) α=arctan2(gy,gx),进而特征描述子具有了旋转不变性。

    最后,在旋转后的短距离采样点集合S内,对所有的特征点对(P α i ,p α j ) (Piα,pjα)行像素灰度值比较,最终形成512比特的二进制字符串描述子。

    4.3 ORB算法

    ORB算法使用FAST进行特征点检测,然后用BREIF进行特征点的特征描述,但是我们知道BRIEF并没有特征点方向的概念,所以ORB在BRIEF基础上引入了方向的计算方法,并在点对的挑选上使用贪婪搜索算法,挑出了一些区分性强的点对用来描述二进制串。ORB算法的详细描述可以参考:ORB特征点检测

    4.4 FREAK算法

    Fast Retina KeyPoint,即快速视网膜关键点。

    根据视网膜原理进行点对采样,中间密集一些,离中心越远越稀疏。并且由粗到精构建描述子,穷举贪婪搜索找相关性小的。42个感受野,一千对点的组合,找前512个即可。这512个分成4组,前128对相关性更小,可以代表粗的信息,后面越来越精。匹配的时候可以先看前16bytes,即代表精信息的部分,如果距离小于某个阈值,再继续,否则就不用往下看了。

    5. 应用之图像匹配

    图像匹配的研究目标是精确判断两幅图像之间的相似性。图像之间的相似性的定义又随着不同的应用需求而改变。例如,在物体检索系统中(找出含有亚伯拉罕·林肯的脸的图像),我们认为同一物体的不同图像是相近的。而在物体类别检索系统中(找出含有人脸的图像),我们则认为相同类的物体之间是相近的。

    这里局部特征点的应用主要表现在第一种相似性上,也就是说我们需要设计某种图像匹配算法来判断两幅图像是否是对同一物体或场景所成的图像。理想的图像匹配算法应该认为两幅同一物体的图像之间相似度很高,而两幅不同物体的图像之间相似度很低,如下图所示。

    image

    由于成像时光照,环境,角度的不一致,我们获取的同一物体的图像是存在差异的,如同上图中的两辆小车的图像一样,角度不同,成像就不同。我们直接利用图像进行比较是无法进行判断小车是否为同一类的。必须进行特征点的提取,再对特征点进行匹配。

    图像会存在哪些变换呢?一般来说包括了光照变化与几何变化,光照变化表现是图像上是全局或局部颜色的变化,而几何变化种类就比较多了,可以是平移、旋转、尺度、仿射、投影变换等等。所以我们在研究局部特征点时才要求特征点对这些变化具有稳定性,同时要有很强的独特性,可以让图像与其他类的图像区分性强,即类内距离小而类间距离大。

    6. 参考文献

    [1] 基于角点的图像特征提取与匹配算法研究,薛金龙,2014.

    [2] 基于局部特征的图像匹配与识别,宫明明,2014.

    [3] 基于视觉信息的图像特征提取算法研究,戴金波,2014.

    [4] 图像局部不变性特征与描述,王永明,王贵锦编著。

    

    展开全文
  • 局部特征点算法简介

    2019-06-24 18:42:54
    图像特征可以包括颜色特征、纹理特征、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰。在对图像进行特征提取时,通常要将图像灰度化,这是因为颜色,易受光照影响,难以提供关键...
  • 总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。本篇文章现在(2015/1/30)只是以初稿的...
  • 总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。 本篇文章现在(2015/1/30)只是以初稿...
  • 决定现今煤田构造格局的主要控制因素包括地球动力学环境、构造演化历程、深部构造属性、构造应力场作用以及煤系岩性组合特征等方面。中国大陆自晚古生代主要成煤期以来,相继经历了多期次构造运动的作用,大陆构造演化...
  • 图像局部特征点检测算子综述

    千次阅读 2015-02-01 12:26:43
    总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。 1. 局部特征点 图像特征提取是图像...
  • 总体来说,图像特征可以包括颜色特征、纹理特征、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。 1 局部特征点 图像特征提取是图像...
  • 一、项目总体介绍

    2018-03-03 15:22:05
    django是一个知名的、使用...本项目具有如下的特征包括但不限于): 完整的登录注册、密码找回、个人中心等功能; 个人中心可以修改个人相关信息,包括头像、邮箱、密码等 ,可以管理收藏和消息; 具有多个不同...
  • 总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。 本篇文章现在(2015/1/30)只是...
  • 击上方“新机器视觉”,选择加"星标...总体来说,图像特征可以包括颜色特征、纹理特征、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。1...
  • 深度学习总体介绍与神经网络入门一. 深度学习1.深度学习发展2.基本概念3.应用特点 一. 深度学习 1.深度学习发展 深度学习的出现 传统机器学习和深度学习 传统机器学习的数据预处理和深度学习是相通的,包括深度...
  • 总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。本篇文章现在(2015/1/30)只是以初稿的...
  • 黔西地区煤层气主要以吸附状态赋存于煤层中,黔西地区煤层气的化学组分主要包括甲烷、硫化氢以及微量的稀有气体,煤层气组分受埋深影响总体上甲烷浓度偏低,氮气浓度偏高。下部煤层高含气量分布范围略大于上部煤层,在...

空空如也

空空如也

1 2 3 4 5 ... 18
收藏数 343
精华内容 137
关键字:

总体特征包括