精华内容
下载资源
问答
  • 形象特点的词语
    千次阅读
    2020-12-20 06:52:51

    分析概括小说中人物形象特点

    分析人物形象是读懂小说的关键。小说主要是通过鲜明而独特的人物形象来打动读者和感染读者。人物形象的概括与分析,几乎是小说阅读的必考题:有的试题只检测概括能力,不分析;有的试题是先概括后分析。

    【例】(2016·山东卷)(文本见本专题考点一考向二“例”)文中的吴秋明是一个怎样的人物形象?请简要概括。

    解析 从文中看,吴秋明是一位“单身”“心理学博士”;熟知儿童心理,能够学以致用;质朴、善良,有爱心,真心爱儿童村的孩子,并用实际行动去关爱他们。简要总结即可得出答案。

    答案 吴秋明是一个细心、耐心,有爱心,充满吸引力的单身心理学女博士的形象。

    【设问方式】

    1.作品中××有哪些性格特点?请简要分析。

    2.小说中××是一个什么样的人物形象?他(她)有什么样的心态?请简要分析。

    3.请概括××与××的性格特点,并作简要分析。

    【知识储备】

    小说中的人物,又称典型人物,是作者根据现实生活,采用“杂取种种,合成一个”的艺术手法创作出来的。对比生活中的原型,小说中的人物往往更具有代表性。

    小说人物的形象特征包括两个方面:外在特征和内在特征。外在特征是指人物的外貌、职业、生活习惯等,内在特征是指人物的心理状态、精神品质等。

    把握小说人物的形象特征要从以下两点入手:一是重视小说中人物的身份、地位、经历、教养和气质等,因为它们直接决定着人物的言行,影响着人物的性格;二是结合小说对人物语言、外貌、行动和心理的直接描写,以及对环境、与他人的关系等的间接描写把握人物的思想感情和性格特征。

    1.描写人物形象手法

    2.借助人物的身份、地位、经历、教养、气质等来表现人物

    小说中人物的身份,所拥有的社会地位,以及他的人生经历,个人涵养、教养等因素,直接决定了人物的言行,影响着人物的性格。如《祝福》中的鲁四老爷,他是“一个讲理学的老监生”,是封建礼教的坚决捍卫者,他思想僵化,反对新党,反对一切变革,已经是民国时代了,而他还停留在封建时代。对于祥林嫂,起初只是因为她是寡妇,觉得很不吉利罢了,但还能容忍;后来祥林嫂改嫁回来,他实在无法容忍,因为在他的封建伦理观念里,改嫁是女子最大的罪恶,他害怕玷污了祖先。正因为这种歧视,才彻底地毁灭了祥林嫂想要活下去的希望,她被扫地出门,悲惨而死,还要被骂一句“谬种”。

    3.借助情节来展现人物的形象(性格)特征

    情节是小说故事推进的过程,是人物性格的发展史。在情节的展开中,通过描写人物的外貌、行为和心理状态,再现人物的鲜明个性。因此,欣赏人物形象,必须从情节入手。

    4.把人物置于特定的社会历史背景中展现

    小说中的人物,都是在一定的社会历史背景下活动的。鉴赏人物如果离开了人物活动的社会历史背景,就不可能正确理解人物,更不可能理解人物形象的社会意义。因为人物的个性形成与他的生活环境有关,作者塑造一个人物,都是把他当成特定历史时期的典型人物来塑造的。一个人物形象塑造得成功与否,不但要看他是否有鲜明的“个性”,还要看他是否有广泛的“共性”。而对人物“共性”的分析,就必须放到一定的社会历史背景中去把握。如祥林嫂就是半殖民地半封建社会时期中国农村下层妇女的典型代表。

    【提示】前三条侧重对人物个性方面的分析,本条侧重于共性方面的分析。对人物形象的分析,最好是采用两者相结合的分析方法。

    小说人物形象题解题技巧

    1.分析人物形象题的解题思维方法

    (1)把握特点。总体把握小说人物形象特点,确定作者的感情倾向是褒还是贬,是颂扬还是讽刺。然后画出小说中关于这个人物言行的语句,以及作者的议论或者作者借作品中其他人物对他的评价的语句。

    (2)分析方法。看用了什么描写方法,通过人物描写(语言、行动、心理、肖像、细节)分析人物的性格特征,在此基础上进行归类概括。最后选择恰当的词句表述出来。

    2.解决人物形象特征分析或概括不准确的问题

    (1)读懂故事情节,了解作者对小说中的人物是赞扬还是批判,是肯定还是否定。

    (2)抓住文中某处具体的人物言行、细节分析时不能孤立地分析,而应着眼全篇、前后观照,结合作品的大背景和具体的情境来分析。

    (3)分析时要参考人物的身份、地位及所处的环境,防止任意拔高或贬损。

    (4)使用概括形象特点的词语要字斟句酌,认真推敲,最好能借助原文中的词语。

    另外,要具有依据历史时代、社会文化和民族特点去评判人物的思考视角。像概括、分析外国小说中的人物,就不宜照着中国的文化观念和审美习惯进行,而要有西方的文化视角,要站在他们当时的社会、历史和文化背景下去评判。

    分析概括小说人物形象特点的答题模板

    1.综合表述式。用一个判断句表述:××是一个……(思想性格特点)+……(身份地位)的人。

    2.分点列举式。××的性格特点:特点一+分析;特点二+分析;特点三+分析。

    【练习】

    玛兰在做部长的同学帮助下做了行政法院参事。……出于一种有权势而又宽宏大量者的责任感,他油然萌生一股压制不住要去保护别人的欲望。无论在哪里遇到熟人,他都高兴地迎上去,不等人家问,就连忙说:“您知道,我现在当参事了,很想为您出点力。如有用得着我的地方,请您甭客气,尽管吩咐好了。我在这个位置上,是有点权力的。”

    一天早上,他去行政法院,在避雨的门口遇到一个老神父(指桑蒂尔,被控告做过许多卑鄙龌龊的事),他说:

    “如果您愿意,神父,我可以和您合用我这把伞。我到行政法院去,我是那里的参事。

    “哼!您可碰到了一个千载难逢的机会,神父。瞧吧,瞧吧,有了我,您的事情解决起来一定非常顺利。”

    当他得知那位神父是一个骗子,有损于他的声誉时,张皇失措地对他的同事珀蒂帕说:“别提了……您瞧……我上当了……他这人看上去那么老实……他耍了我……卑鄙可耻地耍了我。我求您,求您设法狠狠地惩办他一下,越狠越好。我要写信。请您告诉我,要惩办他,得给谁写信?……对,找总主教!”

    (节选自莫泊桑《保护人》)上面这段文字,主要写玛兰的语言,表现了他怎样的性格特点?

    解析 这段文字,惟妙惟肖地描写了玛兰“压制不住要去保护别人的欲望”,“权力”“保护伞”是他的拐杖,后来自己主动承揽的保护“骗子”一事,却让他现出了自己的原形。作答本题时,要分析人物语言与人物内心世界的实际联系,进而理出人物性格特点。

    答案 从他对熟人及那位陌生神父说的话语中,一方面可以看出他的天真、热心、没有原则,另一方面可以看出他的炫耀、虚荣、自私、自高自大。从他对同事珀蒂帕所说的话语中,可以看出他的自私自利、见风使舵。

    2.阅读下面的文字,完成后面的题目。

    (他租个黄鱼车,把书从货站运到静安寺。骑黄鱼车的是个小伙子,他骑自行车跟着。)

    路上,小伙子问他:“你家住在静安寺?”他说:“是。”小伙子又问:“你家有浴缸吗?”他警觉起来,心想,这人是不是要在他家洗澡?他含含糊糊地说:“嗯。”小伙子接着问:“你是在哪里上班?”“机关。”“那你们单位里有浴缸吗?”小伙子再问。他说:“有是有,不过……”他也想含糊过去,可是小伙子看着他,等待下文,他只得说下去:“不过,那浴缸基本没人洗,太大了,需要很多热水。”

    路两边的树很稀疏。太阳烤着他俩的背,他俩的汗衫都湿了。从货站到静安寺,几乎斜穿了整个上海。他很渴,可是心想:“如果喝汽水,要不要给他买呢?”想到这里,就打消了念头。

    小伙子又问道:“你每天在家还是在单位洗澡呢?”他先说“在家”,可一想这人也许是想在他家洗澡,就改口说“单位”。这时又想起自己刚说过单位浴缸没人用,就又补了句:“看情况而定。”那人接着问:“你家的浴缸大还是小?”他不得已地说:“很小。”“怎样小?”“像我这样的人坐在里面要蜷着腿。”“那你就要把水放满,泡在里边;或者就站在里面,用脸盆盛水往身上泼,反倒比较省水。”“是的。”他答应道,心里却动了一下,望了一眼那人汗淋淋的身子,想:其实让他洗个澡也没什么。可是想到女人说过“厨房可以合用,洗澡间却不能合用”的一些道理,就没再想下去。这时已到了市区,两边的梧桐树高大而茂密,知了懒洋洋地叫着。风吹在热汗淋淋的身上,很凉爽,他渴得非常厉害,他已经决定去买两瓶汽水,他一瓶,那人一瓶。可是路边却没有冷饮店。(节选自王安忆《洗澡》)

    请根据上面语段中心理描写的内容,概括“他”的性格特点。

    解析 从第一段中,“他”想喝汽水,又担心给别人买,到第二段中关于洗澡的一系列猜度,到最后决定去买两瓶汽水,表现他精明而多虑、小气又善良的性格。拟写答案时,要从人物心理活动的全过程入手,关注人物“好与坏”两个方面。

    答案 “他”既有精明、敏感、细腻、谨慎、多虑、小气甚至吝啬的一面,又有心地善良、通情达理的一面。

    更多相关内容
  • 从“飒”词义演变语用特点窥探网络词语流变规律.docx
  • 新人主播形象声乐培训(共277份).zip
  • 网络安全词汇术语汇编
  • 《希腊神话》赫尔墨斯形象分析

    千次阅读 2020-04-08 16:03:45
    在背词汇时,用词根词缀法背诵单词是一个很好的背诵方法。最近,在单词书中看见一个commercial的单词,其中有很多衍生词: commerce(商业) e-commerce(电子商务) merchant(商人) merchandise(商品) 通过这些词,我...

          在背词汇时,用词根词缀法背诵单词是一个很好的背诵方法。最近,在单词书中看见一个commercial的单词,其中有很多衍生词:

    • commerce(商业)
    • e-commerce(电子商务)
    • merchant(商人)
    • merchandise(商品)

          通过这些词,我查阅了相关文献,发现这个单词的衍生与希腊神话中赫尔墨斯有关,我又转而,去看了一下赫尔墨斯的相关资料。想起中学的时候读过《赫尔墨斯和他的雕像者》(源自《伊索语言》),讲的是自诩商业保护神的他在商人卖雕像的时候不过是宙斯和赫拉一个添头。

    赫尔墨斯介绍

          赫尔墨斯是宙斯与迈亚女神的私生子,奥林波斯十二主神之一,他身兼多职,主要有商人的保护神、旅行者的保护神、畜牧业之神;同时他还被奉为诈骗者的祖师爷,小偷的保护神;他还发明了尺、数字和字母。据传,他出生在阿尔卡迪亚的一个山洞中,出生后便显示出异乎常人的能力——他竟自己造了一把里拉琴。后来,他巧妙地偷走了阿波罗的牛。最后在宙斯的调解下,赫尔墨斯与阿波罗达成了和解——赫尔墨斯以他制造的里拉琴换取了阿波罗被偷的牛。之后赫尔墨斯又在阿波罗的帮助下成了奥林波斯的十二主神之一,主要作为神使传达诸神的旨意。由于工作的需要,他需要经常往来于神人两界,所以被奉为旅行者的保护神;因为他发明了度量衡,被奉为商业之神;又因为他出生没多久就偷了阿波罗的牛,又被奉为小小偷的保护神。可见,赫尔墨斯身上具有十分复杂的属性。

    商业之神

          希腊神话顾名思义,源于希腊。希腊与中国不同,以商品经济著称,那为什么赫尔墨斯能被赋予多重含义呢?那就需要对赫尔墨斯的各种属性对比希腊当时经济状况。
    他是商业之神,因为他创造了度量衡。这是极大的方便商人在交易过程中核实物品质量。他的发明就显地非常重要,与此同时,他作为奥林波斯上十二大主神之一,也看得出商品经济在希腊地位之高,也体现了政府的“重商”思想。

    畜牧业之神

          第二他是畜牧业之神,由于在《希腊神话》中,赫尔墨斯出身的时候,熊孩子就把阿波罗的牧群给顺走,也落下个畜牧之神。在纵观希腊生产实际中,畜牧业实际上为商业活动提供了物质支持。畜牧业所产出的产品,如牛羊肉、毛皮、角等,除了一部分自用外,其余都是不错的出口品。因此,畜牧业的好坏在一定程度上影响到商业的成败,所以赫尔墨斯会兼任畜牧之神。

    旅行者保护之神

          第三,赫尔墨斯是旅行者的保护神。在神话中作为神使的他经常需要长途奔波来传达神的各种旨意。而他有一双神奇的鞋子,能够帮助他快速地移动,因此他被奉为旅行者的保护神。这一属性当然也与商业活动密切相关,商人日里万机的形象犹如王总的日程表。

    诈骗之神

          同样也有两个特别有趣的属性,即诈骗之神和小偷的保护神。,即诈骗之神和小偷的保护神。传说赫尔墨斯发明了诈骗术并将其传给了自己的儿子,还有他一出生就偷了阿波罗的牛,所以获得这两个不值得羡慕的称号。。由于商业对利益的追求 是无止境的,人们为了追求利益,一般情况下会通过正当的贸 易活动。但在万般无奈之下也会行骗和偷窃,特别是当商品经 济发展到一定阶段时,对人的思想道德和整个社会的风气会 产生一定的冲击,这时诈骗和偷窃便盛行起来。然而,即使是 小偷和骗子,他们也会把偷来的和骗来的东西重新投入生产 生活中,甚至投入商业活动中,譬如小偷偷来的赃物一定会拿 到市场上卖(如果他自己不急着用的话),这样,原来的小偷和 骗子又都转化为商人。这样一来,他们自然也就成了赫尔墨斯 的保护对象。

    总结

          作为奥林波斯山上的十二大主神之一,因为希腊对商业的重视被誉为商业之神也显得不足为奇了。通过对单词commercial的延伸,也看见了单词本质承载着文化的变迁。

    参考文献
    [1]钟国章.赫尔墨斯——神话反映的古希腊商品经济[J].艺术科技,2017,30(11):424-425.
    [2]唐晓霞.阿斯克勒庇俄斯之杖与双蛇杖[J].学理论,2014(24):117-119.

    展开全文
  • 网络安全词汇术语汇编 - v3.0.pdf
  • 本文将以尽可能少的数学公式介绍目前业界比较流行的基于神经网络进行文本特征提取,得到文本向量的方案。 1. 背景知识 这部分内容将介绍线性回归、梯度下降、神经网络、反向传播。对于有基础的同学这部分可以跳过...

    在实际系统我们会接触到许许多多的文本类型数据。如何将这部分数据用于作为机器学习模型的输入呢?一个常用的方法是将文本转化为一个能很好的表示它的向量,这里将称该向量称作为文本向量。本文将以尽可能少的数学公式介绍目前业界比较流行的基于神经网络进行文本特征提取,得到文本向量的方案。

    1. 背景知识


    这部分内容将介绍线性回归、梯度下降、神经网络、反向传播。对于有基础的同学这部分可以跳过,对于之前没有接触过相关知识点的同学,我会用尽可能少的公式去介绍。希望能讲明白 ==

    1.1 线性回归模型


    其实线性回归模型很简单,它类似于我们中学学的多元一次方程的形式,如:


    1.2 梯度下降


    哪我们如何找到最佳的参数W和b呢?业界最流行的方法就是使用梯度下降。 

    梯度下降法的形象化说明: 

    在这个碗形图中,横轴表示参数W和b,在实践中,可以是更高的维度。 
    如图那个小红点,采用随机初始化的方法初始化的参数W和b:

    我们的目标是将它下落到碗形图的最底部,即min(J(w,b)):

    那红点会怎么下落呢?回想下中学学的物理就很形象了,我们先只看ww轴。没错,沿着斜率方向下降,红点会快的接近碗底。

    当然,如何一直沿着最初的斜率方向走是不能到达碗底的,而应该一小步一小步的走,每走一步调整方向为当前的斜率方向:

    对于b轴也类似,那么红点就会如下图一步一步的下降:

    于是每一步我们更新参数为:

    其中 α 为每一步的步长。 
    这样不断的迭代,不断的下降,参数W和b的取值就不断的被优化了。

    1.3 神经网络

    我们先来介绍单个神经元的模型结构,如下图: 

    1.3.1 激活函数

    唯一不同的是神经元里面还可以存在激活函数,如果神经元没激活函数,那么就和上文讲的线性回归模型基本上一模一样。常见的激活函数有: 
    - sigmoid函数

    -Tanh函数 

    -ReLU函数 

    为什么需要有这么多激活函数呢?激活函数是为了让神经网络具有非线性的拟合能力。其实激活函数的选择也还在不断演进,是学术界热门研究方向,我们也可以自己创造激活函数。激活函数适用也不同,如ReLU函数能有效的预防梯度消失问题,而sigmoid函数能讲回归问题转化为二分类问题。

     

    1.3.2 神经网络介绍

    理解了基础的神经元模型,神经网络就很好理解了。神经元就像一块乐高积木,而神经网络就是搭的积木。 

    如上图,x那一列,我们称为输入层,输出y^那列称为输出层,中间那列称为隐藏层。隐藏层可以有多个,而且每个隐藏层有多少个神经元也都是可以自主调整的。经典的神经网络中,当前层的神经元会后后一层的各个神经元进行连接,这也称为全连接

    1.3.2.1 前向传播

    上图是形象化的神经网络模型结构图,那实际上模型的特征输入到预测输出,在数学上、在内存里是怎么实现的呢?这里我们来介绍下从输入层到第一个隐藏层的向前传播的过程。 
    首先,输入的特征向量(数组): 

    它会与权重矩阵(二维数组)相乘

    加上偏置向量(数组):

    最后送入激活函数,如tanh函数:

    1.3.2.2 反向传播

    神经网络这么多参数该如何优化呢?其实和上文说的一样,我们还是使用梯度下降的方法。最后一层的权重调整我们可以与梯度下降的方法求出。最后第二层我们可以基于最后一层的权重调整,利用链式求导的方式求出。就这样从后往前的调整,这就是所谓的反向传播。

    2. 词汇特征表示


    完成我们的背景知识回顾学习之后,就进入我们正式要讲解的内容了。

    2.1 语言模型


    这里我们先介绍一个概念——语言模型。简单来讲,语言模型就是一个想让机器学会说话的模型。它会基于给定的上文,预测出最有可能的下文。比如说,“I want a glass of orange __ ”,输入前文,模型将预测出空格可能的单词为“juice”。

    2.2 词嵌入


    现在我们有一个词典,如:【a,apple,…,zoo,】,其中代表未知单词。假设我们的词典里里面一个有10000个单词,那如何用生成某个词汇特征表示呢?一个很容易想到的方法就是one-hot:用一个10000维的向量来表示一个词语。 

    但是这种方法有两个致命缺点: 
    - 第一,向量实在是太长了,而且词汇量增加,向量维度也要跟着增加。 
    - 第二,该向量部分表示出词汇之间的关系。如我们给出“I want a glass of orange juice”作为训练数据,模型是学不到“I want a glass of apple _”该填什么的。因为orange的特征表示和apple的特征表示之间没有任何的关系。

    为了解决上述缺点,我们可以手工的做词嵌入: 
    Topic| Man | Woman|King|Queen|Apple|Orange 
    |:-|:-|:-|:-|:-|:-|:- 
    Gender |-1| 1 |-0.95|0.97|0.00|0.01 
    Royal | 0.01 | 0.02 |0.93|0.95|-0.01|0.00 
    Age | 0.03 | 0.02|0.7|0.69|0.03|-0.02 
    Food | 0.09 | 0.01|0.02|0.01|0.95|0.97 
    …|…|…|…|…|…|… 
    我们选取几个Topic,每行是各个单词关于该Topic的相关系数。这样一来,我们可以看到向量的维度大小得到了控制,而且词与词有明显的关系。我们还能惊喜的发现King的向量减去Man的向量,再加上Woman的向量,就约等于Queen的向量!
     

    3 word2vector

    词嵌入固然好,但手工的为10000个词语关于各个Topic打相关系数 ,这需要耗费巨大的人力,而且要求非常深厚的语言词汇知识。 
    Google大神们提出了目前非常流行的训练词向量的算法——word2vector[1]word2vector[1]。我们先来看看word2vector强大的的效果吧: 

    上表是783M的单词,训练出的300维度的词向量,得到的对应关系。比如,使用vParis−vFrance+vItalyvParis−vFrance+vItaly得到的向量v1v1,在字典里查询与它最相似的是向量vRomevRome(可以用cos相似度进行度量)。

    3.1 基于神经网络语言模型的词向量生成

     

    再讲word2vector之前,我们先来讲讲另外一种模型——基于神经网络语言模型[2]。其实Google大佬在论文【1】中也实验了用该模型生成词向量,word2vector算法也就是在这个基础上进行的变形、优化。模型结构如下: 

    - 第一层:上图中绿色的小方块就是我们每个单词的onehot后的向量,比如说我们想语言模型要预测“I want a glass of apple _”问题,我们固定4个单词的窗口,那么就有4个绿色小方块的特征输入,即分别为“a”,“glass”,“of”,“ apple”对应的one-hot向量。 
    - 第二层:各个one-hot向量(10000维)会乘以10000∗300大小的共享矩阵CC。其实这里的CC就是我们前文的词嵌入矩阵的转置。每列类别代表一个Topic,只是里我们并不知道其具体含义。而每一行就是对应单词的词向量。 
    - 第三层:乘完的向量(300维)会将其连接起来(4∗300=1200维),并代入tanh函数得到值作为该层的输出。 
    - 第四层:第四层有10000个神经元,第三层到第四层使用的是全连接,而且神经元非常多,需要很大的计算资源。 
    - Softmax:我们最后输出的是一个向量V(10000维),Vi表示V中的第i个元素,那么这个元素的Softmax值就是 

    也就是说,是该元素的指数,与所有元素指数和的比值。这样一来,向量S的各个元素就表示预测为对应位置单词的概率。真实值yy这里将是单词,如“juice”,所对应的one-hot向量。

    这么一来,我们就可以使用反向传播与梯度下降优化调整网络中的参数,同时也就调整生成了共享矩阵C,即我们的词向量矩阵。

    3.2 word2vector


    其实理解了基于神经网络语言模型的词向量生成模型,word2vector模型就非常好理解了。word2vector有两种形式——CBOW 和 Skip-gram。

    3.2.1 CBOW模型


    不同于神经网络语言模型去上文的单词作为输入,CBOW模型获得中间词两边的的上下文,然后用周围的词去预测中间的词。 
    与神经网络语言模型还有点不同的是:经过词嵌入后,CBOW模型不是将向量合并,而是将向量按位素数相加。

    3.2.2 Skip-gram模型


    Skip-gram模型正好和CBOW模型相反,输入为中间的词,使用预测两边的的上下文的单词。

    3.2.3 加速Softmax


    从上文我们可以看到,最后的输出层有10000个节点,显然这部分需要消耗非常大的计算资源。这里介绍两种加速的方法: 
    - hierarchical softmax:softmax不再使用one-hot编码,而是利用哈夫曼编码,这可以使得复杂度降低到log2V,其中V为字典长度。 
    - 负采样:负采样是将模型变成只用一个输出节点的2分类任务模型。我们将单词与其一个附近的单词向量连接,如[Vorange,Vjuice],作为特征输入,Label为1。再将该单词与其不它附近的单词向量连接,如[Vorange,Vman],Label为0。我们使用这样构造出数据集进行词向量的训练。

    4 文本向量


    现在我们有了词向量,那对于一个文本,如何用一个向量来表示它呢?

    4.1 fastText模型


    Facebook的大牛们基于word2vector词向量设计了fastText文本分类模型[3][3]。其实它的结构也很简单,就是将各个词向量相加,作为其文本的向量表示: 

    除此之外, fastText还添加了N-gram特征,这里就不再介绍,感兴趣的同学可见【3】

    4.2 文本分布表示


    fastText是目前非常流行的文本分类的模型,但是直接将各个词向量相加存在一个很大的缺点,就是消除了词序的特征。如“mother loves dad”和“dad loves mother”,在这种文本特征生成方案下,它们的文本向量就一模一样了。 
    Google的大牛们基于word2vector模型也设计出了文本向量生成的方案。该方案的核心思想就是:将文档看做一个特殊的单词。该方案有两种形式——分布记忆模型和分布词包模型[4]。

    4.2.1 分布记忆模型


    分布记忆模型将文档id看做一个特殊的单词,设窗口大小为3,那么输入的特征为文档id和该文本的三个单词(按顺序),Label则是下一个单词。不断迭代,直到窗口移动到文末。所有文档训练结束后,文档id所对应的词向量就是该文档的文本向量。该方案保留了词语间的词序信息: 

    4.2.2 分布词包模型

    分布词包模型也将文档id看做一个特殊的单词,不同的是,它套用了Skip-gram的结构。该方案不保留了词语间的词序信息: 

    4.3 深度学习模型

    最近深度学习非常热门,输入词向量特征,基于深度学习模型也可以进行文本的特征学习: 
    - CNN:卷积神经网络模型可以抽取部分单词作为输入特征,类似于n-grams的思想 [5]:

     

    4.4 简单词嵌入模型


    无论是文本分布表示还是上深度学习模型,对于在线实时预测的机器学习系统都有较大的性能挑战。今年最新提出的简单词嵌入模型(SWEM)关注到了这个问题,论文提出了更加简单轻量的文本向量生成方案[7][7]: 
    - SWEM-aver:就是平均池化,对词向量的按元素求均值。这种方法相当于考虑了每个词的信息。 
    - SWEM-max:最大池化,对词向量每一维取最大值。这种方法相当于考虑最显著特征信息,其他无关或者不重要的信息被忽略。 
    - SWEM-concat:考虑到上面两种池化方法信息是互补的,这种变体是对上面两种池化方法得到的结果进行拼接。 
    - SWEM-hier:上面的方法并没有考虑词序和空间信息,提出的层次池化先使用大小为 n 局部窗口进行平均池化,然后再使用全局最大池化。该方法其实类似我们常用的 n-grams 特征。

    论文将SWEM方案生成文本向量,输入到神经网络分类器:隐藏层[100, 300, 500, 1000]与一个softmax输出层。论文将它和其他模型在不同数据集上进行了文本分类预测正确率的对比:

    可见,SWEM-concat 和 SWEM-hier 表现非常的优秀,甚至超过了复杂的深度学习模型。

    参考文献


    【1】Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. Computer Science. 
    【2】Bengio, Yoshua, et al. A neural probabilistic language model.. Innovations in Machine Learning. Springer Berlin Heidelberg, 2006:137-186. 
    【3】Joulin A, Grave E, Bojanowski P, et al. Bag of Tricks for Efficient Text Classification[J]. 2016:427-431. 
    【4】Le Q, Mikolov T. Distributed representations of sentences and documents[C] International Conference on International Conference on Machine Learning. JMLR.org, 2014:II-1188. 
    【5】Kim Y. Convolutional Neural Networks for Sentence Classification[J]. Eprint Arxiv, 2014. 
    【6】Vinyals O, Le Q. A Neural Conversational Model[J]. Computer Science, 2015. 
    【7】Shen D, Wang G, Wang W, et al. Baseline Needs More Love: On Simple Word-Embedding-Based Models and Associated Pooling Mechanisms[J]. 2018.
     

    展开全文
  • 模型设计 基于人脸先天的结构性(如眼睛、鼻子等)以及真实人脸和风格化后虚拟形象的结构性差异(如卡通形象的眼睛往往又大又圆),在网络中加入局部区域相关性计算模块(即希望真人的眼睛和虚拟形象的眼睛的特征有...

    大火的 Avatar到底是什么 ?

    随着元宇宙概念的大火,Avatar 这个词也开始越来越多出现在人们的视野。2009 年,一部由詹姆斯・卡梅隆执导 3D 科幻大片《阿凡达》让很多人认识了 Avatar 这个英语单词。不过,很多人并不知道这个单词并非导演杜撰的,而是来自梵文,是印度教中的一个重要术语。根据剑桥英语词典解释,Avatar 目前主要包含三种含义。

    1.png
    avatar 在剑桥词典的翻译结果 © Cambridge University Press

    最初,Avatar 起源于梵文 avatarana ,由 ava ( off , down )+ tarati ( cross over )构成,字面意思是 “下凡”,指的是神灵降临人间的化身,通常特指主神毗湿奴 ( VISHNU ) 下凡化作人形或者兽形的状态。后于1784年进入英语词语中。

    1985 年切普・莫宁斯塔和约瑟夫・罗梅罗在为卢卡斯影视公司Lucasfilm Games ( LucasArts ) 设计网络角色扮演游戏Habitat时使用了 Avatar 这个词来指代用户网络形象。而后在1992 年,科幻小说家 Neal Stephenson 撰写的《Snow Crash》一书中描述了一个平行于现实世界的元宇宙。所有的现实世界中的人在元宇宙中都有一个网络分身 Avatar,这一次也是该词首次出现在大众媒体。

    2.png

    互联网时代,Avatar 一词开始被程序员们广泛使用在软件系统中,用于代表用户个人或其性格的一个图像,即我们常说的 “头像” 或 “个人秀”。这个头像可以是网络游戏或者虚拟世界里三维立体的图像,也可以是网络论坛或社区里常用的二维平面图像。它是可以代表用户本人的一个标志物。

    3.png

    从QQ秀到Avatar

    如今支持让用户创建属于自己的头像已经成为了各种软件应用的标配,用户使用的头像也随着技术发展从普通 2D形象发展到了3D形象。里程碑事件当属2017 年,苹果在 iPhone X 发布了新功能 ——Animoji,使用面部识别传感器来检测用户面部表情变化,同时用麦克风记录用户的声音,并最终生成可爱的 3D 动画表情符号,用户可以通过 iMessage 与朋友分享表情符号。但是第一代不支持用户自定义形象,仅支持系统内置的动物卡通头像。随后更新的 Animoji 二代开始支持用户自由化捏脸,生成风格化的人脸头像。当前不少场景中可以看到自动化捏脸功能,仅通过拍摄一张或几张照片,自动生成符合用户人脸特点的CG模型,但背后依赖于复杂的CG建模及渲染技术支持。

    Avatar也可以跳过昂贵的CG建模及渲染流程,通过机器学习算法将拍摄人脸进行“风格化”。即自动化将目标训练风格迁移、与拍摄者本来的面目特征做融合,创建符合用户脸部特征的风格化人脸 Avatar。

    4.png

    人脸风格化 Avatar 的四种技术实现路线

    什么是人脸风格化?

    所谓人脸风格化,就是将真实的人脸头像转换为特定的风格头像,例如卡通风格、动漫风格、油画风格,如下图所示:

    5.png

    基本上说,实现人脸风格化可通过纹理贴图、风格迁移、循环对抗网络和隐变量映射等几种技术路线实现。

    纹理贴图

    纹理贴图一般是给定一张样本图片,通过算法自动将该图片的纹理逐像素或逐块贴到目标人脸上,形成一种合理自然、可随动的人脸面具 [1]。

    6.png
    [1] 中样例图片

    风格迁移

    风格迁移是给定一张或一组风格照片,基于学习方法从风格图片中提取出风格编码、从目标人脸图片中提出内容编码,通过两组编码自动化生成对应的风格化图片 [2, 3]。只更改了人脸图片的表面纹理,而无法合理地保留或调整人脸的结构属性、形成有意义的结构性风格改变。
    7.png
    [3] 中样例图片

    循环对抗网络

    采用循环对抗网络的方法,通过利用循环对抗网络及其重建约束来训练得到可实现没有成对训练样本的风格化效果。往往配合使用风格迁移,即分别提取风格编码和内容编码。针对人脸的风格化也会显示建模并根据目标风格属性对人脸结构信息做形变(如基于人脸关键点)。但由于循环对抗网络缺少对中间结果约束(如A->B->A中的B)导致最终生成效果不可控、不稳定(即无法保证A->B的合理性)[4]。
    8.png
    [4] 中样例图片

    隐变量映射

    隐变量映射一般将一个预先训练好的真实人脸生成模型、利用一组风格图片往目标风格微调,从而获得一个对应的人脸风格化生成模型 [5, 6]。采用一个编码网络将输入人脸图片映射成或基于多步的优化得到该图片对应的隐变量,并将该变量作为人脸风格化生成模型的输入,从而得到该人脸图片对应的风格化图片。其中基于优化的隐变量映射方法往往得到比较好的效果,但在实际运行时需要大量计算。映射后的隐变量虽然包含了人脸的全局信息,但容易丢失原输入人脸的细节特征,容易造成生成的效果无法反映出个人辨识特征和细节表情。
    9.png
    10.png
    11.png
    12.png

    [5] 中样例图片(来自https://toonify.photos/)

    [6] 中样例图片
    13.png

    阿里云视频云自研卡通智绘 Avatar

    2020年,由阿里云视频云自研的卡通智绘Avatar横空出世,获得了业界瞩目。在2021年10月的云栖大会上,阿里云视频云的卡通智绘项目亮相阿里云开发者展台,近2000名参会者争相体验,成为了大会爆款。

    14.png

    阿里云卡通智绘采用了隐变量映射的技术方案,对输入人脸图片,发掘其显著特征(如眼睛大小,鼻型等),可以自动化生成具有个人特色的虚拟形象(即风格化后的效果)。

    首先利用自有的海量有版权的高清人脸数据集通过无监督的方式训练一个可以生成高清人脸图片的模型,即真实人脸模拟器,在隐变量的控制下生成大量不同人脸特征的高清人脸图片。利用收集的少量目标风格图片(目标风格图片无需跟真实人脸一一对应)微调该模型、得到风格化模拟器。真实人脸模拟器和风格化模拟器共享隐变量,即一个隐变量可以映射得到一对“伪”人脸图片及其对应的风格化图片。

    16.png
    17.png

    通过采样大量的隐变量,我们可以得到大量涵盖不同人脸属性(性别、年龄、表情、发型、是否戴眼镜等)的数据对,从而用来训练图像翻译网络。基于人脸先天的结构性(如眼睛、鼻子等)以及真实人脸和风格化后虚拟形象的结构性差异(如卡通形象的眼睛往往又大又圆),在网络中加入局部区域相关性计算模块以及人脸重建的约束,从而训练得到的网络生成的虚拟形象既生动可爱、又具有个人特色。

    模型设计

    基于人脸先天的结构性(如眼睛、鼻子等)以及真实人脸和风格化后虚拟形象的结构性差异(如卡通形象的眼睛往往又大又圆),在网络中加入局部区域相关性计算模块(即希望真人的眼睛和虚拟形象的眼睛的特征有一定对应关系)以及人脸重建的约束,从而使生成的虚拟形象既生动可爱、又具有个人特色。
    18.png

    效果展示:
    19.jpg

    Avatar 的未来

    得益于 AI 技术的高速发展,我们现在已经拥有了制作虚拟人技术,但相信这一切只是开端。在可预见的未来,Avatar 将作为元宇宙数字居民的数字化身,越来越频繁的出现在虚拟世界中。而 Avatar 也将成为虚拟世界中的极其重要的一项数字资产。

    最后引用扎克伯格对数字人的一段描述,“虚拟世界的特征是存在感,即你可以真切感受到另一个人或在另外一个地方。创造、虚拟人和数字对象将成为我们表达自我的核心,这将带来全新的体验和经济机会。”

    “The defining quality of the metaverse is presence, which is this feeling that you’re really there with another person or in another place,” Mr. Zuckerberg told analysts in July. “Creation, avatars, and digital objects are going to be central to how we express ourselves, and this is going to lead to entirely new experiences and economic opportunities.”

    参考文献:
    [1] Aneta Texler, Ondřej Texler, Michal Kučera, Menglei Chai, and Daniel Sýkora. FaceBlit: Instant Real-time Example-based Style Transfer to Facial Videos, In Proceedings of the ACM in Computer Graphics and Interactive Techniques, 4(1), 2021.
    [2] Leon A. Gatys, Alexander S. Ecker, and Matthias Bethge. A Neural Algorithm of Artistic Style. Journal of Vision September 2016, Vol.16, 326.
    [3] Vincent Dumoulin, Jonathon Shlens, and Manjunath Kudlur. A Learned Representation for Artistic Style. In International Conference on Learning Representations 2017.
    [4] Kaidi Cao, Jing Liao, and Lu Yuan. CariGANs: Unpaired Photo-to-Caricature Translation. In ACM Transactions on Graphics (Siggraph Asia 2018).
    [5] Justin N. M. Pinkney and Doron Adler. Resolution Dependent GAN Interpolation
    for Controllable Image Synthesis Between Domains. In NeurIPS 2020 Workshop.
    [6] Guoxian Song, Linjie Luo, Jing Liu, Wan-Chun Ma, Chunpong Lai, Chuanxia Zheng, and Tat-Jen Cham. AgileGAN: Stylizing Portraits by Inversion-Consistent Transfer Learning. In ACM Transactions on Graphics (Siggraph 2021).

    「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。

    展开全文
  • 一是“新疆”一词辐射出的语义网络除旅游景区外,更多地表现了游客对新疆“雪山”、“草原”、“景色”等旅游形象的整体情感感知:如“独特”、“宁静”等,这与新疆对外旅游宣传所采用的词语相一致; 二是“乌鲁木齐...
  • 因此,点互信息这个名字还是很形象的。 sklearn编程 from sklearn import metrics as mr mr . mutual_info_score ( label , x ) label、x为list或array。 计算x和label的互信息。 参考: ...
  • 本文中是指具有语言、文字能力等思维特征的人类的生物神经中枢。 左右脑:人类的左脑倾向于逻辑思维,右脑则倾向于艺术思维。大脑两半球具有一种合作关系,即左脑负责语言和逻辑思维,而右脑则做一些难以换成词语的...
  • 品析词语表达效果.pdf

    2022-01-26 17:41:30
    品析词语表达效果.pdf
  • 用python实现词语接龙游戏的代码及词库文件,python环境下解压执行即可。
  • 图1:快手“萌面Kmoji”魔法表情(Kmoji衍生自emoji,emoji来自日语词汇“絵文字”,意为表情符号)近日,快手正式上线了“萌面Kmoji”魔法表情,用户通过相机拍摄能够生成自己的专属脸部AR虚拟形象。同时,该功能可以...
  • 因为如果你没有一定的词汇量的话,那么你人生中所要经历的所有英语考试可能都是这种情况。原文是这样的:我们知道賢鏛是在生活中很重要的。比如在鼙蠻和贎鬍里,有彃燊在罅鷄那里蘩墝,之前他们鏈鴊恆闳嘑傡彚槩滼鞷...
  • 派生形式具有构词力强、词义宽广、结合灵活等特点,为隐喻性计算机英语词汇提供了取之不尽、用之不竭的源泉。例如,lap-top是lap(膝)和top(顶部)的叠加,人们根据其形象的比喻将便携式电脑称之为laptop。同样地,...
  • 一、计算机英语词汇特点1.普通词汇的专业化。在计算机英语文献中,普通词汇获得了固定的专业意义。如character的普通意义为“特征,符号”,在计算机专业英语中其意义为“字符”。2.大量借用相邻学科中的词汇。...
  • 生物工程方面的英语一些小常识,注意的一些小词汇
  • • 垃圾邮件识别:现在有一封电子邮件,把出现在里面的所有词汇提取出来,送进一个机器里,机器需要判断这封邮件是否是垃圾邮件。 • 疾病判断:病人到医院去做了一大堆肝功、尿检测验,把测验结果送进一个机器里...
  • 特征工程到底是什么?

    千次阅读 2021-12-22 14:13:12
    特征工程是一个过程,它首先在概念上,然后在程序上将一个原始样本转化为特征向量。它包括将一个特征概念化,然后编写程序代码,可能借助一些间接数据,将整个原始样本转化为一个特征。 4.1 为什么要进行特征工程 ...
  • 六级词汇1

    2008-06-01 12:38:57
    CET6大学英语六级词汇形象记忆法
  • 语言创新能力的空前释放使当代汉语词语模大量生成.docx
  • 关于英语词汇的记忆

    2019-08-28 19:53:17
    前几天学了一些关于英语词汇的背诵方法,英语的词根词缀记忆法已经不是什么新鲜事了,任何一个背诵过单词的学生都知道。市面上卖得比较火的有各种版本的新东方的词根词缀记忆法单词书,我看了几眼,个人认为是七八成...
  • 2022年高考语文一轮复习精品资料 专题04 正确使用词语(包括熟语) .docx
  • 神经网络形象的说明

    2016-02-25 00:11:32
    1.分类神经网络最重要的用途是分类,为了让大家对分类有个直观的认识,咱们先看几个例子:垃圾邮件识别:现在有一封电子邮件,把出现在里面的所有词汇提取出来,送进一个机器里,机器需要判断这封邮件是否是垃圾邮件...
  • 送给急需要短时间内增加词汇的朋友,多多努力,加油!!
  • 一、计算机英语词汇特点1.普通词汇的专业化。在计算机英语文献中,普通词汇获得了固定的专业意义。如character的普通意义为“特征,符号”,在计算机专业英语中其意义为“字符”。2.大量借用相邻学科中的词汇。...
  • 简单形象 有趣 神经网络一点都不难 神经网络很萌的 神经网络分类 神经网络最重要的用途是分类,为了让大家对分类有个直观的认识,咱们先看几个例子: 垃圾邮件识别:现在有一封电子邮件,把...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 8,623
精华内容 3,449
关键字:

形象特点的词语