精华内容
下载资源
问答
  • Ubuntu下几种常用文本编辑器

    万次阅读 2018-04-04 23:00:19
    常见的基于控制台的文本编辑器以下几种:emacs 综合性的GNU emacs 编辑环境nano 一个类似于经典的pico的文本编辑器,内置了一个pine邮件程序vim 一个改进的vi文本编辑器注意并不是所有的文本编辑器都是基于...

    常见的基于控制台的文本编辑器有以下几种:

    emacs           综合性的GNU emacs 编辑环境

    nano              一个类似于经典的pico的文本编辑器,内置了一个pine邮件程序

    vim               一个改进的vi文本编辑器

    注意并不是所有的文本编辑器都是基于控制台的,也就是说支持终端使用的。有一些文本编辑器被设计用来提供带有菜单栏,按钮,进度条等的图形界面。例如:

    gedit               一个GUI的文本编辑器,Ubuntu默认安装

    kate               一个简单的KDE文本编辑器

    kedit              另外一个简单的KDE文本编辑器


    nano文本编辑器的用法

    nano编辑器最为简单和易用,而且基本上被所有的Linux所安装。因此我们首先来讲解下它。开启一个nano编辑器可使用如下命令:

    nano file.txt

    nano编辑器非常简单,你可以轻松使用它而不需要任何额外知道。这里有一些基本的命令。(^是控制键Control

    光标移动                     方向键(上///右),PageUp/Page Down,或者^y^v

    添加字符                      在光标处输入

    删除字符                      Delete键或者Backspace

    退出                           ^x(将会提示是否保存更改)

    帮助                           ^g

    nano编辑器界面如下:



    vi文本编辑器的用法

    基本上每一个Linux/Unix系统都装有vi编辑器。开启一个vi编辑器可使用如下命令:

    vi file.txt

    vi编辑器的工作有插入(编辑)模式和浏览(命令)模式。当你最开始编辑时,你处于浏览模式,你可以使用箭头或者其他导航键在文本中导航。开始编辑时,键入i,插入文本,或者键入a,在末尾添加文本。当你编辑结束时,键入Esc退出插入/添加模式,进入浏览(命令)模式。键入命令时,首先键入冒号(:),后面紧跟命令,例如w命令去编辑文本,然后键入Enter

    尽管vi编辑器支持非常复杂的操作并且有无数条命令,然而你可以仅用一些简单的命令就能完成工作,这些基本的vi命令主要有:

    光标运动                        h,j , k, l (上///右)

    删除字符                        x

    删除行                          dd

    模式退出                        Esc,Insert(或者i

    退出编辑器                      q

    强制退出不保存                q!

    运行shell命令                 :sh(使用exit返回vi编辑器)

    保存文件                        :w

    文本查找                         /

    使用vim tutor命令可以快速学习vi键盘命令的用法。这个教程不到30分钟,教给用户如何开启和关闭编辑器,导航文件,插入删除文本,查找,替换和插入操作。

    VI(VIM)详细使用命令:http://jingyan.baidu.com/article/9f63fb91c58387c8400f0eef.html

    emacs文本编辑器的用法

    Richard M. StallmanGNU emacs文本编辑器,和vi一样,被Ubuntu和几乎所有的Linux系统默认安装。和其他Unix/Linux文本编辑器不同的是,emacs并不仅仅是一个简单的文本编辑器。它是一个编辑环境,可以被用来编译运行程序,可以作为电子日记,约会簿和日历,可以用来编辑和发送邮件,阅读Usernet新闻,甚至玩游戏。emacs之所以具有这么强大的功能是因为它包含了一个内置的language interpreter,使用Elispemacs LISP)编程语言。emacs没有在Ubuntu中默认安装,可使用下列命令安装emacs

    sudo apt-get install emacs

    开启一个emacs编辑器可使用如下命令:

    emacs file.txt

    当你在X11中使用上述命令打开emacs时,这个编辑器并不出现在终端窗口中,而是以浮动窗口的形式出现。强制使emacs窗口显示在终端中而不是它自己的窗口,可以使用-nw参数,如以下命令:emacs -nw file.txt

    emacs文本编辑器拥有大量的快捷键和命令,但是用户可以掌握这些命令的一个子集即可满足日常工作的需要。这些基本命令通常都需要按住Ctrl键,或者是先键入meta键(通常映射为Alt键)。下面是一些常用的命令。

    动作                                  命令

    终止                           Ctrl+g

    光标左移                     Ctrl+b

    光标下移                     Ctrl+n

    光标右移                     Ctrl+f

    光标上移                     Ctrl+p

    删除字符                     Ctrl+d

    删除行                        Ctrl+k

    光标移到行首               Ctrl+a

    光标移到行尾               Ctrl+e

    帮助                          Ctrl+h

    退出                          Ctrl+x,Ctrl+c

    另存为                       Ctrl+x,Ctrl+w

    保存文件                    Ctrl+x,Ctrl+s

    后向检索                    Ctrl+r

    前向检索                    Ctrl+s

    入门训练                    Ctrl+h,t

    撤销编辑                    Ctrl+x,u

    学习使用emacs编辑器的一个优点是你可以在bashshell命令行中使用类似的快捷键,尽管你也可以将bash shell 命令行的快捷键和vi快捷键绑定。另外一个原因是emacs编辑器几乎被安装在所有的Unix/Linux系统中,以及苹果的MacOS X系统中。

    展开全文
  • 本篇关于TF-IDF/CHI/IG, 文本建模系列会不断更新。。。。

    本篇关于TF-IDF/CHI/IG。


    参考:

    http://blog.sina.com.cn/s/blog_6622f5c30101datu.html

    http://lovejuan1314.iteye.com/blog/651460



    1)TF-IDF在特征选择时的误区。

    TF-IDF用于向量空间模型,进行文档相似度计算是相当有效的。但在文本分类中单纯使用TF-IDF来判断一个特征是否有区分度是不够的

    ===》它仅仅综合考虑了该词在文档中的重要程度和文档区分度。

    ===》没有考虑特征词在类间的分布特征选择所选择的特征应该在某类出现多,而其它类出现少,即考察各类的文档频率的差异。如果一个特征词,在各个类间分布比较均匀,这样的词对分类基本没有贡献;但是如果一个特征词比较集中的分布在某个类中,而在其它类中几乎不出现,这样的词却能够很好代表这个类的特征,而TF-IDF不能区分这两种情况。

    ===》没有考虑特征词在类内部文档中的分布情况。在类内部的文档中,如果特征词均匀分布在其中,则这个特征词能够很好的代表这个类的特征,如果只在几篇文档中出现,而在此类的其它文档中不出现,显然这样的特征词不能够代表这个类的特征。



    2)特征选择方法综述。

    文本中能观察到的量其实只有两个:词频和文档频率,所有的方法一律以这两个量为计算基础。

    针对英文纯文本的实验结果表明:作为特征选择方法时,卡方检验和信息增益的效果最佳(相同的分类算法,使用不同的特征选择算法来得到比较结果);文档频率方法(直接依据文档频率大小排序的方法)的性能同前两者大体相当,术语强度方法性能一般;互信息方法的性能最差。



    3)信息增益。

    在文本分类中,特征词t的取值只有t(代表t出现)和clip_image006(代表t不出现)。那么

    最后,信息增益

    但信息增益最大的问题还在于它只能考察特征对整个系统的贡献,而不能具体到某个类别上,这就使得它只适合用来做所谓“全局”的特征选择(指所有的类都使用相同的特征集合),而无法做“本地”的特征选择(每个类别有自己的特征集合,因为有的词,对这个类别很有区分度,对另一个类别则无足轻重)。

    实现方法:

     统计正负分类的文档数:N1、N2。

     统计每个词的正文档出现频率(A)、负文档出现频率(B)、正文档不出现频率(C)、负文档不出现频率(D)。

     计算信息熵

     计算每个词的信息增益


     将每个词按信息增益值从大到小排序,选取前k个词作为特征,k即特征维数。



    4)卡方检测,CHI-Square test。

    卡方检验最基本的思想就是通过观察实际值与理论值的偏差来确定理论的正确与否具体做的时候常常先假设两个变量确实是独立的(“原假设”),然后观察实际值(观察值)与理论值(这个理论值是指“如果两者确实独立”的情况下应该有的值)的偏差程度,如果偏差足够小,我们就认为误差是很自然的样本误差,是测量手段不够精确导致或者偶然发生的,两者确确实实是独立的,此时就接受原假设;如果偏差大到一定程度,使得这样的误差不太可能是偶然产生或者测量不精确所致,我们就认为两者实际上是相关的,即否定原假设,而接受备择假设。

    理论值为E,实际值为x,偏差程度的计算公式为:

    这个式子就是开方检验使用的差值衡量公式。当提供了数个样本的观察值x1x2,……xi,……xn之后,代入到式中就可以求得卡方值,用这个值与事先设定的阈值比较,如果大于阈值(即偏差很大),就认为原假设不成立,反之则认为原假设成立。

    在文本分类的特征选择阶段,一般使用“词t与类别c不相关”来做原假设计算出的开方值越大,说明对原假设的偏离越大,我们越倾向于认为原假设的反面情况是正确的选择的过程为每个词计算它与类别c的开方值,从大到小排个序(此时开方值越大越相关),取前k个就可以。

    卡方检验的缺点是:它只统计文档是否出现词,而不管出现了几次。这会使得他对低频词有所偏袒(因为它夸大了低频词的作用)。甚至会出现有些情况,一个词在一类文章的每篇文档中都只出现了一次,其开方值却大过了在该类文章99%的文档中出现了10次的词,其实后面的词才是更具代表性的,但只因为它出现的文档数比前面的词少了“1”,特征选择的时候就可能筛掉后面的词而保留了前者。这就是开方检验著名的“低频词缺陷”。因此开方检验也经常同其他因素如词频综合考虑来扬长避短。

    实现方法:

     统计样本集中文档总数(N)。

     统计每个词的正文档出现频率(A)、负文档出现频率(B)、正文档不出现频率(C)、负文档不出现频率(D)。

    3 计算每个词的卡方值,公式如下:

     将每个词按卡方值从大到小排序,选取前k个词作为特征,k即特征维数。







    文本建模系列会不断更新。。。。

    展开全文
  • 语音识别是完成语音到文字的转换。...机器翻译系统的输入通常是印刷文本,计算 机能清楚地区分单词和单词串。而语音识别系统的输入是语音,其复杂度要大得多,特别是口语 很多的不确定性。人与人交流时,往...
     语音识别是完成语音到文字的转换。自然语言理解是完成文字到语义的转换。语音合成是用语音方式输出用户想要的信息,用语音实现人与计算机之间的交互,主要包括语音识别、自然语言理解和语音合成。
           相对于机器翻译,语音识别是更加困难的问题。机器翻译系统的输入通常是印刷文本,计算 机能清楚地区分单词和单词串。而语音识别系统的输入是语音,其复杂度要大得多,特别是口语 有很多的不确定性。人与人交流时,往往是根据上下文提供的信息猜测对方所说的是哪一个单 词,还可以根据对方使用的音调、面部表情和手势等来得到很多信息。特别是说话者会经常更正所说过的话,而且会使用不同的词来重复某些信息。显然,要使计算机像人一样识别语音是很困难的。
            语音识别过程包括从一段连续声波中采样,将每个采样值量化,得到声波的压缩数字化表 示。采样值位于重叠的帧中,对于每一帧,抽取出一个描述频谱内容的特征向量。然后,根据语音信号的特征识别语音所代表的单词,语音识别过程主要分为五步,如下:
            1.语音信号采集
              语音信号采集是语音信号处理的前提。语音通常通过话筒输入计算机。话筒将声波转换为 电压信号,然后通过A/D装置(如声卡)进行采样,从而将连续的电压信号转换为计算机能够处理的数字信号。
             目前多媒体计算机已经非常普及,声卡、音箱、话筒等已是个人计算机的基本设备。其中声 卡是计算机对语音信进行加工的重要部件,它具有对信号滤波、放大、A/D和D/A转换等功 能。而且,现代操作系统都附带录音软件,通过它可以驱动声卡采集语音信号并保存为语音文件。
              对于现场环境不好,或者空间受到限制,特别是对于许多专用设备,目前广泛采用基于单片机、DSP芯片的语音信号采集与处理系统。
            2.语音信号预处理
            语音信号号在采集后首先要进行滤波、A/D变换,预加重(Preemphasis)和端点检测等预处理, 然后才能进入识别、合成、增强等实际应用。
           滤波的目的有两个:一是抑制输入信号中频率超出//2的所有分量(/:为采样频率),以防止 混叠干扰;二是抑制50 Hz的电源工频干扰。因此,滤波器应该是一个带通滤波器。
           A/D变换是将语音模拟信号转换为数字信号。A/D变换中要对信号进行量化,量化后的信 号值与原信号值之间的差值为量化误差,又称为量化噪声。
           预加重处理的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带 中,能用同样的信噪比求频谱,便于频谱分析。
           端点检测是从包含语音的一段信号中确定出语音的起点和终点。有效的端点检测不仅能减 少处理时间,而且能排除无声段的噪声干扰。目前主要有两类方法:时域特征方法和频域特征方 法。时域特征方法是利用语音音量和过零率进行端点检测,计算量小,但对气音会造成误判,不 同的音量计算也会造成检测结果不同。频域特征方法是用声音的频谱的变异和熵的检测进行语 音检测,计算量较大。
            3.语音信号的特征参数提取
            人说话的频率在10 kHz以下。根据香农采样定理,为了使语音信号的采样数据中包含所需单词的信息,计算机的采样频率应是需要记录的语音信号中包含的最高语音频率的两倍以上。 一般将信号分割成若干块,信号的每个块称为帧,为了保证可能落在帧边缘的重要信息不会丢 失,应该使帧有重叠。例如,当使用20 kH*的采样麵率时,标准的一帧为10 ms,包含200个采样值。
            话筒等语音输入设备可以采集到声波波形,如囫10.4所示。虽然这些声音的波形包含了所 需单词的信息,但用肉眼观察这些波形却得不到多少信息因此,需要从采样数据中抽取那些能 够帮助辨别单词的特征信息。在语音识别中,常用线性预测编码 技术抽取语音特征。
            线性预测编码的基本思想是:语音信号采样点之间存在相关性,可用过去的若干采样点的线 性组合预测当前和将来的采样点值。线性預测系数埽以通过使预测信号和实际信号之间的均方误差最小来唯一确定。
            语音线性预测系数作为语音信号的一种特征参数,已经广泛应用于语音处理各个领域。
            4.向置量化
              向量量化(Vector Quantization,VQ)技术是20世纪W年代后期发展起来的一种数据压缩和 编码技术。经过向量量化的特征向量也可以作为后面隐马尔可夫模型中的输入观察符号。
              在标量量化中整个动态范围被分成若干个小区间,每个小区间有一个代表值,对于一个输入 的标量信号,量化时落入小区间的值就用这个代表值>[戈替。因为这时的信号量是一维的标量,所 以称为标量量化。
              向量量化的概念是用线性空间的观点[,把标量改为一维的向量,对向量进行量化。和标量量化一样,向量量化是把向量空间分成若干个小区域,每个小区域寻找一个代表向量,量化时落入 小区域的向量就用这个代表向量代替。
              向量量化的基本原理是将若干个标量数据组成一个向量(或者是从一帧语音数据中提取的 特征向量)在多维空间给予整体量化,从而可以在信息量损失较小的情况下压缩数据量。
              语音识别
             当提取声音特征集合以后,就可以识别这些特征所代表的单词。本节重点关注单个单词的 识别。识别系统的输入是从语音信号中提取出的特征参数,如LPC预测编码参数,当然,单词对 应于字母序列。语音识别所采用的方法一般有模板匹配法、随机模型法和概率语法分析法三种。 这三种方法都是建立在最大似然决策贝叶斯(Bayes)判决的基础上的。
            (1)模板(template)匹配法
                  在训练阶段,用户将词汇表中的每一个词依次说一遍,并且将其特征向量作为模板存入模板 库。在识别阶段,将输入语音的特征向量序列,依次与模板库中的每个模板进行相似度比较,将 相似度最高者作为识别结果输出。
             (2)随机模型法
                 随机模型法是目前语音识别研究的主流。其突出的代表是隐马尔可夫模型。语音信号在足 够短的时间段上的信号特征近似于稳定,而总的过程可看成是依次相对稳定的某一特性过渡到 另一特性。隐马尔可夫模型则用概率统计的方法来描述这样一种时变的过程。
             (3)概率语法分析法
                 这种方法是用于大长度范围的连续语音识别。语音学家通过研究不同的语音语谱图及其变 化发现,虽然不同的人说同一些语音时,相应的语谱及其变化有种种差异,但是总有一些共同的 特点足以使他们区别于其他语音,也即语音学家提出的“区别性特征”。另一方面,人类的语言 要受词法、语法、语义等约束,人在识别语音的过程中充分应用了这些约束以及对话环境的有关 信息。于是,将语音识别专家提出的“区别性特征”与来自构词、句法、语义等语用约束相互结 合,就可以构成一个“自底向上”或“自顶向下”的交互作用的知识系统,不同层次的知识可以用 若干规则来描述。
             除了上面的三种语音识别方法外,还有许多其他的语音识别方法。例如,基于人工神经网络 的语音识别方法,是目前的一个研究热点。目前用于语音识别研究的神经网络有BP神经网络、 Kohcmen特征映射神经网络等,特别是深度学习用于语音识别取得了长足的进步。

             通过语音实现人与计算机实现沟通交流,主要包括语音合成、自然语言处理,语音识别是模式识别一个应用领域,为大家脑补几篇,科谱好文,如下:

    1. 什么是自然语言处理,主要存在哪些难点?
    2. 自然语言理解过程主要有哪些层次,各层次的功能是怎么样?
    3. 模式识别具体是怎么定义的,主要研究方向是什么?

         聚焦多智时代,引领智能变革,多智时代为人工智能科谱呐喊!

    展开全文
  • DOM 操作中几种获取文本内容的方法

    万次阅读 2017-12-26 00:18:30
    转载自:... 另外补充一些 1. innerHTML ...innerHTML可以作为获取文本方法也可以作为修改文本内容的方法  element.innerHTML 会直接返回element节点下所有的HTML化的文本内容  文本  

    转载自:http://blog.csdn.net/alexdq/article/details/64914476  另外补充一些


    1. innerHTML


    innerHTML可以作为获取文本的方法也可以作为修改文本内容的方法 

    element.innerHTML 会直接返回element节点下 所有的 HTML化的文本内容

    <body>
            <div>文本</div>
            <div>文本</div>
            
    </body>
    document.body.innerHTML    //返回"<div>文本</div><div>文本</div>";

    同样逆向的:

    document.body.innerHTM="<div>文本</div><div></div>"会生成

    <body>

        <div>文本</div>
        <div>文本</div>

    </body>

    !注意 innerHTML方法只能作用于元素节点调用;文本节点并不能使用这个方法返回undefined!


    2. nodeValue

    nodeValue是一个HTML DOM的对象属性;

    同样的 可以通过 nodeValue设置节点的文本内容也可以直接返回文本内容

    直接用节点对象调用就都可以: 如上例   

    document.getElementsByTagName(div)[0].childNodes[0].nodeValue //返回“文本”


    另外 nodeValue 属性并不只存在于文本节点下  元素节点和属性节点对象也都具有nodeValue属性

    属性节点的 nodeValue属性返回属性值
    元素节点的 nodeValue属性返回null

    3.textContent

    textContent与innerHTML方法类似会返回对象节点下所有的文本内容

    但是区别为 textContent返回的内容只有去HTML化的文本节点的内容 如上例:

    document.body.textContent //返回"文本文本"  !注意 在DOM中标签换行产生的空白字符会计入DOM中作为文本节点

    另外IE8以前 不支持 textContent属性


    4.innerText


    innerText方法与textContent方法类似 并且和innerHTML一样也是作用于元素节点上

    但是浏览器对于这两种方法解析空白字符的机制不一样;不是很常用


    类似的还有outText outHTML等类似操作文本相关的方法,不是很常用;

    最后要提醒一点:文本与文本节点一定要区分,有些方法是依靠元素节点返回子文本内容,有些方法是文本节点返回自身文本内容,文本节点是对象而文本只是字符串。
    展开全文
  • 总结 | 常用文本特征选择

    千次阅读 2017-12-29 00:00:00
    凡是特征选择,总是在将特征的重要程度量化后再进行选择,而如何量化特征的重要性,就成了各种方法间最大的不同。接下来就介绍如何有效地进行文本的特征属性选择文本分类作为一有效的信息检索和信息过滤的关键...
  • 种常用文本聚类算法介绍

    千次阅读 2020-05-17 23:21:34
    分类和聚类都是文本挖掘中常使用的方法,他们的目的都是将相似度高的对象归类,不同点在于分类是采用监督学习,分类算法按照已经定义好的类别来识别一篇文本,而聚类是将若干文本进行相似度比较,最后将相似度高的归...
  •  富文本编辑器(Rich Text Editor,RTE)是一可内嵌于浏览器,所见即所得的文本编辑器。它提供类似于Office Word 的编辑功能,方便那些不太懂HTML用户使用,富文本编辑器的应用非常广泛,它的历史与图文网页诞生...
  • jQuery中AJAX请求常见常用几种方法

    万次阅读 2020-06-16 14:17:04
    响应的回调函数 dataType 响应的数据类型 常用的数据类型: text 表示纯文本 xml 表示 xml 数据 json 表示 json 对象 2. $.get 方法和$.post 方法 url 请求的url地址 data 发送的数据 callback 成功的回调函数 ...
  • jquery中有哪几种类型的选择

    千次阅读 2018-07-23 10:25:10
    基本选择器是jQuery中最常用也是最简单的选择器,它通过元素的id、class和标签名等来查找DOM元素。 1、ID选择器 #id 描述:根据给定的id匹配一个元素, 返回单个元素(注:在网页中,id名称不能重复) 示例:$("...
  • LaTex插入图片的几种常用的详细方法

    万次阅读 2019-03-17 09:37:03
    供自己以后查阅,也与更多需要的人分享。 from: http://hepg.sdu.edu.cn/Service/tips/latex/latexfig.html#top &amp; http://liqunsun.spaces.live.com/Blog/cns!285A08B51269F219!109.entry ...
  • 几种常用的加解密的方法

    千次阅读 2016-08-25 10:42:47
    和安一起解决视频加密的需求,了解了一些相关的视频加解密的方法,故把相关的知识贴在这里 1. 全部加密(Naive Algorithm) ...也就是使用标准 加密...将视频比特流同传统的文本数据同样对待,没有利用视频压缩后
  • LaTeX文档插入图片的几种常用方法

    万次阅读 2016-06-10 20:41:03
    这个width是我最常用的选项, 也可以改成其他的。   3、如果你想插入浮动图形, 使用   /begin{figure}[htbp]   /centering/includegraphics[width=3.5in]{fig}   /caption{something}/label{fig:1} ...
  • XML文档定义分为DTD和Schema两形式,二者都是对XML语法的约束,其本质区别在于Schema本身也是一个XML文件,可以被XML解析器解析,而且可以为XML承载的数据定义类型,约束能力较之DTD更强大。 对XML的解析主要...
  • LaTeX中一般只直接支持插入eps...在LaTeX文档中插入图片都是通过使用一些latex图形处理宏命令来实现的, 很多宏命令都支持在在LaTeX文档中插入eps格式的图形文件, 主要: 1. 用includegraphics宏命令(graphicx包
  • LaTex学习笔记(1)——LaTeX文档插入图片的几种常用方法
  • shell的几种常用工具

    万次阅读 2018-08-02 10:36:58
    最近在学习shell脚本语言,在学习的过程中了解了关于shell的几种常用工具,就总结了一下。 1、sort 功能:顾名思义,sort是对文本进行排序操作的。 原则:sort将文件的每一行作为一个单位,相互比较,比较原则是...
  • C#中常用几种读取XML文件的方法

    万次阅读 多人点赞 2011-08-27 00:02:06
    XML文件是一种常用的文件格式,例如WinForm里面的app.config以及Web程序中的web.config文件,还有许多重要的场所都它的身影。Xml是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具...
  • java web前端上传文件到后台常用几种方式

    万次阅读 多人点赞 2018-06-30 21:42:07
    一、引言  小编目前工作内容属于和第三方做接口对接,突然调换到开发产品组,需要做一个拍照上传身份证照片到后台识别的功能。...二、常用几种方式  1、使用form表单提交     这种方式是...
  • oracle数据加载的几种常用方法

    千次阅读 2007-05-30 09:18:00
    把excel另存为book.txt,在选择格式的时候要选择带制表符的txt文本 编辑控制文件book.ctl格式如下: load data infile 'book.txt' into table test fields terminated by X'09' (id,name) X'09'是table键的意思  
  • 常用几种卷积神经网络介绍

    万次阅读 多人点赞 2018-01-11 15:32:37
    常用几种卷积神经网络介绍标签(空格分隔): 深度学习这是一篇基础理论的博客,基本手法是抄、删、改、查,毕竟介绍这几个基础网络的博文也挺多的,就算是自己的一个笔记吧,以后忘了多看看。主要是想介绍下常用...
  • 目前,用于文本关键词提取的主要方法有:基于TF-IDF的关键词抽取、基于TextRank的关键词抽取、基于Word2Vec词聚类的关键词抽取,以及多种算法相融合的关键词抽取。笔者在使用前三算法进行关键词抽取的学习过程...
  • 几种常用回归算法的比较

    万次阅读 多人点赞 2018-08-17 10:10:47
    原理:是一种常用的监督学习方法,给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。 判定方法: (1)在分类任务中的可使用“投票法”,即...
  • Linux常用文本编辑工具及常用指令

    千次阅读 2017-04-22 20:45:58
    以下工具的使用都是建立在会简单使用正则表达式的基础上,不了解的群攻自己做功课。sedsed是一流式编辑器,是一种文本编辑工具,以行为单位进行文本操作。sed默认按照basic规则...常用的操作方法有: p,将匹配到的
  • 互联网是个神奇的大网,大数据开发也是一模式,你如果真想了解大数据,可以来这里,这个手机的开始数字是一八七中间的是三儿零最后的是一四二五零,按照顺序组合起来就可以找到,我想说的是,除非你想做或者了解这...
  • 【机器学习】特征选择常用方法 整理

    万次阅读 多人点赞 2018-06-14 19:36:12
    特征选择 在实际工程中,对于特征变量的选取,往往是基于业务经验,也就是所谓你的先验知识。 现在数据的特征维度很多,而能作为训练集的样本量却往往远小于特征数量(如...变量排序就是一典型的过滤式方法,...
  • 常用几种大数据架构剖析

    万次阅读 多人点赞 2018-08-31 17:11:32
    随着大数据技术的发展,数据挖掘、数据探索等专有名词曝光度越来越高,但是在类似于Hadoop系列的大数据分析系统大行其道之前,数据分析工作已经经历了长足的发展,尤其是以BI系统为主的数据分析,已经了非常成熟和...
  • UITextField 常用属性UITextField 是UIControl的子类,UIControl又是UIView的子类,所以也是一个视图,只不过比UIView多了两个功能,1.文字显示,2.文本编辑 使用过程分四步: 1.创建对象 2.配置属性 3添加到父视图 4...
  • 几种常用接口调用方式

    万次阅读 多人点赞 2016-07-21 14:23:58
    个人总结下几种常用的接口调用方式,具体看对方提供的是什么样的webService接口,如错误,欢迎指正; 1、以前玩微信公众帐号开发的时候,调用过百度翻译的接口,就是这种形式的接口: /** * 翻译(中->英...
  • 几种常用的IO流

    千次阅读 2016-12-05 17:43:21
    流是一抽象概念,它代表了数据的无结构化传递。按照流的方式进行输入输出,数据被当成无结构的字节序或字符序列。从流中取得数据的操作称为提取操作,而向流中添加数据的操作称为插入操作。用来进行输入输出操作的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 329,314
精华内容 131,725
关键字:

常用选择文本的方法有哪几种