精华内容
下载资源
问答
  • VBSCRIPT中文手册

    热门讨论 2010-11-12 10:13:06
    Sgn 函数 返回表示的符号的整数。 Sin 函数 返回角度的正弦值。 Source 属性 返回最早出错的对象或应用程序的名称。 Space 函数 返回由指定数量的空格组成的字符串。 Split 函数 返回下限为 0 的、由指定数量...
  • 1.重复的表标记* 表示前面的字符要出现0次,1次,乃至多次,上面没有封顶, 下面保底是0次,可以不出现。+ 表示前面的字符要出现1次,多次,上面没有封顶,但至少要有1次。? 表示前面的字符要出现0次,1次,上面封顶...

    1.重复的表标记

    * 表示前面的字符要出现0次,1次,乃至多次,上面没有封顶, 下面保底是0次,可以不出现。

    + 表示前面的字符要出现1次,多次,上面没有封顶,但至少要有1次。

    ? 表示前面的字符要出现0次,1次,上面封顶是1次,下面保底是0次,可以不出现。

     

    2.其他符号

    \ 表示转义

    . 表示匹配任何单个字符,好象除了回车,记不清了,得查一下文档。

    ^ 表示整个字符串以某字符开始,如^t,整个字符串这句话很重要,它只能是位于开头。

    $ 表示整个字符串以某字符结束,如f$,整个字符串这句话很重要,它只能是位于结尾。

    [...] 表示括号中的任一字符
    | 表示选择符号,"gray|grey"可匹配 gray 或 grey.

    () 表示操作的范围和优先度, 如 "gr(a|e)y" 可以匹配 gray 或 grey.

    {n} 匹配前面字符n次, {n,} n次或无限次, {n,m} 最少n次最多m次。

    \s 任一空白字符

    \S 任一非空白字符

    \w 任一单词字符

    \W 任一非单词字符

    \d 任一数字

    \D 任一非数字

     

    3.提取中文信息的表达式。

    Regex rx = new Regex("[\u4e00-\u9fa5]+");

     

    4.提取双引号之间的信息的表达式。

    Regex rx = new Regex("\"[^\"]*\"");

    注解:在[]中的^意思变了,不再是以某字符开始了,而是变为不能包含后面的字符了,这叫反义。

     

    5.反义

    有时需要查找不属于某个能简单定义的字符类的字符。比如想查找除了数字以外,其它任意字符都行的情况,这时需要用到反义:

    表3.常用的反义代码 

    代码/语法 说明

    \W 匹配任意不是字母,数字,下划线,汉字的字符

    \S 匹配任意不是空白符的字符

    \D 匹配任意非数字的字符

    \B 匹配不是单词开头或结束的位置

    [^x] 匹配除了x以外的任意字符

    [^aeiou]

    匹配除了aeiou这几个字母以外的任意字符

     

    6.提取双引号之间的信息的表达式,第二种方法。

    Regex rx = new Regex("\".*?\"");

    注解: 在.*之后加一个?的作用是将正则表达式从贪婪模式改为懒惰模式。

     

    7.贪婪与懒惰

    当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。考虑这个表达式:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。

    有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧:

    a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab(第一到第三个字符)和ab(第四到第五个字符)。

    为什么第一个匹配是aab(第一到第三个字符)而不是ab(第二到第三个字符)?简单地说,因为正则表达式有另一条规则,比懒惰/贪婪规则的优先级更高:最先开始的匹配拥有最高的优先权——The match that begins earliest wins。

     

    8.另外,蓝驿轨迹还有一种匹配双引号的方法,就是把引号转成16进制数,具体请参考:http://www.cnblogs.com/twh/articles/1629752.html

    Regex rx = new Regex("\u0022.*?\u0022");

     

    9.提取xml配置文件中包含中文的信息,用于国际化代码。

    有可能在两种地方出现包含中文的信息,属性和节点值,因此,可以用双引号匹配一次文件,提取出属性值中包含的中文信息;然后,再用尖括号匹配一次文件,提取出节点值中包含的中文信息,正则 rx = new Regex(">.*<"); 

    如果仅仅是匹配中文,用Regex rx = new Regex("[\u4e00-\u9fa5]+")即可,但如果中文中间夹杂着标点符号或者英文,那用这个就不灵了,可以换个思路,用IsMatch来判断信息中是否包含中文来达到取舍的目的,示例如下:

    Regex rxChinaCharacter= new Regex("[\u4e00-\u9fa5]+")

    Regex rx = new Regex(">.*<");
    System.Text.RegularExpressions.MatchCollectionmatchs = rx.Matches(input);
    if (matchs.Count != 0)
    {
        foreach (Match m in matchs)
        {
               if (!rxChinaCharacter.IsMatch(m.Value))

               {

                     //符合包含中文的条件条件,可以留下来。

               }

       }

    }

    10.总结

    ^有两种含义:

     1.表示整个字符串以某字符开始,如^t,整个字符串这句话很重要,它只能是位于开头。

     2.放在[^t]里表示不能包含t字符。

     

    ?也有两种含义:

     1.表示前面的字符要出现0次,1次,上面封顶是1次,下面保底是0次,可以不出现。

     2.将正则从贪婪模式改为懒惰模式。

     

    $ 表示整个字符串以某字符结束,如f$,整个字符串这句话很重要,它只能是位于结尾,如assssbtattttb这个串让 a[^a]*b$ 来匹配,就只能匹配后半截attttb, 如用^ a[^a]*b, 就只能匹配前半段assssb, 如果用^ a[^a]*b$来匹配,则根本什么都匹配不了。

     

    推荐资料:

    正则表达式30分钟入门教程
    http://manual.phpv.net/regular_expression.html
    C#正则表达式整理备忘
    http://www.cnblogs.com/kissknife/archive/2008/03/23/1118423.html
    正则表达式怎么匹配双引号
    http://www.cnblogs.com/twh/articles/1629752.html

    转载于:https://www.cnblogs.com/liuzhendong/archive/2012/06/05/2537274.html

    展开全文
  • 这种操作模式提供可重复的读取, 并确保在同一事务处理种对相同数据的两次查询看到的是相同的值。 值范围: TRUE | FALSE 默认值: FALSE row_locking: 说明: 指定在表已更新或正在更新时是否获取行锁。如果设置为 ...
  • 我是一名日本留学生,通过在日本三年生活和学习,摸索、整理出了一套日语学习资料,包括发音及入门、词汇及语法、教材学习、等资料都有整理,送给每一位学习日语小伙伴,...和中文一样,它是叠字符号表示前一个...

    我是一名日本留学生,通过在日本三年的生活和学习,摸索、整理出了一套日语学习资料,包括发音及入门、词汇及语法、教材学习、等资料都有整理,送给每一位学习日语小伙伴,这里是日语学习者聚集地,欢迎初学和进阶中的小伙伴哦~~~

    020da18dfc6410e963a5743d5d0d5cd3.png
    df7c455f00caf101c59c9c7423edc222.png

    日语里也有汉字重复符号“々”,常见于“佐々木”这个姓氏中,而“赤裸々”(せきらら)、“人々”(ひとびと)、“時々”(ときどき)等词语中也有它的身影。

    和中文一样,它是叠字符号,表示前一个汉字的重复。因为不是汉字,所以日本汉和辞典中并未收录。许多日本人在电脑上输入这个符号时,都会先打出“佐々木”,然后再将“佐”和“木”字一一删掉。虽然麻烦,但似乎很少有人研究它到底如何输入,也很少有人在意它的读音。

    佐々木希

    ささき のぞみ

    那么在电脑上该如何打出这个字符呢?它的读音又是什么?

    “々”的正确输入方式

    输入“おなじ”、“くりかえし”、“どう”都可以打出来,不妨试试看。

    “々”的读法

    c63b64dad7da11223d1e05d01723ac01.png

    它没有官方的读法,但是日本印刷业因其字形由片假名“ノ”和片假名“マ”上下组合而成,因此直接将其读作“ノマ”,倒也形象。日本近来发售的一些手机中,直接输入“ノマ”也可以打出“々”。

    不过,虽然可以替代同时出现的前一个汉字,但“々”毕竟不是书面语言,所以正式的、官方的文章中是不会出现“々”的。

    还有它的同胞兄弟“ゝ”和“ゞ”……纳尼?连这些也是日语?

    是的,“ゝ”和“ゞ”属于日语中的叠字符号,叫做“踊り字”(おどりじ),表示对前面一个假名的重复;而“々”则是对前面汉字的重复。

    “ゝ”和“ゞ”的具体用法

    153868a7986cc336b13f9f4bf2ac35cb.png

    “ゝ”和“ゞ”常见于日语古文以及过去的文章中,例如大文豪夏目漱石的小说《こゝろ》(《心》)曾用这样的表记。但是这种用法在现在已经比较少见了,只有一些特指名词还在沿用,例如“いすゞ自動車”(日本五十铃汽车)。

    需要注意的是,在平假名的后面表重复时使用“ゝ”和“ゞ”,在片假名后面则用“ヽ”和“ヾ”。其中前者用于清音后,后者用于浊音后。例如“バナナ バナヽ”,“ ただ たゞ”。

    “ゝ”和“ゞ”怎么打出来?

    和“々”一样,输入“おなじ”、“くりかえし”都可以打出来。“いすゞ自動車”则可以直接输入“いすず”,不妨试试看。

    展开全文
  • Sgn 函数 返回表示的符号的整数。 Sin 函数 返回角度的正弦值。 Source 属性 返回最早出错的对象或应用程序的名称。 Space 函数 返回由指定数量的空格组成的字符串。 Split 函数 返回下限为 0 的、由指定数量...
  • 编译原理中文

    2014-12-01 09:14:48
    6.5.1 TINY的符号表 258 6.5.2 TINY语义分析程序 259 练习 260 编程练习 264 注意与参考 264 第7章 运行时环境 266 7.1 程序执行时的存储器组织 266 7.2 完全静态运行时环境 269 7.3 基于栈的运行时环境 271 7.3.1 ...
  • 1.编写一个程序,把用分钟表示的时间转换成用小时和分钟表示的时间,使用#define或者const创建一个表示60的符号常量或者const 变量。通过while循环让用户重复输入值,直到用户输入小于或等于0的值才停止循环; #...

    1.编写一个程序,把用分钟表示的时间转换成用小时和分钟表示的时间,使用#define或者const创建一个表示60的符号常量或者const 变量。通过while循环让用户重复输入值,直到用户输入小于或等于0的值才停止循环;

    #include<stdio.h>
    #include<stdlib.h>
    int main()
    {
        
    
    展开全文
  • 正则表达式(中文).rar

    2008-09-25 11:45:40
     一些不便书写的字符,以及后边章节中特殊定义的符号,采用在前面加 "\" 的方法来书写。 转义字符(\Q...\E)  使用 \Q 开始,\E 结束,可使中间的标点符号失去正则语法所定义的特殊意义。 字符集合  可以与 '...
  • DBX260中文说明书

    2013-04-24 11:07:35
    DBX260中文说明书,DBX260使用(一) 1.1 后面板连接(260) IEC电源线插座 260采用电压范围为100V-240V,频率为50-60Hz国际性电源来供电,它使用是IEC电缆线。 MIDI输入,MIDI输出和转接接口 这些接口为260 ...
  • 通过将单词看做一个原子符号,用向量索引进行表示。 例如:一篇文档有10个词(x=[1:10]),每个词使用一维向量进行表示,没有重复词。 星巴克 [1 0 0 0 0(总共9个0)] 哈士奇 [0 0 1 0 0(总共9个0)] 问题: (1)...

    1.one-hot vector:基于规则或基于统计的自然语言处理。通过将单词看做一个原子符号,用向量索引进行表示。
    例如:一篇文档有10个词(x=[1:10]),每个词使用一维向量进行表示,没有重复词。
    星巴克
    [1 0 0 0 0(总共9个0)]
    哈士奇
    [0 0 1 0 0(总共9个0)]
    问题:
    (1)体现不了词与词之间的关系:计算词相似。,余弦相似度 cos(A*B)/|A||B|由于正交,计算为零。
    (2)高维空间–与文档词的数量相关 词的数量很大。
    2.word embedding:(词嵌入)词向量,将词转换为一种分布式表示。表示成一个连续的稠密向量。(维数小于词的数量。)
    优点:
    (1)解决词与词之间的关系,可以计算距离。
    (2)可以计算词的特征向量。包含的信息更多。
    (3)通过共现矩阵实现,缓解了 one-hot向量相似度为0的问题,但维度还是很大,不稠密(数据稀疏)
    例如:
    我喜欢大数据
    我爱运动
    我爱摄影
    我 喜欢 大数据 爱 运动 摄影
    我 0 1 0 2 0 0
    喜欢 1 0 1 0 0 0
    大数据 0 1 0 0 0 0
    爱 2 0 0 0 1 1
    运动 0 0 0 1 0 0
    摄影 0 0 0 1 0 0
    (4)SVD–奇异值分解。
    可以实现矩阵的降维。
    UsigmaV=A(U的维数 mxm mxn nxn) A 是 nxn的矩阵 m<=n
    3.word2vec
    (1)word2vec:将 one-hot-vector 映射(embedding)低密度 连续的稠密向量。
    神经网络(3层)
    输入层:One-hot-vector
    隐含层:线性单元(输入层计算)
    输出层:softmax函数:可以将数值归一化到 0-1之间。每个分类被取到的概率,最大概率值即所分的类别。
    (2)有两种模型:CBOW(Continuous Bag of Words)和Skip-Gram
    (3)a、安装 Gensim
    pip install gensim(没有做 cextension扩展)
    conda install -c conda-forge gensim(建议 -c 指channels)
    b、直接调用
    from gensim.models import Word2Vec
    model=Word2Vec(sentences,sg=0,size=,window,min_count,workers)
    sentences—预处理完之后的语料。(分句 分词)
    sg–0:CBOW 1:SKip-gram
    size:特征向量的维度,默认为100,推荐值为 几十-几百。
    window:当前词与预测词在一个句子中的最大距离。
    alpha:学习速率 0-1之间。
    min_count:词频的限制,最小出现次数。
    workers:线程数
    (4)处理步骤
    a、数据预处理(分词、去除停用词和不必要的字符等)
    b、word2vec模型声明–转为词向量
    c、机器学习–特征工程、深度学习–不需要声明网络的结构和参数
    d、训练和测试(评价指标 准确度、召回值、精确度、F1-Score)
    5、doc2vec
    (1)2014年提出的,word2vec扩展。用于句、 段落和文章之间的相似性。
    (2)DM:对应word2vec的CBOW,增加了文档的向量。主要是根据上下文预测上下文的其他单词。
    DBOW:对应于 word2vec的 skip-gram,通过段落的向量 预测其他单词。
    通过使用Huffman树 ,可以提高计算速率。huffman编码。
    (3)Doc2vec=(dm=0,size,window,min_count,workers)
    dm=0 表示 DBOW dm=1表示DM算法。

    展开全文
  • 深入理解Python中文版高清PDF

    热门讨论 2012-09-04 19:37:04
     1.3.10 高效快速原型开发工具   1.3.11 内存管理器   1.3.12 解释性和(字节)编译性   1.4 下载和安装Python   1.5 运行Python   1.5.1 命令行上交互式解释器   1.5.2 从命令行启动...
  • Python核心编程第二版(中文)

    热门讨论 2015-04-23 16:40:13
    15.2 正则表达式使用特殊符号和字符 15.2.1 用管道符号(|)匹配多个正则表达式模式 15.2.2 匹配任意一个单个字符(.) 15.2.3 从字符串开头或结尾或单词边界开始匹配(^/$ /\b /\B ) 15.2.4 创建字符类...
  • Python核心编程(中文第二版)

    热门讨论 2009-10-02 12:08:14
     1.3.10 高效快速原型开发工具   1.3.11 内存管理器   1.3.12 解释性和(字节)编译性   1.4 下载和安装Python   1.5 运行Python   1.5.1 命令行上交互式解释器   1.5.2 从命令行启动脚本 ...
  • 变量命名

    2021-03-13 09:35:03
    驼峰式:teaCup(表示茶杯意思),stuAge(学生年龄) 蛇形式:tea_cup,stu_age 如果是单个单词就全小写就行了。 千万不要用中文拼音来表达:例如学生年龄:xueShengNianling。 在一个方法中变量名不能重复。 ...
  • 内容来源:石家庄新闻网汉字,又被称为“中文、中国字、方块字”,是咱汉语记录符号,也是世界上最古老文字之一,已有6000多年历史。根据不完全统计,汉字总数约10万个,其中包含大量异体字和罕用字。而这些...
  • C语言科学和艺术.pdf

    热门讨论 2012-01-19 14:09:05
    本资源包含《C语言科学和艺术(英文版)》.pdf和《C语言科学和艺术(中文版)》.pdf两本书,有兴趣朋友可以进行对照阅读。 《C语言科学和艺术》,原名《The Art and Science of C: A Library-Based Introduction...
  • excel使用

    2012-11-25 17:06:01
    还有一点要提醒你注意:以上的符号均为半角,而且IF与括号之间也不能有空格。4、自定义格式Excel中预设了很多有用的数据格式,基本能够满足使用的要求,但对一些特殊的要求,如强调显示某些重要数据或信息、设置...
  • 正则表达式

    2015-09-13 19:45:58
    正则学习地址在线练习地址(挺好用的一个网站)\b 表示单词之间的间隔 ...{x} {前面的符号需要匹配x次 \s匹配任意的空白符——空格,制表符(Tab),换行符,中文全角空格等 \w匹配字母、数字、下划
  • 30.查找一字符串(withinstr)在另一字符串中(findstr1)中某一次(startnum)出现时位置,返回零表示没找到。 31.增加文件路径最后“\”符号 32.计算所得税 33.从工作表第一行标题文字以数字形式返回所在列号 34....
  • BFN范式

    千次阅读 2016-04-07 20:30:06
    什么是BFN范式BNF是 Backus-Naur Form 的缩写,中文叫巴科斯范式,它是用来描述计算机语言语法的符号集。内容双引号(“”)中的字,表示这些字符本身。(double_quote用来代表双引号) 双引号(“”)外的字,表示语法。...
  • 完整中文教程及代码请查看 github.com/WillieWangW… 绘制 Path 和 Shape 用户访问列表中地标时应当...我们可以尝试使用 overlaid 符号来给不同类型地标创建多个徽章,修改它的重复次数或更改各种角度和比...
  • 正则表达式实例

    2009-09-23 15:32:13
    var chineseNameReg = /^[\u4E00-\u9FA5]{1,}$/;//中文名字正则表达式 var englishNameReg = /^[a-zA-Z]{1,}\/[a-zA-Z]{1,}[\sa-zA-Z]{0,}$/;//英文名字正则表达式 ...{1,}表示重复一次以上 ...
  • 用 object 可以表示所有类型。 预定义类型 下表列出了预定义类型,并说明如何使用。 类型 object 说明 所有其他类型最终 基类型 字符串类型; 字符串是 Unicode 字符序列 8 位有符号整型 16 位有符号整型 32 位...
  • 正则理解

    2011-02-12 11:12:00
    虽然通常英文单词是由空格,标点符号或者换行来分隔,但是/b并不匹配这些单词分隔字符中任何一个,它只匹配一个位置。/d:元字符,数字占位符,匹配一位数字,表达式:0/d{2}-/d{8}。 这里/d后面{2}({8})...
  • 164 用简易图表表示销量情况 326 ◎文本合并比较函数 327 165 在数值结果左侧添加“¥”符号 327 166 在身份证号码中提取员工出生年月信息 329 167 提取月利润最高前三种产品名称 330 168 判断实习...
  • 常用快捷键

    2018-04-04 11:11:53
    1.常用快捷键:F2:重新命名 F5:刷新网页或刷新桌面 F4:重复上一步操作F11:全屏显示网页(退出)2常见和不常见符号的输入. 脱字符2^3 表示23次方英文状态下:! $ ^ _ [] { } ; () : "" ''...

空空如也

空空如也

1 2 3 4 5
收藏数 81
精华内容 32
关键字:

中文表示重复的符号