精华内容
下载资源
问答
  • 正值表达式生成工具

    2015-08-26 16:47:08
    自动生成常用的正值表达式,和验证正值表达式是否正确。
  • PHP正值表达式

    2019-09-21 01:43:41
    一个正值表达式是有四部分组成分别是 1、定界符 //是最常用的定界符 其实除了数组字母下划线以外其他的什么都可以作为定界符 2、原子:最小的一个匹配单位 放在定界符中 在一个正值表达式中至少要有一个原子(就是...

    一个正值表达式是有四部分组成分别是

    1、定界符 //是最常用的定界符 其实除了数组字母下划线以外其他的什么都可以作为定界符

    2、原子:最小的一个匹配单位 放在定界符中  在一个正值表达式中至少要有一个原子(就是我们要找的字符eg:2我们要找3 ,3就是原子 )

    3、元字符 :元字符不能单独使用的是用来扩展原子功能的 $str="/7{5}/";写在定界符号中

    4、模式正符  :就是用来修正用的 ,对模式(正则)修正(写在定界符号外面,写在右边)

    替换:$str="aaaaddd111fffff333" ;

    $reg="/\d/";

    使用的正值表达式的函数式 preg_replace($reg,"#",$str)

    preg_split();表示的是分割字符串

    preg_split("$reg",$str);

    preg_match();这个是用来匹配正值表达式的

    preg_match($reg,$str,$arr);

    preg_match_all()表示的是匹配所有的

    /d 表示的是任意一个数字

    /D表示的任意一个非数字

    /u表示的任意一个字  a-z A-Z 0-9

    /U表示的任意一个非字 除了 a-z A-Z 0-9

    /s表示的空白

    /S表示的是非空白

    自己定义的原子表eg:[12345]

    ^除了的意思

    ^这个表示的是非字母  [^dddddfsfsdf]

    -表示的从哪到哪 eg 1-9

    元字符 不能再正值表达式中单独使用 用来修饰原子

    模式修正符号要写在定界符号外面 放在右边

    模式修正符号 一个字符就是一个功能 可以组合使用

    作用就是修正正值表达式的解释,或是扩充了正则表达式的功能

    i 表示的是不区分大小写

    m 修正符号修正正则表达式可以视为多行,在使用^或$这个连个符号的时候每一行满足都可以(默认是处理为一行处理的)

    s 修正正则表达式中的可以匹配换行符号

     

     

     

    转载于:https://www.cnblogs.com/BoYu045535/p/3681787.html

    展开全文
  • 正值表达式

    千次阅读 2016-08-10 17:34:39
    正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 给定一个正则表达式和另一个字符...

    概念

    正则表达式是对 字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
    给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
    1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
    2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。
    正则表达式的特点是:
    1. 灵活性、逻辑性和功能性非常的强;
    2. 可以迅速地用极简单的方式达到字符串的复杂控制。
    3. 对于刚接触的人来说,比较晦涩难懂。
    由于正则表达式主要 应用对象是文本,因此它在各种 文本编辑器场合都有应用,小到著名编辑器EditPlus,大到Microsoft Word、Visual Studio等大型编辑器,都可以使用正则表达式来处理文本内容。

    引擎

    正则引擎主要可以分为两大类:一种是DFA,一种是NFA。这两种引擎都有了很久的历史(至今二十多年),当中也由这两种引擎产生了很多变体!于是POSIX的出台规避了不必要变体的继续产生。这样一来,主流的正则引擎又分为3类:一、DFA,二、传统型NFA,三、POSIX NFA。
    DFA 引擎在线性时状态下执行,因为它们不要求回溯(并因此它们永远不测试相同的字符两次)。DFA 引擎还可以确保匹配最长的可能的字符串。但是,因为 DFA 引擎只包含有限的状态,所以它不能匹配具有反向引用的模式;并且因为它不构造显示扩展,所以它不可以捕获子表达式。
    传统的 NFA 引擎运行所谓的“贪婪的”匹配 回溯算法,以指定顺序测试正则表达式的所有可能的扩展并接受第一个匹配项。因为传统的 NFA 构造正则表达式的特定扩展以获得成功的匹配,所以它可以捕获子表达式匹配和匹配的反向引用。但是,因为传统的 NFA 回溯,所以它可以访问完全相同的状态多次(如果通过不同的路径到达该状态)。因此,在最坏情况下,它的执行速度可能非常慢。因为传统的 NFA 接受它找到的第一个匹配,所以它还可能会导致其他(可能更长)匹配未被发现。
    POSIX NFA 引擎与传统的 NFA 引擎类似,不同的一点在于:在它们可以确保已找到了可能的最长的匹配之前,它们将继续回溯。因此,POSIX NFA 引擎的速度慢于传统的 NFA 引擎;并且在使用 POSIX NFA 时,您恐怕不会愿意在更改回溯搜索的顺序的情况下来支持较短的匹配搜索,而非较长的匹配搜索。
    使用DFA引擎的程序主要有:awk,egrep,flex,lex,MySQL,Procmail等;
    使用传统型NFA引擎的程序主要有:GNU Emacs,Java,ergp,less,more,.NET语言,PCRE library,Perl,PHP,Python,Ruby,sed,vi;
    使用POSIX NFA引擎的程序主要有:mawk,Mortice Kern Systems’ utilities,GNU Emacs(使用时可以明确指定);
    也有使用DFA/NFA混合的引擎:GNU awk,GNU grep/egrep,Tcl。
    举例简单说明NFA与DFA工作的区别:
    比如有字符串this is yansen’s blog,正则表达式为 /ya(msen|nsen|nsem)/ (不要在乎表达式怎么样,这里只是为了说明引擎间的工作区别)。 NFA工作方式如下,先在字符串中查找 y 然后匹配其后是否为 a ,如果是 a 则继续,查找其后是否为 m 如果不是则匹配其后是否为 n (此时淘汰msen选择支)。然后继续看其后是否依次为 s,e,接着测试是否为 n ,是 n 则匹配成功,不是则测试是否为 m 。为什么是 m ?因为 NFA 工作方式是以正则表达式为标准,反复测试字符串,这样同样一个字符串有可能被反复测试了很多次!
    而DFA则不是如此,DFA会从 this 中 t 开始依次查找 y,定位到 y ,已知其后为 a ,则查看表达式是否有 a ,此处正好有 a 。然后字符串 a 后为 n ,DFA依次测试表达式,此时 msen 不符合要求淘汰。nsen 和 nsem 符合要求,然后DFA依次检查字符串,检测到sen 中的 n 时只有nsen 分支符合,则匹配成功!
    由此可以看出来,两种引擎的工作方式完全不同,一个(NFA)以表达式为主导,一个(DFA)以文本为主导!一般而论,DFA引擎则搜索更快一些!但是NFA以表达式为主导,反而更容易操纵,因此一般程序员更偏爱NFA引擎! 两种引擎各有所长,而真正的引用则取决与你的需要以及所使用的语言!

    符号

    (摘自《 正则表达式之道》)
    正则表达式 [1]  由一些普通 字符和一些 元字符(metacharacters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义,我们下面会给予解释。
    在最简单的情况下,一个正则表达式看上去就是一个普通的查找串。例如,正则表达式"testing"中没有包含任何元字符,它可以匹配"testing"和"testing123"等字符串,但是不能匹配"Testing"。
    要想真正的用好正则表达式,正确的理解元字符是最重要的事情。下表列出了所有的元字符和对它们的一个简短的描述。
    元字符
    描述
    \
    将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如,“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。
    ^
    匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“\n”或“\r”之后的位置。
    $
    匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之前的位置。
    *
    匹配前面的子表达式任意次。例如,zo*能匹配“z”,也能匹配“zo”以及“zoo”。
    +
    匹配前面的子表达式一次或多次(大于等于1次)。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}。
    ?
    匹配前面的子表达式零次或一次。例如,“do(es)?”可以匹配“do”或“does”中的“do”。?等价于{0,1}。
    {n}
    n是一个非负整数。匹配确定的n次。例如,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个o。
    {n,}
    n是一个非负整数。至少匹配n次。例如,“o{2,}”不能匹配“Bob”中的“o”,但能匹配“foooood”中的所有o。“o{1,}”等价于“o+”。“o{0,}”则等价于“o*”。
    {n,m}
    m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。例如,“o{1,3}”将匹配“fooooood”中的前三个o。“o{0,1}”等价于“o?”。请注意在逗号和两个数之间不能有空格。
    ?
    当该字符紧跟在任何一个其他限制符(*,+,?,{n},{n,},{n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如,对于字符串“oooo”,“o+?”将匹配单个“o”,而“o+”将匹配所有“o”。
    .点
    匹配除“\r\n”之外的任何单个字符。要匹配包括“\r\n”在内的任何字符,请使用像“[\s\S]”的模式。
    (pattern)
    匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用$0…$9属性。要匹配圆括号字符,请使用“\(”或“\)”。
    (?:pattern)
    非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。
    (?=pattern)
    非获取匹配,正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。
    (?!pattern)
    非获取匹配,正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。
    (?<=pattern)
    非获取匹配,反向肯定预查,与正向肯定预查类似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。
    (?<!pattern)
    非获取匹配,反向否定预查,与正向否定预查类似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。这个地方不正确,有问题
    此处用或任意一项都不能超过2位,如“(?<!95|98|NT|20)Windows正确,“(?<!95|980|NT|20)Windows 报错,若是单独使用则无限制,如(?<!2000)Windows 正确匹配
    x|y
    匹配x或y。例如,“z|food”能匹配“z”或“food”(此处请谨慎)。“(z|f)ood”则匹配“zood”或“food”。
    [xyz]
    字符集合。匹配所包含的任意一个字符。例如,“[abc]”可以匹配“plain”中的“a”。
    [^xyz]
    负值字符集合。匹配未包含的任意字符。例如,“[^abc]”可以匹配“plain”中的“plin”。
    [a-z]
    字符范围。匹配指定范围内的任意字符。例如,“[a-z]”可以匹配“a”到“z”范围内的任意小写字母字符。
    注意:只有连字符在字符组内部时,并且出现在两个字符之间时,才能表示字符的范围; 如果出字符组的开头,则只能表示连字符本身.
    [^a-z]
    负值字符范围。匹配任何不在指定范围内的任意字符。例如,“[^a-z]”可以匹配任何不在“a”到“z”范围内的任意字符。
    \b
    匹配一个单词边界,也就是指单词和空格间的位置(即正则表达式的“匹配”有两种概念,一种是匹配字符,一种是匹配位置,这里的\b就是匹配位置的)。例如,“er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er”。
    \B
    匹配非单词边界。“er\B”能匹配“verb”中的“er”,但不能匹配“never”中的“er”。
    \cx
    匹配由x指明的控制字符。例如,\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则,将c视为一个原义的“c”字符。
    \d
    匹配一个数字字符。等价于[0-9]。grep 要加上-P,perl正则支持
    \D
    匹配一个非数字字符。等价于[^0-9]。grep要加上-Pperl正则支持
    \f
    匹配一个换页符。等价于\x0c和\cL。
    \n
    匹配一个换行符。等价于\x0a和\cJ。
    \r
    匹配一个回车符。等价于\x0d和\cM。
    \s
    匹配任何不可见字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
    \S
    匹配任何可见字符。等价于[^ \f\n\r\t\v]。
    \t
    匹配一个制表符。等价于\x09和\cI。
    \v
    匹配一个垂直制表符。等价于\x0b和\cK。
    \w
    匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”,这里的"单词"字符使用Unicode字符集。
    \W
    匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。
    \xn
    匹配n,其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,“\x41”匹配“A”。“\x041”则等价于“\x04&1”。正则表达式中可以使用ASCII编码。
    \num
    匹配num,其中num是一个正整数。对所获取的匹配的引用。例如,“(.)\1”匹配两个连续的相同字符。
    \n
    标识一个八进制转义值或一个向后引用。如果\n之前至少n个获取的子表达式,则n为向后引用。否则,如果n为八进制数字(0-7),则n为一个八进制转义值。
    \nm
    标识一个八进制转义值或一个向后引用。如果\nm之前至少有nm个获得子表达式,则nm为向后引用。如果\nm之前至少有n个获取,则n为一个后跟文字m的向后引用。如果前面的条件都不满足,若n和m均为八进制数字(0-7),则\nm将匹配八进制转义值nm。
    \nml
    如果n为八进制数字(0-7),且m和l均为八进制数字(0-7),则匹配八进制转义值nml。
    \un
    匹配n,其中n是一个用四个十六进制数字表示的Unicode字符。例如,\u00A9匹配版权符号(&copy;)。
    \p{P}
    小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。中括号内的“P”表示Unicode 字符集七个字符属性之一:标点字符。
    其他六个属性:
    L:字母;
    M:标记符号(一般不会单独出现);
    Z:分隔符(比如空格、换行等);
    S:符号(比如数学符号、货币符号等);
    N:数字(比如阿拉伯数字、罗马数字等);
    C:其他字符。
    *注:此语法部分语言不支持,例:javascript。
    < >匹配词(word)的开始(<)和结束(>)。例如正则表达式<the>能够匹配字符串"for the wise"中的"the",但是不能匹配字符串"otherwise"中的"the"。注意:这个元字符不是所有的软件都支持的。
    ( )将( 和 ) 之间的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域(一个正则表达式中最多可以保存9个),它们可以用 \1 到\9 的符号来引用。
    |将两个匹配条件进行逻辑“或”(Or)运算。例如正则表达式(him|her) 匹配"it belongs to him"和"it belongs to her",但是不能匹配"it belongs to them."。注意:这个元字符不是所有的软件都支持的。
    +匹配1或多个正好在它之前的那个字符。例如正则表达式9+匹配9、99、999等。注意:这个元字符不是所有的软件都支持的。
    ?匹配0或1个正好在它之前的那个字符。注意:这个元字符不是所有的软件都支持的。
    {i} {i,j}匹配指定数目的字符,这些字符是在它之前的表达式定义的。例如正则表达式A[0-9]{3} 能够匹配字符"A"后面跟着正好3个数字字符的串,例如A123、A348等,但是不匹配A1234。而正则表达式[0-9]{4,6} 匹配连续的任意4个、5个或者6个数字
    最简单的 元字符是点,它能够匹配任何单个字符(注意不包括换行符)。假定有个文件test.txt包含以下几行内容:
    he is arat
    he is in a rut
    the food is Rotten
    I like root beer
    我们可以使用grep命令来测试我们的正则表达式,grep命令 使用正则表达式去尝试匹配指定文件的每一行,并将至少有一处匹配表达式的所有行显示出来。命令
    grep r.t test.txt
    在test.txt文件中的每一行中搜索正则表达式r.t,并打印输出匹配的行。正则表达式r.t匹配一个r接着任何一个字符再接着一个t。所以它将匹配文件中的rat和rut,而不能匹配Rotten中的Rot,因为正则表达式是大小写敏感的。要想同时匹配大写和小写字母,应该使用 字符区间 元字符(方括号)。正则表达式[Rr]能够同时匹配R和r。所以,要想匹配一个大写或者小写的r接着任何一个字符再接着一个t就要使用这个表达式:[Rr].t。
    要想匹配行首的字符要使用抑扬字符(^)——有时也被叫做插入符。例如,想找到text.txt中行首"he"打头的行,你可能会先用简单表达式he,但是这会匹配第三行的the,所以要 使用正则表达式^he,它只匹配在行首出现的he。
    有时候指定“除了×××都匹配”会比较容易达到目的,当抑扬字符(^)出方括号中时,它表示“排除”,例如要匹配he ,但是排除前面是t or s的情形(也就是the和she),可以使用:[^st]he。
    可以使用方括号来指定多个字符区间。例如正则表达式[A-Za-z]匹配任何字母,包括大写和小写的;正则表达式[A-Za-z][A-Za-z]* 匹配一个字母后面接着0或者多个字母(大写或者小写)。当然我们也可以用 元字符+做到同样的事情,也就是:[A-Za-z]+ ,和[A-Za-z][A-Za-z]*完全等价。但是要注意元字符+ 并不是所有支持正则表达式的程序都支持的。关于这一点可以参考后面的正则表达式语法支持情况。
    要指定特定数量的匹配,要使用大括号(注意必须使用 反斜杠来转义)。想匹配所有10和100的实例而排除1和 1000,可以使用:10\{1,2\},这个正则表达式匹配数字1后面跟着1或者2个0的模式。在这个元字符的使用中一个有用的变化是忽略第二个数字,例如正则表达式0\{3,\} 将匹配至少3个连续的0。
    例1
    将所有方法foo(a,b,c)的实例改为foo(b,a,c)。这里a、b和c可以是任何提供给方法foo()的参数。也就是说我们要实现这样的转换:
    之前 之后
    foo(10,7,2) foo(7,10,2)
    foo(x+13,y-2,10) foo(y-2,x+13,10)
    foo( bar(8), x+y+z, 5) foo( x+y+z, bar(8), 5)
    下面这条替换命令能够实现这一魔法:
    :%s/foo(\([^,]*\),\([^,]*\),\([^,)]*\))/foo(\2,\1,\3)/g
    让我们把它打散来加以分析。写出这个表达式的基本思路是找出foo()和它的括号中的三个参数的位置。第一个参数是用这个表达式来识别的::\([^,]*\),我们可以从里向外来分析它:
    [^,] 除了逗号之外的任何字符
    [^,]* 0或者多个非逗号字符
    \([^,]*\) 将这些非逗号字符标记为\1,这样可以在之后的替换模式表达式中引用它
    \([^,]*\), 我们必须找到0或者多个非逗号 字符后面跟着一个逗号,并且非逗号字符那部分要标记出来以备后用。
    正是指出一个 使用正则表达式常见错误的最佳时机。为什么我们要使用[^,]*这样的一个表达式,而不是更加简单直接的写法,例如:.*,来匹配第一个参数呢?设想我们使用模式.*来匹配字符串"10,7,2",它应该匹配"10,"还是"10,7,"?为了解决这个两义性(ambiguity),正则表达式规定一律按照最长的串来,在上面的例子中就是"10,7,",显然这样就找出了两个参数而不是我们期望的一个。所以,我们要使用[^,]*来强制取出第一个逗号之前的部分。
    这个表达式我们已经分析到了:foo(\([^,]*\),这一段可以简单的翻译为“当你找到foo(就把其后直到第一个逗号之前的部分标记为\1”。然后我们使用同样的办法标记第二个参数为\2。对第三个参数的标记方法也是一样,只是我们要搜索所有的字符直到右括号。我们并没有必要去搜索第三个参数,因为我们不需要调整它的位置,但是这样的模式能够保证我们只去替换那些有三个参数的foo()方法调用,在foo()是一个 重载(overloading)方法时这种明确的模式往往是比较保险的。然后,在替换部分,我们找到foo()的对应实例,然后利用标记好的部分进行替换,是把第一和第二个参数交换位置。
    正则表达式语法支持情况
    命令或环境
    .
    [ ]
    ^
    $
    \( \)
    \{ \}
    ?
    +
    |
    ( )
    vi
         
    Visual C++
         
    awk
     
    awk是支持该语法的,只是要在命令
    行加入 --posix or --re-interval参数即可,可见
    man awk中的interval expression
    sed
        
    delphi
     
    python
    java
    √ [2] 
    javascript
     
    php
         
    perl
     
    C#
      

    速记理解技巧

    .
    [ ]
    ^
    $
    四个字符是所有语言都支持的正则表达式,所以这个四个是基础的正则表达式。正则难理解因为里面有一个等价的概念,这个概念大大增加了理解难度,让很多初学者看起来会蒙,如果把等价都恢复成原始写法,自己书写正则就超级简单了,就像说话一样去写你的正则了:

       等价:
    等价是等同于的意思,表示同样的功能,用不同符号来书写。
    ?,*,+,\d,\w 都是等价字符
      ?等价于匹配长度{0,1}
      *等价于匹配长度{0,}
      +等价于匹配长度{1,}
      \d等价于[0-9]
      \w等价于[A-Za-z_0-9]。
    常用运算符与表达式:
      
    ^ 开始
      () 域段
      [] 包含,默认是一个字符长度
      [^] 不包含,默认是一个字符长度
      {n,m} 匹配长度
      . 任何单个字符(\. 字符点)
      | 或
      \ 转义
      $ 结尾
      [A-Z] 26个大写字母
      [a-z] 26个小写字母
      [0-9] 0至9数字
    [A-Za-z0-9] 26个大写字母、26个小写字母和0至9数字
      , 分割
      .
      
       分割语法:
      [A,H,T,W] 包含A或H或T或W字母
      [a,h,t,w] 包含a或h或t或w字母
      [0,3,6,8] 包含0或3或6或8数字

       语法与释义:
      
    基础语法 "^([]{})([]{})([]{})$"
      正则字符串 = "开始([包含内容]{长度})([包含内容]{长度})([包含内容]{长度})结束"
      
      ?,*,+,\d,\w 这些都是简写的,完全可以用[]和{}代替,在(?:)(?=)(?!)(?<=)(?<!)(?i)(*?)(+?)这种特殊组合情况下除外。
      初学者可以忽略?,*,+,\d,\w一些简写标示符,学会了基础使用再按表自己去等价替换

      
       实例:
      字符串;tel:086-0666-88810009999
      原始正则:"^tel:[0-9]{1,3}-[0][0-9]{2,3}-[0-9]{8,11}$"
      速记理解:开始 "tel:普通文本"[0-9数字]{1至3位}"-普通文本"[0数字][0-9数字]{2至3位}"-普通文本"[0-9数字]{8至11位} 结束"
      等价简写后正则写法:"^tel:\d{1,3}-[0]\d{2,3}-\d{8,11}$" ,简写语法不是所有语言都支持。

    替换技巧

    编辑

    实例目录

    【1】 正则表达式应用——替换指定内容到行尾
    【2】 正则表达式应用——数字替换
    【3】 正则表达式应用——删除每一行行尾的指定 字符
    【4】 正则表达式应用——替换带有 半角括号的多行
    【5】 正则表达式应用——删除空行
    【6】 正则表达式应用——实例应用

    应用实例

    【1】正则表达式应用——替换指定内容到行尾
    原始文本如下面两行
    abc aaaaa
    123 abc 444
    希望每次遇到“abc”,则替换“abc”以及其后到行尾的内容为“abc efg”
    即上面的文本最终替换为:
    abc efg
    123 abc efg
    解决:
    ① 在替换对话框,查找内容里输入“abc.*”,替换内容输入为“abc efg”
    ② 同时勾选“正则表达式” 复选框,然后点击“全部替换”按钮
    其中,符号的含义如下:
    “.” =匹配任意 字符
    “*” =匹配0次或更多
    注意:其实就是正则表达式替换,这里只是把一些曾经提出的问题加以整理,单纯从正则表达式本身来说,就可以引申出成千上万种特例。
    【2】正则表达式应用——数字替换
    希望把
    asdadas123asdasdas456asdasdasd789asdasd
    替换为:
    asdadas[123]asdasdas[456]asdasdasd[789]asdasd
    在替换对话框里面,勾选“正则表达式” 复选框
    在查找内容里面输入“([0-9])([0-9])([0-9])”,不含引号
    “替换为:”里面输入“[\1\2\3]”,不含引号
    ####备注####:查找([0-9]+) 替换:[\1] 更简单通用些
    范围为你所操作的范围,然后选择替换即可。
    实际上这也是正则表达式的使用特例,“[0-9]”表示匹配0~9之间的任何特例,同样“[a-z]”就表示匹配a~z之间的任何特例
    上面重复使用了“[0-9]”,表示连续出现的三个数字
    括号用来选择原型,进行分组,替换时要用
    “\1”代表第一个“[0-9]”对应的原型,“\2”代表第二个“[0-9]”对应的原型,依此类推
    “[”|“]”为单纯的 字符,表示添加“[”或“]”,如果输入“其它\1\2\3其它”,则替换结果为:
    asdadas其它123其它asdasdas其它456其它asdasdasd其它789其它asdasd
    功能增强:
    如果将查找内容“[0-9][0-9][0-9]”改为“[0-9]*[0-9]”,对应1 或 123 或 12345 或 ...
    大家根据需要定制
    相关内容还有很多,可以自己参考正则表达式的语法仔
    【3】正则表达式应用——删除每一行行尾的指定 字符
    因为这几个字符在行中也是出现的,所以肯定不能用简单的替换实现
    比如
    12345 1265345
    2345
    需要删除每行末尾的“345”
    这个也算正则表达式的用法,其实仔细看正则表达式应该比较简单,不过既然有这个问题提出,说明对正则表达式还得有个认识过程,解决方法如下
    解决:
    在替换对话框中,启用“正则表达式” 复选框
    在查找内容里面输入“345$”
    这里“$”表示从行尾匹配
    如果从行首匹配,可以用“^”来实现,不过 EditPlus 有另一个功能可以很简单的删除行首的字符串
    a. 选择要操作的行
    b. 编辑-格式-删除行注释
    c. 在弹出对话框里面输入要清除的行首 字符,确定
    【4】正则表达式应用——替换带有半角括号的多行
    几百个网页中都有下面一段代码:
    <script LANGUAGE="JavaScript1.1">
    <!--
    htmlAdWH('93163607', '728', '90');
    //-->
    </SCRIPT>
    我想把它们都去掉,可是找了很多search & replace的软件,都是只能对“一行”进行操作。
    EditPlus 打开几百个网页文件还是比较顺畅的,所以完全可以胜任这个工作。
    具体解决方法,在 Editplus 中 使用正则表达式,由于“(”、“)”被用做预设表达式(或者可以称作子表达式)的标志,所以查找
    “<script LANGUAGE="JavaScript1.1">\n<!--\nhtmlAdWH('93163607', '728', '90'.);\n//-->\n</SCRIPT>\n”
    时会提示查找不到,所以也就无法进行替换了,这时可以把“(”、“)”使用任意 字符标记替代,即 半角句号:“.”。替换内容为
    <script LANGUAGE="JavaScript1.1">\n<!--\nhtmlAdWH.'93163607', '728', '90'.;\n//-->\n</SCRIPT>\n
    在替换对话框启用“正则表达式”选项,这时就可以完成替换了
    补充:
    对( ) 这样的特殊符号,应该用\( \)来表示,这也是很标准的regexp语法,可以写为
    <script LANGUAGE="JavaScript1.1">\n<!--\nhtmlAdWH\('93163607', '728', '90'\);\n//-->\n</SCRIPT>\n
    【5】正则表达式应用——删除空行
    启动EditPlus,打开待处理的文本类型文件。
    ①、选择“查找”菜单的“替换”命令,弹出 文本替换对话框。选中“正则表达式” 复选框,表明我们要在查找、替换中 使用正则表达式。然后,选中“替换范围”中的“ 当前文件”,表明对当前文件操作。
    ②、单击“查找内容” 组合框右侧的按钮,出现下拉菜单。
    ③、下面的操作添加正则表达式,该表达式代表待查找的空行。(技巧提示:空行仅包括 空格符制表符、回车符,且必须以这三个符号之一作为一行的开头,并且以回车符结尾,查找空行的关键是构造代表空行的正则表达式)。
    直接在"查找"中输入正则表达式“^[ \t]*\n”,注意\t前有空格符。
    (1)选择“从行首开始匹配”,“查找内容”组合框中出现字符“^”,表示待查找字符串必须出文本中一行的行首。
    (2)选择“ 字符在范围中”,那么在“^”后会增加一对括号“[]”,当前 插入点在括号中。括号在正则表达式中表示,文本中的字符匹配括号中任意一个字符即符合查找条件。
    (3)按一下空格键,添加 空格符。空格符是空行的一个组成成分。
    (4)选择“ 制表符”,添加代表制表符的“\t”。
    (5)移动 光标,将当前插入点移到“]”之后,然后选择“匹配 0 次或更多”,该操作会添加星号字符“*”。星号表示,其前面的括号“[]”内的空格符或制表符,在一行中出现0个或多个。
    (6)选择“换行符”,插入“\n”,表示回车符。
    ④、“替换为” 组合框保持空,表示删除查找到的内容。单击“替换”按钮逐个行删除空行,或单击“全部替换”按钮删除全部空行(注意:EditPlus有时存在“全部替换”不能一次性完全删除空行的问题,可能是程序BUG,需要多按几次按钮)。
    【6】 正则表达式应用——实例应用
    1.验证用户名和密码:("^[a-zA-Z]\w{5,15}$")正确格式:"[A-Z][a-z]_[0-9]"组成,并且第一个字必须为字母6~16位;
    2.验证电话号码:("^(\\d{3,4}-)\\d{7,8}$")正确格式:xxx/xxxx-xxxxxxx/xxxxxxxx;
    3.验证手机号码:"^1[3|4|5|7|8][0-9]\\d{8}$";
    4.验证身份证号(15位或18位数字):"\\d{14}[[0-9],0-9xX]";
    5.验证Email地址:("^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$");
    6.只能输入由数字和26个英文字母组成的字符串:("^[A-Za-z0-9]+$") ;
    7.整数或者小数:^[0-9]+([.][0-9]+){0,1}$
    8.只能输入数字:"^[0-9]*$"。
    9.只能输入n位的数字:"^\d{n}$"。
    10.只能输入至少n位的数字:"^\d{n,}$"。
    11.只能输入m~n位的数字:"^\d{m,n}$"。
    12.只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。
    13.只能输入有两位小数的正实数:"^[0-9]+(\.[0-9]{2})?$"。
    14.只能输入有1~3位小数的正实数:"^[0-9]+(\.[0-9]{1,3})?$"。
    15.只能输入非零的正整数:"^\+?[1-9][0-9]*$"。
    16.只能输入非零的负整数:"^\-[1-9][0-9]*$"。
    17.只能输入长度为3的字符:"^.{3}$"。
    18.只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。
    19.只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。
    20.只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。
    21.验证是否含有^%&',;=?$\"等字符:"[%&',;=?$\\^]+"。
    22.只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"。
    23.验证URL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"。
    24.验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01"~"09"和"10"~"12"。
    25.验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为;"01"~"09"、"10"~"29"和“30”~“31”。
    26.获取日期正则表达式:\\d{4}[年|\-|\.]\d{\1-\12}[月|\-|\.]\d{\1-\31}日?
    评注:可用来匹配大多数年月日信息。
    27.匹配双 字节 字符(包括汉字在内):[^\x00-\xff]
    评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
    28.匹配空白行的正则表达式:\n\s*\r
    评注:可以用来删除空白行
    29.匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? />
    评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
    30.匹配首尾空白 字符的正则表达式:^\s*|\s*$
    评注:可以用来删除行首行尾的空白字符(包括空格、 制表符、换页符等等),非常有用的表达式
    31.匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
    评注:网上流传的版本功能很有限,上面这个基本可以满足需求
    32.匹配帐号是否合法(字母开头,允许5-16 字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
    评注:表单验证时很实用
    33.匹配腾讯QQ号:[1-9][0-9]{4,}
    评注:腾讯QQ号从10 000 开始
    34.匹配中国邮政编码:[1-9]\\d{5}(?!\d)
    评注:中国邮政编码为6位数字
    35.匹配ip地址:([1-9]{1,3}\.){3}[1-9]。
    评注:提取ip地址时有用
    36.匹配MAC地址:([A-Fa-f0-9]{2}\:){5}[A-Fa-f0-9]


    展开全文
  • 正则表达式是做文本解析工作必不可少的技能。今天通过本文给大家介绍正值表达式匹配html标签的属性值,需要的朋友一起学习吧
  • 正值表达式使用指南

    千次阅读 2008-06-18 17:45:00
    1 概述正值表达式(regular expression)是一个描述字符模式的对象,它是一种可以用于模式匹配和替换的强有力的工具,主要应用于处理文本操作,应用非常广泛,很多开发语言都对正值表达式进行支持,比如:java、c#...

    1         概述

    正值表达式(regular expression)是一个描述字符模式的对象,它是一种可以用于模式匹配替换的强有力的工具,主要应用于处理文本操作,应用非常广泛,很多开发语言都对正值表达式进行支持,比如:javac#javascriptperl等。

    本文档是关于正值表达式使用指南。包括:基本概念、开发规范、java处理方式、javascript处理方式、代码实例等。

    通过该文档可以了解正值表达式的基本知识、开发规范、常用的开发方式等,并能够通过javajavascript语言进行基于正值表达式的开发工作。

    本文档适合所有Java开发人员。

    2         基础知识

    2.1         基本概念

    正则表达式最早是由数学家Stephen Kleene1956年提出,主要使用在字符字符串的格式比对,后来在信息领域广为应用,现在已经成为ISO(国际标准组织)的标准之一。

    一个正则表达式,就是用某种模式去匹配一类字符串的一个公式。可以把数小时辛苦而且易错的文本处理工作压缩在几分钟(甚至几秒钟)内完成。正则表达式被各种文本编辑软件、类库(例如Rogue Wavetools.h++)、脚本工具(像awk/grep/sed)广泛的支持,而且像MicrosoftVisual C++这种交互式IDE也开始支持它了。

    2.2         直接量字符

    构造

    匹配

     

     

    字符

    x

    字符 x

    //

    反斜线字符

    /0n

    带有八进制值 0 的字符 n (0 <= n <= 7)

    /0nn

    带有八进制值 0 的字符 nn (0 <= n <= 7)

    /0mnn

    带有八进制值 0 的字符 mnn0 <= m <= 30 <= n <= 7

    /xhh

    带有十六进制值 0x 的字符 hh

    /uhhhh

    带有十六进制值 0x 的字符 hhhh

    /t

    制表符 ('/u0009')

    /n

    新行(换行)符 ('/u 000A ')

    /r

    回车符 ('/u000D')

    /f

    换页符 ('/u 000C ')

    /a

    报警 (bell) ('/u0007')

    /e

    转义符 ('/u001B')

    /cx

    对应于 x 的控制符

     

    在正值表达式中,许多标点符号具有特殊的含义。它们是:^ $ . * + ? = ! : | / / () [] {}

    斜线字符 ('/') 用于引用转义构造,如上表所定义的,同时还用于引用其他将被解释为非转义构造的字符。因此,表达式 // 与单个反斜线匹配,而 /{ 与左括号匹配。

    2.3         字符类

    将单独的字符放入方括号内可以组合为字符类(character class)。

    符类可以出现在其他字符类中,并且可以包含并集运算符(隐式)和交集运算符 (&&)。并集运算符表示至少包含其某个操作数类中所有字符的类。交集运算符表示包含同时位于其两个操作数类中所有字符的类。

    字符类运算符的优先级如下所示,按从最高到最低的顺序排列:

    1    

    字面值转义    

    /x

    2    

    分组

    [...]

    3    

    范围

    a-z

    4    

    并集

    [a-e][i-u]

    5    

    交集

    [a-z&&[aeiou]]

    注意,元字符的不同集合实际上位于字符类的内部,而非字符类的外部。例如,正则表达式 . 在字符类内部就失去了其特殊意义,而表达式 - 变成了形成元字符的范围。

    字符类

    [abc]

    ab c(简单类)

    [^abc]

    任何字符,除了 ab c(否定)

    [a-zA-Z]

    a z A Z,两头的字母包括在内(范围)

    [a-d[m-p]]

    a d m p[a-dm-p](并集)

    [a-z&&[def]]

    de f(交集)

    [a-z&&[^bc]]

    a z,除了 b c[ad-z](减去)

    [a-z&&[^m-p]]

    a z,而非 m p[a-lq-z](减去)

     

     

    预定义字符类

    .

    任何字符(与行结束符可能匹配也可能不匹配)

    /d

    数字:[0-9]

    /D

    非数字: [^0-9]

    /s

    空白字符:[ /t/n/x0B/f/r], /t(tab)/n(new line)/r(return)

    /S

    非空白字符:[^/s]

    /w

    单词字符:[a-zA-Z_0-9]

    /W

    非单词字符:[^/w]

     

    2.4         重复

    指定重复的字符总是出现在它们所作用的模式之后。

    Greedy 数量词

    X?

    X,一次或一次也没有

    X*

    X,零次或多次

    X+

    X,一次或多次

    X{n}

    X,恰好 n

    X{n,}

    X,至少 n

    X{n,m}

    X,至少 n 次,但是不超过 m

     

    例如:

    //s+java/s+ //match “java” with one or more spaces before and after

    //d{2,4}/  // Match between two and four digits

    2.5         选择、分组和引用

    Logical 运算符

    XY

    X 后跟 Y

    X|Y

    X Y

    (X)

    X,作为捕获组

     

     

    Back 引用

    /n

    任何匹配的 nth 捕获组

     

    实例:/(ab|cd)+|ef)/ 匹配的既可以是字符串“ef”,也可以是字符串“ab”或者“cd”的一次或多次。

    2.5.1.1       组和捕获

    捕获组可以通过从左到右计算其开括号来编号。例如,在表达式 ((A)(B(C))) 中,存在四个这样的组:

    1    

    ((A)(B(C)))

    2    

    /A

    3    

    (B(C))

    4    

    (C)

    组零始终代表整个表达式。

    之所以这样命名捕获组是因为在匹配中,保存了与这些组匹配的输入序列的每个子序列。捕获的子序列稍后可以通过 Back 引用在表达式中使用,也可以在匹配操作完成后从匹配器检索。

    与组关联的捕获输入始终是与组最近匹配的子序列。如果由于量化的缘故再次计算了组,则在第二次计算失败时将保留其以前捕获的值(如果有的话)例如,将字符串 "aba" 与表达式 (a(b)?)+ 相匹配,会将第二组设置为 "b"。在每个匹配的开头,所有捕获的输入都会被丢弃。

    (?) 开头的组是纯的非捕获 组,它不捕获文本,也不针对组合计进行计数。

    2.6         行结束符

    行结束符 是一个或两个字符的序列,标记输入字符序列的行结尾。以下代码被识别为行结束符:

    • 新行(换行)符 ('/n')
    • 后面紧跟新行符的回车符 ("/r/n")
    • 单独的回车符 ('/r')
    • 下一行字符 ('/u0085')
    • 行分隔符 ('/u2028')
    • 段落分隔符 ('/u2029)

    2.7         边界匹配器(锚字符)

    边界匹配器

    ^

    行的开头

    $

    行的结尾

    /b

    单词边界

    /B

    非单词边界

    /A

    输入的开头

    /G

    上一个匹配的结尾

    /Z

    输入的结尾,仅用于最后的结束符(如果有的话)

    /z

    输入的结尾

    例如:

    2.8         标志

    标志

    i

    执行一个不区分大小写的匹配

    g

    执行一个全局匹配。简而言之,即要找到所有的匹配,而不是找到第一个后就停止。

    m

    多行模式,^$ 除了匹配字符串的开头和结尾外还匹配每行的开头和结尾

     

    例如:查找所有java//bjava/b/gi

    3         Java正值表达式使用指南

    3.1         介绍

    正则表达式的编译表示形式。

    指定为字符串的正则表达式必须首先被编译为此类的实例。然后,可将得到的模式用于创建 Matcher 对象,依照正则表达式,该对象可以与任意字符序列匹配。执行匹配所涉及的所有状态都驻留在匹配器中,所以多个匹配器可以共享同一模式。

    因此,典型的调用顺序是

     Pattern p = Pattern.compile("a*b");
      
     Matcher m = p.matcher("aaaaab");
      
     boolean b = m.matches();
      

    在仅使用一次正则表达式时,可以方便地通过此类定义 matches 方法。此方法编译表达式并在单个调用中将输入序列与其匹配。语句

     boolean b = Pattern.matches("a*b", "aaaaab");
      

    等效于上面的三个语句,尽管对于重复的匹配而言它效率不高,因为它不允许重用已编译的模式

     

    3.2         代码实例

    3.2.1        典型调用顺序

      // 验证字符串是否为正整数或正小数

    String regEx = "^[0-9]+//.?[0-9]*$";

           Pattern pattern = Pattern.compile(regEx);

           Matcher matcher = pattern.matcher(param);

           if(!matcher.find()){

               logger.debug(message + "必须为:正整数或正小数");

           }

     

    3.2.2        split()函数

    String text = "abcdebcadxbc";  String[] tokens = text.split(".bc");

            for(String token : tokens) {

                System.out.print(token + " ");

            }

    输出:d ad

    使用.bc来作比对,由于符合的子字符串有abcebcxbc 3个,所以split()方法会使用这3个字符串为依据来作字符串分离,返回的自然就是不符合表达式.bcdad

    4         Javascript正值表达式使用指南

    JavaScriptRegExp类表示正值表达式,而StringRegExp都定义了使用正值表达式进行强大模式匹配和文本检索与替换函数。

    ECMAScript v3Javascript正值表达式进行了标准化。JavaScript 1.2实现了ECMAScript v3要求的正值表达式特性的子集,Javascript 1.5实现了完整的标准。

    Javascript正值表达式完全以Perl程序语言的正值表达式为基础。

    4.1         正则表达式在页面处理中的使用场景

    l         表单验证。验证某些域符合某种规则,例如邮件输入框必须输入的是邮件、联系电话输入框输入的必须是数字等等

    l         处理DOM模型。例如通过表达式定位DOM中的一个对象或一系列对象,一个例子就是定位id属性中含有某个特殊字符的div对象。

    l         纯编程逻辑。直接用于编程的逻辑之中。

    4.2         用于模式匹配的String方法

    String支持四种利用正值表达式的方法,

    最简单的search(),例如:”Javascirpt”.search(/script/i);

    replace()进行检索和替换。例如:text.replace(/javacript/gi), “JavaScript”);

    match是最常用的。” 1 plus 2 equals 3” .match(//d+/g) // 返回[“ 1” , “ 2” , “ 3” ]

    split可以分解为字符串数组。例如:”1,2,  3,  4, 5” .split(//s*,/s*/); // returns [“ 1” ,” 2” ,” 3” ,” 4” , “ 5” ]

    4.3         RegExp对象

    无论是字符串直接量还是正值表达式都使用了字符/表示转义序列,所以必须用//替换所有的/字符。例如:var zipCode = new RegExp(“//d{5}”, “g”);

    exec()方法在一个字符串中检索匹配。如果没有则返回null。例如:

    var pattern = /Java/g;

    var test = “JavaScript is more fun than Java!”;

    var result;

    while((reslut = pattern.exec(text)) != null) {

           alter(“mathed ‘” + result[0] + “’” + “at position “ + result.index + “;next search begins at “ + pattern.lastIndex);

    }

     

    test()比较简洁。

    var pattern = /java/I;

    pattern.test(“Javascript”); // return true

    注意:只有带g标志的正值表达式才会发生这种特殊的lastIndex行为。如果没有gexec()test()将忽略它的lastIndex

    5         常用的正则表达式

    5.1         常用匹配内容

    匹配中文字符的正则表达式: [/u4e00-/u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内)[^/x00-/xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2ASCII字符计1 匹配空白行的正则表达式:/n/s*/r 评注:可以用来删除空白行 匹配HTML标记的正则表达式:<(/S*?)[^>]*>.*?</>|<.*? /> 评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力 匹配首尾空白字符的正则表达式:^/s*|/s*$ 评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式 匹配Email地址的正则表达式:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)* 评注:表单验证时很实用 匹配网址URL的正则表达式:[a-zA-z]+://[^/s]* 评注:网上流传的版本功能很有限,上面这个基本可以满足需求 匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线)^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 评注:表单验证时很实用 匹配国内电话号码:/d-/d|/d-/d 评注:匹配形式如 0511-4405222 021-87888822 匹配腾讯QQ号:[1-9][0-9]{4,} 评注:腾讯QQ号从10000开始 匹配中国邮政编码:[1-9]/d(?!/d) 评注:中国邮政编码为6位数字 匹配身份证:/d|/d 评注:中国的身份证为15位或18 匹配ip地址:/d+/./d+/./d+/./d+ 评注:提取ip地址时有用

     

    5.2         判断数值类型

    l         "^//d+$"  //非负整数(正整数   +   0    

    l          "^[0-9]*[1-9][0-9]*$"  //正整数  包括:以0开头

    l         /^/+?[1-9][0-9]*$/   //  正整数 不能以0开头

    l            "^((-//d+)|(0+))$"  //非正整数(负整数   +   0   

    l            "^-[0-9]*[1-9][0-9]*$"  //负整数    

    l            "^-?//d+$"    //整数    

    l            "^//d+(//.//d+)?$"  //非负浮点数(正浮点数   +   0    

    l            "^(([0-9]+//.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*//.[0-9]+)|([0-9]*[1-9][0-9]*))$"  //正浮点数    

    l            "^((-//d+(//.//d+)?)|(0+(//.0+)?))$"  //非正浮点数(负浮点数   +   0    

    l           "^(-(([0-9]+//.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*//.[0-9]+)|([0-9]*[1-9][0-9]*)))$"  //负浮点数    

    l            "^(-?//d+)(//.//d+)?$"  //浮点数

     

    6         参考资料

    1.      Javascript 权威指南》第5

    2.       

    展开全文
  • 正值表达式工具,可以通过它方便写出表达式
  • 理解正值表达式

    2014-02-28 00:23:42
    最近用到了python里面的re这个library,每次用到的时候有点不明所以,所以还是搜搜资料然后写一下笔记来方便理解和使用吧。 正则表达式这个名词的意思大概就是根据...常用运算符与表达式: ^ 从开头开始匹配

    最近用到了python里面的re这个library,每次用到的时候有点不明所以,所以还是搜搜资料然后写一下笔记来方便理解和使用吧。

    正则表达式这个名词的意思大概就是根据使用规则来提取表达式,也就是说,利用约定的语法规则去提取你想要的东西

    以下是基本的一些规则,理解了规则,正则表达式就很清晰了:

    等价符: ? * + \d \w

    常用运算符与表达式:

    ^     从开头开始匹配
      ()   域段
      []     包含,默认是一个字符长度
      [^]    不包含,默认是一个字符长度
      {n,n}  匹配长度 可以缺省。
      .      任何单个字符(\. 字符点)
      |       或
      \       转义
      $      从行尾匹配
      [A-Z]    26个大写字母
      [a-z]     26个小写字母
      [0-9]    0至9数字

    [A-Za-z0-9] 26个大写字母、26个小写字母和0至9数字
      ,     分割

    + 匹配1次或更多

    * 匹配0次或更多

    ? 匹配0次或1次

    \d 数字

    \w 字母

    (?=exp)表示此位置后面可以匹配到exp

    (?<=exp)表示此位置前面可以匹配到exp

    (?!exp) 表示此位置后面不可以匹配到exp

    (?<!exp)表示此位置前面不可以匹配到exp


    展开全文
  • 正值表达式上不太懂如何选择,尤其是看代码上,往往很难选择正确的表达式(格式:变量名=“<XXXXXXX="(.*?)">”), 代码举例: &...
  • ORACLE 正值表达式

    2009-09-13 13:17:00
    ORACLE终于在10G中提供了对正则...ORACLE中的支持正则表达式的函数主要有下面四个:1,REGEXP_LIKE :LIKE的功能相似2,REGEXP_INSTR :INSTR的功能相似3,REGEXP_SUBSTR :SUBSTR的功能相似4,REGEXP_REPLACE
  • 正值表达式集锦

    2013-11-15 16:04:45
    1. 匹配中文 ^([\u4e00-\u9fa5]{2,4}),([\u4e00-\u9fa5]{1,10}),([\u4e00-\u9fa5]{1,6})$
  • 正值表达式 正则表达式元字符 《1》. 除\n任何的单个字符 《2》 [] 表示中间的任意一个字符如a[0-9 a-z]b → a9b 《3》 | 或 z|hello 表示z或者是hello,而不是zello或者hello→(z|h)ello 《4》 ()改变...
  • ultraedit 正值表达式

    2010-11-11 18:10:02
    1,替换 - 保留原字符部分 如:#dept# 要替换成 &lt;!--#dept#--&gt; 可用: ...2,删除空行: 替换 %[ ^t]++^p 为 空串 3,删除行尾空格: 替换 [ ^t]+$ 为 空串 4,删除行首空格: 替换 %[ ^t]+ 为 空串 .....
  • 正值表达式匹配中文

    2016-03-17 17:16:34
    /^[\x{4e00}-\x{9fa5}A-Za-z0-9_]{2,16}$/u 允许中文数字字母
  • 一些正值表达式

    2007-11-16 19:30:00
    google_ad_client = "pub-5033576919944123";google_ad_width = 728;google_ad_height = 90;google_ad_format = "728x90_as";google_ad_type = "text_image";//2007-10-24: csdn.bloggoogle_ad_channe
  • package HelloWorld; import java.util.regex.Matcher; import java.util.regex.Pattern; public class HelloWorld { public static void main(String[] args) { Pattern r=Pattern.compile("(\\...谢谢了
  • 【PHP正值表达式教程】

    千次阅读 2012-01-26 15:21:56
    正则表达式简介 在某些应用中,往往有时候需要根据一定的规则来匹配(查找)确认一些字符串,如要求用户输入的 QQ 号码为数字且至少 5 位。用于描述这些规则的工具就是正则表达式。 最简单的匹配 最简单的匹配...
  • 目前有一串字符串,字符串的值为 ... 现在上述字符串中有C40005,C40006,C40008是数据库表的ID,然后...格式之后的表达式为:([GSM_HTTP]NAME_ONE+[GSM_HTTP]NAME_TWO)/[GSM_VOICE]NAME_THREE 求大神帮忙解决,谢谢
  • [Oracle笔记]正值表达式搜索

    千次阅读 2014-03-11 20:12:10
    方括号表达式指定一匹配列表,该列表匹配列表中显示的任何表达式。非匹配列表达式以 ^ 开始,指定一个列表,除了列表中的显示的表达式,该列表可以匹配任何字符 () 分组表达式,看作单个子 ...
  • //判断是否为中文字符串 plic function matchChinese(word:String):void { var pattern:RegExp =/[\一-\龥]/; if(pattern.test(word)){ emailResult.text="right"...
  • 正值表达式匹配html标签的属性值正则表达式是做文本解析工作必不可少的技能。如Web服务器日志分析,网页前端开发等。很多高级文本编辑器都支持正则表达式的一个子集,熟练掌握正则表达式,经常能够使你的一些工作...
  • //str字符串与正值表达式运用布尔类型进行判断 if(aa==true){ System.out.println(str+":手机号码合法"); } aa=str1.matches(sj); //str1字符串与正值表达式运用布尔类型进行判断 if(aa==false){ System.out....

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 9,718
精华内容 3,887
关键字:

与正值表达式