精华内容
下载资源
问答
  • Java去掉标点符号的方法
    千次阅读
    2019-04-02 18:53:57
    String str ="1,2,3.45";
    str = str.replaceAll( "[\\pP+~$`^=|<>~`$^+=|<>¥×]" , "");
    
    更多相关内容
  • 主要给大家介绍了关于java去除空格、标点符号的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  • java标点符号

    2021-02-12 13:53:50
    使用inputsteamreader bufferreader之类,指定字符集,就能读取出字符了,一般不会自行判断要读多少个字节才是一个字符######...######在 Java 语言中,用字节流读取数据,不需要事先判断 "是应该单字节读取,还是双...

    使用inputsteamreader bufferreader之类,指定字符集,就能读取出字符了,一般不会自行判断要读多少个字节才是一个字符######确实如此,不需要事先判断。 一个一个地读到文档结尾(EOF), 就终止读取操作。再将已得到的字节数据,通过给定的字符编码(字符集),就能转换成所要的字符。######

    在 Java 语言中,用字节流读取数据,不需要事先判断 "是应该单字节读取,还是双字节读取,或者是3字节读取以及4字节读取...."。事实上,字节流是依次逐个读取字节的。 如下案例说明以上事实。

    已知两个文档 hello.txt 和 hello1.txt 的内容分别是:"hello world!" 和 "世界, 你好!"。  调用 FileInputStream 的 int read() 方法,依次读取两个文档。从头读取每个文档的时候,按字节依次读取,一旦读取到文档结尾(EOF), 被调用的方法 read() 便返回 整形数 -1,显示读取数据的任务完成。Java 使用 UNICODE (汉字占2个字节,ASCII 码所包括的字符,如英文字母,标点符号,空格,占1个字节) 进行"翻译"。结果显示, 从文档 hello.txt 中, 读取到12个字节。从文档 hello1.txt 中, 读取到11个字节。

    import java.io.*;

    public class Test_Input {

    static void test(String f) throws IOException{

    FileInputStream fin = new FileInputStream(f);

    byte[] buffer = new byte[1024];

    int len=0;

    byte b =(byte) fin.read();

    while (b!= -1){

    buffer[len++]=b;

    b =(byte) fin.read();

    }

    String str = new String(buffer,0,len);

    System.out.println(str);

    System.out.println("从文档\" " + f + " \" 中读取到: " + len + "个字节。");

    fin.close();

    }

    public static void main(String[] args) throws IOException{

    test("hello.txt");

    test("hello1.txt");

    }

    }

    cmd:

    D:\java\test\OS_China\InputStream>javac Test_Input.java

    D:\java\test\OS_China\InputStream>java Test_Input

    hello world!

    从文档" hello.txt " 中读取到: 12个字节。

    世界, 你好!

    从文档" hello1.txt " 中读取到: 11个字节。

    ######

    如果已知字节流是纯文本,搞清楚字符集,按byte[]读取,再传给new String(bytes, charset)转换成文本就可以,如:

    String s = new String(byteBuffer.array(), StandardCharsets.UTF_8);

    如果不知道不是纯文本,要搞清楚内容是由什么组成的,按类型逐段读取(如byteBuffer.getInt()),需要注意的是C语言表达数值通常是大端序的,而java通常是小端序,可以通过"Integer.reserveBytes(value)"来转换(Integer替换成对应的Long、Double等类型)

    展开全文
  • 本篇文章主要介绍了Java判断中英文符号标点的实现,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
  • Java 判断中文及标点符号

    千次阅读 2020-04-26 10:40:00
    Java Character 实现Unicode字符集介绍 CJK中文字符和中文标点等判断。此外,该类提供了用于确定字符的分类的几种方法(小写字母,数字,等)和由大写转换为小写字符,反之亦然。 Unicode中文范围参考文章:...

           开发中需要判断某个字符或者字符串是中文还是英文,从而做相应的处理,大多数会用到正则来判断的,其实也可以使用 Java 来判断。

    Java Character 实现Unicode字符集介绍  CJK中文字符和中文标点等判断。此外,该类提供了用于确定字符的分类的几种方法(小写字母,数字,等)和由大写转换为小写字符,反之亦然。

        Unicode中文范围参考文章:http://www.iteye.com/topic/558050

    汉字:[0x4e00,0x9fa5](或十进制[19968,40869])

    数字:[0x30,0x39](或十进制[48, 57])

    小写字母:[0x61,0x7a](或十进制[97, 122])

    大写字母:[0x41,0x5a](或十进制[65, 90])

    在Java中,主要使用 Character类处理字符有关功能,Character 类中有3个静态内部类:

    UnicodeBlock 与 UnicodeScript 关系:

    1、UnicodeScript实现是在Java 7中新引入,UnicodeScript 是从语言书写规则层次对Unicode字符的分类,

    2.、在一个 UnicodeScript中的字符可能分散在多个UnicodeBlock中;

    3.、一个 UnicodeBlock中的字符可能会被划进多个UnicodeScript中。

    中文的标点符号主要存在于以下5个UnicodeBlock中:

    • U2000-General Punctuation (百分号,千分号,单引号,双引号等)
    • U3000-CJK Symbols and Punctuation ( 顿号,句号,书名号,〸,〹,〺 等;PS: 后面三个字符你知道什么意思吗? : )    )
    • UFF00-Halfwidth and Fullwidth Forms ( 大于,小于,等于,括号,感叹号,加,减,冒号,分号等等)
    • UFE30-CJK Compatibility Forms  (主要是给竖写方式使用的括号,以及间断线﹉,波浪线﹌等)
    • UFE10-Vertical Forms (主要是一些竖着写的标点符号,    等等)

    编写的工具类和测试代码如下:

    import java.util.regex.Pattern;
    
    /**
     * @Description: 判断中文(汉字和标点符号)与英文工具类
     * @Date: 2020-04-24 15:43
     * @Version: V1.0
     */
    public class ChineseAndEnglishUtils {
        private ChineseAndEnglishUtils() {
        }
    
        /**
         * 使用UnicodeBlock方法判断是否存在中文(包括汉字, 标点符号判断)
         *
         * @param str
         * @return true-存在,false-不存在
         */
        public static boolean checkChinesePunctuationByScript(String str) {
            if (str == null) {
                return false;
            }
            char[] chars = str.toCharArray();
            for (char aChar : chars) {
                if (isChineseByScript(aChar)) {
                    return true;
                }
            }
            return false;
        }
    
        /**
         * 使用UnicodeScript方法判断是否存在中文(包括汉字, 标点符号判断)
         *
         * @param str
         * @return true-存在,false-不存在
         */
        public static boolean checkChinesePunctuationByBlock(String str) {
            if (str == null) {
                return false;
            }
            char[] chars = str.toCharArray();
            for (char aChar : chars) {
                if (isChineseByBlock(aChar)) {
                    return true;
                }
            }
            return false;
        }
    
        /**
         * 使用Unicode编码范围来判断是否存在汉字, 标点符号不做判断
         *
         * @param str
         * @return true-存在,false-不存在
         */
        public static boolean checkChineseByUnicodeRange(String str) {
            if (str == null) {
                return false;
            }
            String regEx = "[\\u4e00-\\u9fa5]+";
            Pattern pattern = Pattern.compile(regEx);
            return pattern.matcher(str.trim()).find();
        }
    
        /**
         * 使用UnicodeBlock方法判断是否存在汉字, 标点符号不做判断
         *
         * @param c
         * @return true-存在,false-不存在
         */
        public static boolean isChineseByBlock(char c) {
            Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
            if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
                    || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
                    || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B
                    || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_C
                    || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_D
                    || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
                    || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS_SUPPLEMENT) {
                return true;
            } else {
                return false;
            }
        }
    
        /**
         * 使用UnicodeScript方法判断是否存在汉字, 标点符号不做判断
         *
         * @param c
         * @return true-存在,false-不存在
         */
        public static boolean isChineseByScript(char c) {
            Character.UnicodeScript sc = Character.UnicodeScript.of(c);
            if (sc == Character.UnicodeScript.HAN) {
                return true;
            }
            return false;
        }
    
        /**
         * 根据UnicodeBlock方法判断中文标点符号
         *
         * @param c
         * @return true-存在,false-不存在
         */
        public static boolean isChinesePunctuation(char c) {
            Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
            if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
                    || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
                    || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS
                    || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_FORMS
                    || ub == Character.UnicodeBlock.VERTICAL_FORMS) {
                return true;
            } else {
                return false;
            }
        }
    
    
        public static void main(String[] args) {
            System.out.println("=====使用Unicode编码范围来判断是否存在汉字, 标点符号不做判断======");
            System.out.println("abc中国,.d==" + checkChineseByUnicodeRange("abc中国,.d"));
            System.out.println("abc中d==" + checkChineseByUnicodeRange("abc中d"));
            System.out.println("abc,.d==" + checkChineseByUnicodeRange("abc,.d"));
    
            System.out.println("=====使用UnicodeBlock方法判断是否存在中文(包括汉字, 标点符号判断)=====");
            System.out.println("abc中国,.d==" + checkChinesePunctuationByBlock("abc中国,.d"));
            System.out.println("abc中d==" + checkChinesePunctuationByBlock("abc中d"));
            System.out.println("abc,.d==" + checkChinesePunctuationByBlock("abc,.d"));
    
            System.out.println("=====使用UnicodeScript方法判断是否存在中文(包括汉字, 标点符号判断)=====");
            System.out.println("abc中国,.d==" + checkChinesePunctuationByScript("abc中国,.d"));
            System.out.println("abc中d==" + checkChinesePunctuationByScript("abc中d"));
            System.out.println("abc,.d==" + checkChinesePunctuationByScript("abc,.d"));
    
            System.out.println("=====根据UnicodeBlock方法判断中文标点符号=====");
            System.out.println(".==" + isChinesePunctuation('.'));
            System.out.println("。==" + isChinesePunctuation('。'));
        }
    
    }
    

         

    ends~

    展开全文
  • Java后台处理标点符号转义

    千次阅读 2020-05-14 15:34:19
    Java后台处理标点符号转义 可以借助以下工具类:

    Java后台处理标点符号转义


    1.问题
    前端传来的特殊标点符号,后台接收时被转义了,例如:………………被转义成

    &hellip;&hellip;&hellip;&hellip;&hellip;&hellip;&hellip;&hellip;&hellip;
    

    2.方法
    可以借助以下工具类:
    在这里插入图片描述

    展开全文
  • java中点符号的用法

    千次阅读 2021-03-11 17:13:06
    } 图 2.4 6、 其他运算符以上是常见的分类运算符,在Java中还有一些特殊 的运算符,如表10所示。 表10 其他运算符符号 功能 () (参数表) (类型) . [......[java] view plaincopy 1. package com.zf.binary; 2. 3. 4. ...
  • Java案例 package sentencedeal; public class Test { public static void main(String[] args) { String line = "I ordered this ? because my original battery ! cover to my. droid x2"; String[] aft
  • //过滤半角全角 具体标点符号 public static String InteorInfo(Stirng str){ char [] charArray = str.toCharArray(); String info =""; for (int i =0;i<charArray.length;i++){ Stirng temp=String....
  • 但是下游对接的其他系统,在将这个字段应用到系统中的时候,不能支持全角的标点符号,如果这个字段有全角标点符号,则系统会出错。 看到这个问题,我首先觉得下游对接的系统也是奇葩,居然还不支持全角的字符串。...
  • java编程实现反转字符串单词,但不改变标点符号的位置,简单易懂
  • // s]”匹配所有标点符号和空格。示例importjava.util.Scanner;importjava.util.regex.Matcher;importjava.util.regex.Pattern;publicclassTest{publicstaticvoidmain(Stringargs[]){Stringinput="T...
  • java正则匹配标点符号

    2021-03-16 11:12:20
    字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标 字符 点符号,空格,换行符,汉字等等。字符串 0 个或更多个字符的序列。 ...正则表达式 Regular Expressions (Regex) 北京外国语大学中国外语教育研究中心...
  • Java符号常量

    2021-02-26 11:57:52
    使用final定义符号常量 符号常量:NUM、PI在这个例子中,使用符号的好处是:如果此时要将圆周率3.14的值修改为3.14159,如果没有使用符号常量,那么至少要修改两次PI的地方,而现在定义了符号常量PI,只要PI一个位置...
  • So I'm completely new to regular expressions, and I'm trying to use Java's java.util.regex to find punctuation in input strings. I won't know what kind of punctuation I might get ahead of time, except...
  • 主要是实现针对内容文本字符串的逻辑的java工具类 前言 替换全角空格 需要替换的公共特殊符号 将中文标点符号替换为相应的英文标点符号,并去除多余空格 ...去除标题末尾指定标点符号(保留部分特殊标点符号
  • P:标点字符 L:字母; M:标记符号(一般不会单独出现); Z:分隔符(比如空格、换行等); S:符号(比如数学符号、货币符号等); N:数字(比如阿拉伯数字、罗马数字等); C:其他字符 ...
  • 用户的输入可能风格迥异,最常见的可能算是夹杂各种标点符号的输入了。怎样过滤?在csdn论坛上面看到一贴,综合了一下,得到了下面的正则表达式,也许会帮助你解决问题:\\pP|\\pS我们用一个例子演示此正则表达式...
  • ", **"'He"**, "is", **"right'"**, "said", "I", "."} 我有多余的""一次报价符号前,它不会分裂“从单词。 结果,我想: {"Hallo", ",", "I'm", "a", "dog", ".", "The", "end", ".", "Someone", "said", ":", """ ...
  • java实现含有英文字符串的符号替换为中文符号,在网上看了一些都没有详细的实现方式,看了这个就不用去摸索了,看了就会用了,下次有碰到这方面的,同样中文特殊符号转换为英文符号类似的逻辑
  • 较难的部分(至少对我来说)是,我必须排除所有标点符号,例如我,我会以逗号的形式出现,意为排除为字符。我的讲师说这一点的代码应该工作str = str.replaceAll("[^A-Za-z]", "");但问题是我不知道如何将它整合到...
  • import java.io.*;public class Test{public static void main(String[] args) throws Exception{BufferedReader br = new BufferedReader(new InputStreamReader(System.in));String str = br.readLine();if(str ==...
  • java判断标点符号问题

    万次阅读 2016-11-23 10:00:58
    原文地址:...   方法一:  写正则表达式 Pattern patPunc =  Pattern.compile("[`~!...如果要判断字符串最后一个字符是否为标点符号则可以在最后加上$符号: Pattern patPunc =  Patte
  • Java】切换标点符号

    2017-01-26 18:50:20
    public class Test{ public static void main... System.out.println("请输入你要提交的java文件名称:"); Scanner input=new Scanner(System.in); String filename=input.next(); StringBuffer file=new S
  • packageorg.analysisitem20181016.test;public classCode128Test2019052201 {public static final String UNICODE_PREFIX = "\\u";public static voidmain(String[] args) {String testStr= "丽塔·洛丝薇瑟";...
  • java中使用正则匹配所有标点符号

    千次阅读 2018-12-07 10:44:43
    if (endStr.matches(&quot;[\\pP\\p{Punct}]&quot;))
  • 给定如下所示的字符串,请通过正则表达式删除所有前导和尾随的标点符号:String a ="!?Don't.;, .:delete !the@ $actual string%";String b ="Hyphenated-words, too!";我知道正则表达式[ P {Alnum}]会以所有非字母...
  • java正则表达式替换所有标点符号

    千次阅读 2018-07-04 21:12:19
    对字符串中的各种标点符号进行过滤: public class Test { public static void main(String[] args) { String s = ":\\\\/.&amp;*(()/*`~?&lt;|{:。}&gt;-,';][=-!#$%^&amp;*+@\\"; s...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 142,386
精华内容 56,954
关键字:

java 标点符号

java 订阅