精华内容
下载资源
问答
  • java去分隔符的三种方法

    千次阅读 2017-02-27 10:34:25
    如果出现在一个模式中,用货币十进制分隔符代  替十进制分隔符。  X 前缀或后缀中使用的任何其它字符,用来引用前缀或后缀中的特殊字符。  例子:  DecimalFormat df1 = new DecimalFormat...

    对字符串进行处理,使用

    方法一:

    String str = "1,000";
    str = str.Replace(",","");

    方法二:

    String str = "100,000,000";

    String str1 = "";
    String[] a = str.Split(',');
    for (int i = 0; i <= a.Length-1; i++) {
    str1 += a[i];

    }

    方法三:

    使用 DecimalFormat

    实现按你想要的格式进行格式化

    学习请往下看
    --------------------------


    DecimalFormat 是 NumberFormat 的一个具体子类,用于格式化十进制数字。

    DecimalFormat 包含一个模式 和一组符号 


    符号含义: 

    0 一个数字 

    # 一个数字,不包括 0 

    . 小数的分隔符的占位符 

    , 分组分隔符的占位符 

    ; 分隔格式。 

    - 缺省负数前缀。 

    % 乘以 100 和作为百分比显示 

    ? 乘以 1000 和作为千进制货币符显示;用货币符号代替;如果双写,用 

    国际货币符号代替。如果出现在一个模式中,用货币十进制分隔符代 

    替十进制分隔符。 

    X 前缀或后缀中使用的任何其它字符,用来引用前缀或后缀中的特殊字符。 

    例子: 

    DecimalFormat df1 = new DecimalFormat("0.0"); 

    DecimalFormat df2 = new DecimalFormat("#.#"); 

    DecimalFormat df3 = new DecimalFormat("000.000"); 

    DecimalFormat df4 = new DecimalFormat("###.###"); 

    System.out.println(df1.format(12.34)); 

    System.out.println(df2.format(12.34)); 

    System.out.println(df3.format(12.34)); 

    System.out.println(df4.format(12.34)); 

    结果: 

    12.3 

    12.3 

    012.340 

    12.34

    展开全文
  • 详解hive的列分隔符和行分隔符的使用

    万次阅读 多人点赞 2018-05-13 10:42:40
    一般导入的文本数据字段分隔符多为逗号分隔符或者制表符(但是实际开发中一般不用着这种容易在文本内容中出现的的符号作为分隔符),当然也有一些别的分隔符,也可以自定义分隔符。有时候也会使用hive默认的分隔符来...

          hive中在创建表时,一般会根据导入的数据格式来指定字段分隔符和列分隔符。一般导入的文本数据字段分隔符多为逗号分隔符或者制表符(但是实际开发中一般不用着这种容易在文本内容中出现的的符号作为分隔符),当然也有一些别的分隔符,也可以自定义分隔符。有时候也会使用hive默认的分隔符来存储数据。

    hive (fdm_sor)> create table fdm_sor.mytest_tmp2(
                  >  id int comment'编号',
                  >  name string comment '名字'
                  >  );
    hive (fdm_sor)> show create table mytest_tmp2;
    CREATE  TABLE `mytest_tmp2`(
      `id` int COMMENT '编号', 
      `name` string COMMENT '名字')
    ROW FORMAT SERDE 
      'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' --hive默认的分割方式,即行为\n,列为^A
    STORED AS INPUTFORMAT 
      'org.apache.hadoop.mapred.TextInputFormat'    --hive默认的存储格式为textfile
    OUTPUTFORMAT 
      'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
    LOCATION                                    --内部表的默认的存储路径
      'hdfs://hadoop102:9000/user/hive/warehouse/fdm_sor.db/mytest_tmp2'
    TBLPROPERTIES (
      'transient_lastDdlTime'='1526176805')
    hive (fdm_sor)> create table  fdm_sor.mytest_tmp3(
                  >   id int comment'编号',
                  >  name string comment '名字'
                  >  )
                  >  row format delimited fields terminated by '\001'  --这里可以指定别的分隔符,如‘\t’,'$'等分隔符
                  >  lines terminated by '\n'
                  >  stored as textfile;
    
    hive (fdm_sor)> show create table fdm_sor.mytest_tmp3;
    OK
    createtab_stmt
    CREATE  TABLE `fdm_sor.mytest_tmp3`(
      `id` int COMMENT '编号', 
      `name` string COMMENT '编号')
    ROW FORMAT DELIMITED 
      FIELDS TERMINATED BY '\u0001' 
      LINES TERMINATED BY '\n' 
    STORED AS INPUTFORMAT 
      'org.apache.hadoop.mapred.TextInputFormat' 
    OUTPUTFORMAT 
      'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
    LOCATION
      'hdfs://hadoop102:9000/user/hive/warehouse/fdm_sor.db/mytest_tmp3'
    TBLPROPERTIES (
      'transient_lastDdlTime'='1526176859')
    

           如上可以看出hive默认的列分割类型为org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe,而这其实就是^A分隔符,hive中默认使用^A(ctrl+A)作为列分割符,如果用户需要指定的话,等同于row format delimited fields terminated by '\001',因为^A八进制编码体现为'\001'.所以如果使用默认的分隔符,可以什么都不加,也可以按照上面的指定加‘\001’为列分隔符,效果一样。

           hive默认使用的行分隔符是'\n'分隔符 ,也可以加一句:LINES TERMINATED BY '\n' ,加不加效果一样。但是区别是hive可以通过row format delimited fields terminated by '\t'这个语句来指定不同的分隔符,但是hive不能够通过LINES TERMINATED BY '$$'来指定行分隔符,目前为止,hive的默认行分隔符仅支持‘\n’字符。否则报错。

    hive (fdm_sor)>  create table  fdm_sor.mytest_tm4(
                  >   id int comment'编号',
                  >  name string comment '名字'
                  >  )
                  >  lines terminated by '\t';
    FAILED: ParseException line 5:1 missing EOF at 'lines' near ')'

           一般来说hive的默认行分隔符都是换行符,如果非要自定义行分隔符的话,可以通过自定义Inputformat和outputformat类来指定特定行分隔符和列分隔符,一般公司实际开发中也都是这么干的,具体使用,见后面博客。

           当然如hive中集合数据类型struct ,map,array,也都有默认的字段分隔符,也都可以指定字段分隔符。hive中对于上述三个集合数据类型的默认字段分隔符是^B,八进制体现为‘\002’,用collection items terminated by '\002'语句来指定分隔符,对于map来说,还有键值之间的分割符,可以用map keys terminated by  '\003'(^C)来指定分隔符。

    展开全文
  • hive的列分隔符和行分隔符的使用

    千次阅读 2020-10-25 22:33:43
    array、struct的元素间的分隔符,map的键值对与键值对间分隔符 \002 ^C map中键与值之间的 分隔符\003 二、分隔符的指定与使用 hive中在创建表时,一般会根据导入的数据格式来指定字段分隔符和列分隔符。...

    目录

     

    一、Hive中默认的分割符如下

     二、分隔符的指定与使用

    三、建好表之后更改字段分隔符


    一、Hive中默认的分割符如下

    分隔符 描述
    \n 行分隔符
    ^A 字段分隔符 \001
    ^B array、struct的元素间的分隔符,map的键值对与键值对间分隔符 \002
    ^C map中键与值之间的 分隔符\003

     二、分隔符的指定与使用

    hive中在创建表时,一般会根据导入的数据格式来指定字段分隔符和列分隔符。一般导入的文本数据字段分隔符多为逗号分隔符或者制表符(但是实际开发中一般不用着这种容易在文本内容中出现的的符号作为分隔符),当然也有一些别的分隔符,也可以自定义分隔符。有时候也会使用hive默认的分隔符来存储数据。

    hive (fdm_sor)> create table fdm_sor.mytest_tmp2(
                  >  id int comment'编号',
                  >  name string comment '名字'
                  >  );
    
    hive (fdm_sor)> show create table mytest_tmp2;
    CREATE  TABLE `mytest_tmp2`(
      `id` int COMMENT '编号', 
      `name` string COMMENT '名字')
    ROW FORMAT SERDE 
      'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' --hive默认的分割方式,即行为\n,列为^A
    STORED AS INPUTFORMAT 
      'org.apache.hadoop.mapred.TextInputFormat'    --hive默认的存储格式为textfile
    OUTPUTFORMAT 
      'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
    LOCATION                                    --内部表的默认的存储路径
      'hdfs://hadoop102:9000/user/hive/warehouse/fdm_sor.db/mytest_tmp2'
    TBLPROPERTIES (
      'transient_lastDdlTime'='1526176805')
    
    
    hive (fdm_sor)> create table  fdm_sor.mytest_tmp3(
                  >   id int comment'编号',
                  >  name string comment '名字'
                  >  )
                  >  row format delimited fields terminated by '\001'  --这里可以指定别的分隔符,如‘\t’,'$'等分隔符
                  >  COLLECTION ITEMS TERMINATED BY '\002'  -- 集合间的分隔符
                  >  MAP KEYS TERMINATED BY '\003'          -- Map键与值之间的分隔符
                  >  LINES TERMINATED BY '\n'               -- 行分隔符  
                  >  stored as textfile;                    -- 存储格式为textfile
     
    
    hive (fdm_sor)> show create table fdm_sor.mytest_tmp3;
    OK
    createtab_stmt
    CREATE  TABLE `fdm_sor.mytest_tmp3`(
      `id` int COMMENT '编号', 
      `name` string COMMENT '编号')
    ROW FORMAT DELIMITED 
      FIELDS TERMINATED BY '\u0001' 
      LINES TERMINATED BY '\n' 
    STORED AS INPUTFORMAT 
      'org.apache.hadoop.mapred.TextInputFormat' 
    OUTPUTFORMAT 
      'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
    LOCATION
      'hdfs://hadoop102:9000/user/hive/warehouse/fdm_sor.db/mytest_tmp3'
    TBLPROPERTIES (
      'transient_lastDdlTime'='1526176859')

    如上可以看出hive默认的列分割类型为org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe,而这其实就是^A分隔符,hive中默认使用^A(ctrl+A)作为列分割符,如果用户需要指定的话,等同于row format delimited fields terminated by '\001',因为^A八进制编码体现为'\001'.所以如果使用默认的分隔符,可以什么都不加,也可以按照上面的指定加‘\001’为列分隔符,效果一样。

           hive默认使用的行分隔符是'\n'分隔符 ,也可以加一句:LINES TERMINATED BY '\n' ,加不加效果一样。但是区别是hive可以通过row format delimited fields terminated by '\t'这个语句来指定不同的分隔符,但是hive不能够通过LINES TERMINATED BY '$$'来指定行分隔符,目前为止,hive的默认行分隔符仅支持‘\n’字符。否则报错。

    
    hive (fdm_sor)>  create table  fdm_sor.mytest_tm4(
                  >   id int comment'编号',
                  >  name string comment '名字'
                  >  )
                  >  lines terminated by '\t';
    FAILED: ParseException line 5:1 missing EOF at 'lines' near ')'

     一般来说hive的默认行分隔符都是换行符,如果非要自定义行分隔符的话,可以通过自定义Inputformat和outputformat类来指定特定行分隔符和列分隔符,一般公司实际开发中也都是这么干的,具体使用,见后面博客。

           当然如hive中集合数据类型struct ,map,array,也都有默认的字段分隔符,也都可以指定字段分隔符。hive中对于上述三个集合数据类型的默认字段分隔符是^B,八进制体现为‘\002’,用collection items terminated by '\002'语句来指定分隔符,对于map来说,还有键值之间的分割符,可以用map keys terminated by  '\003'(^C)来指定分隔符。

    三、建好表之后更改字段分隔符

    alter table xxx set SERDEPROPERTIES('field.delim'='\t');

     

    展开全文
  • Java分隔符

    万次阅读 多人点赞 2019-09-28 22:31:22
    空格、逗号、分号以及行结束符都被称为分隔符,规定任意两个相邻标识符、数字、保留字或语句之间必须至少有一个分隔符,以便程序编译时能够识别。 分类 ; 分号 用来终止一个语句 {} 花括号、大括号 用来包括自动...

    定义

    • 空格、逗号、分号以及行结束符都被称为分隔符,规定任意两个相邻标识符、数字、保留字或语句之间必须至少有一个分隔符,以便程序编译时能够识别。

    分类

    • ; 分号 用来终止一个语句
    • {} 花括号、大括号 用来包括自动初始化的数组的值,也用来定义程序块、类、方法以及局部范围
    • [] 方括号、中括号 用来声明数组的类型,也用来表示撤消对数组值的引用
    • , 逗号 在变量声明中,区分变量说明的各个变量。在for控制语句中,用来将圆括号内的语句连接起来
    • . 原点 用来将软件包的名字与它的子包或类分隔。也用来将引用变量与变量或方法分隔
    • () 圆括号 在定义和调用方法时用来容纳参数表。在控制语句或强制类型转换组成的表达式中用来表示执行或计算的优先权

    注意事项

    • 必须都是半角下的英文符号。
    展开全文
  • Hive的列分隔符和行分隔符

    千次阅读 2020-04-13 12:14:05
    在创建Hive表时,默认行分隔符"^A",列分隔符"\n",这两项也是可以设置的。在实际开发中,一般默认使用默认的分隔符,当然有些场景下也会自定义分隔符。 创建表1: spark-hive use test_db; # 创建外部表 CREATE...
  • 【python】输出列表元素,以空格/逗号为分隔符

    万次阅读 多人点赞 2017-08-12 19:34:00
    输出列表元素,以空格/逗号为分隔符
  • /* * File 操作系统中的文件(file),文件夹(directory),路径(path)封装成File对象 * File与系统无关的类 ...路径分隔符 * windows中分号";",Linux中冒号":"而这个静态方法会根...
  • awk 的分隔符

    2019-07-16 11:21:17
    awk 分隔符的使用: 1.awk -F分隔符 2.是用分隔符变量 awk -v FS='分隔符' 3.输出分隔符变量 awk -v OFS='分隔符' 4.输出变量用','分割后将割开显示 awk '{print $1,$2}' 5.输出变量用' '分割后将连接显示 awk...
  • 大数据文件分隔符

    万次阅读 2015-12-18 10:14:19
    hadoop 文件分隔符
  • 一、File类定义的字段路径分割符 String ps = File.pathSeparator;...名称(文件分隔符) String sp = File.separator; System.out.println(sp); System 类 时间戳: currentTimeMillis ① 时间戳 ② 模拟sleep pu
  • QT路径分隔符

    千次阅读 2018-09-04 20:03:56
    作为通用的路径分隔符和URL路径分隔符。如果在程序中使用"/"作为目录分隔符,qt会将其自动转换为符合底层操作系统的分隔符(Linux使用"/",Windows使用"\")。...
  • Hive分隔符

    千次阅读 2019-02-13 17:16:53
    然而,这两种文件格式有一个共同的缺点,那就是用户需要对文本文件中那些不需要作为分隔符处理的逗号或者制表符格外小心。也因此,Hive默认使用了几个控制字符,这些字符很少出现在字段值中。Hive使用术语field来...
  • mysql分隔符

    千次阅读 2019-03-23 18:33:19
    DAY 2 今天在创建存储过程时遇到了不大能理解的问题 CREATE PROCEDURE ...本来不大理解什么叫分隔符,操作一下突然就明白了,MySQL默认分隔符为;,碰到就自动执行了,但是这里必须有2个分号,就需要把分隔符...
  • 问题引入 ubuntu下执行如下指令,无法分隔校验值 # sha256sum .viminfo | cut ... 这是由于cut的默认分隔符是Tab键,而非空格,所以才会导致分隔失败 正确指令如下: # sha256sum .viminfo | cut -f1 -d " " ...
  • 不同系统平台下的行分隔符、路径分隔符等常常不同,如何在Java程序获取当前平台的分隔符,以及其他系统相关的状态呢?下面是示例程序,需要的朋友可以参考下 【问题】 不同系统平台下的行分隔符、路径分隔符等常常...
  • 在使用如左图插件来生成文本文件时,往往需要用到分隔符来区分列内容,通过情况下的键盘上可以看到的特殊字符就可以当作通用的分隔符了,如 |;, |^ 等等;  但如果以上情形还不满足的话,可以考虑用ASCII码中的...
  • awk字段分隔符

    千次阅读 2015-04-14 19:55:22
    输入字段分隔符:awk的内置变量FS中保存了输入字段分隔符的值。使用FS的默认值时,awk用空格或制表符来分隔字段,并且删除各字段前多余的空格或制表符。可以通过在BEGIN语句中或命令行上赋值来改变FS的值。接下来...
  • python逗号分隔符 什么是质数? (What is a prime number?) Many times, while writing the code we need to print the large number separated i.e. thousands separators with commas. 很多时候,在编写代码时,...
  • awk 不一样的分隔符 - 空格分隔符

    千次阅读 2020-06-24 11:30:16
    -F " " 做为分隔符的时候,每行只有 2 个字段,而通过 -F "[ ]" 做分隔符的时候,每行共有 6 个字段。$1-$5 获取的值为空,而 $6 确打印了全部内容。 查看 awk 手册: 4.5.1 Whitespace Normally Separates ...
  • HIVE更改默认分隔符

    千次阅读 2019-07-16 15:32:21
    大家都知道,hive是通过映射hdfs上的结构化文件...array、struct的元素间的分隔符,map的键值对与键值对间分隔符 \002 ^C map中键与值之间的 分隔符\003 一、建表时指定 CREATE EXTERNAL TABLE `dw_ads.ads_te...
  • 又是一个难懂的标题,上例子吧,比如一个字符串,‘abc,1344,343,13as,33,343’,这个字符串都是用','分隔的,现在想截取第四个逗号前边所有的内容,方法如下: CREATE FUNCTION [dbo].[Get_StrArrayStrOfIndex] ...
  • 分隔符(空白符)就是各种不可见字符的集合,如空格(\u0020)、水平制表符(\u0009)、垂直制表符(\u000B)、换页符(\u000C)、不中断空白(\u00A0)、字节序标记(\uFEFF)、换行符(\u000A)、 回车符(\u000D...
  • csv分隔符

    千次阅读 2019-06-04 17:33:00
    有时候我们拿到的csv文件,里面密密麻麻很多数据,只有行没有列,每一项用【|】符合或者【,】分开,看得特别费劲。如何把它展示成一行一列... 分隔符 转载于:https://www.cnblogs.com/LisaJ/p/10974930.html...
  • Java文件分隔符

    千次阅读 2018-12-12 15:32:19
     指的是文件路径的分隔符,例如Linux/Mac OS 中,文件路径:‎⁨/home/usr 中的"/",或者Windows系统文件路径C:\Program Files\backup 中的"\" File.pathSeparatorChar  指的是用来分隔连续...
  • wps分隔符快捷键

    千次阅读 2019-02-26 15:24:39
    ,敲回车后就可以快速绘制出波浪线分隔符。 输入“###”(shift+3),我们按回车就会绘制出三条直线的分隔符,中间还是实线呢 输入“&amp;&amp;&amp;”(shift+7),按回车就可以绘制出带阴影效果的...
  • csv 分隔符修改

    2020-11-17 14:17:42
    一份数据文件,要保存为 excel 文件时,发现格式没有分列,发现 csv 文件的分隔符不是常见的 , 而是 | ,所以需要修改。 修改 windows 10: 控制面板 —> 区域 —> 其他设置 —> 列表分隔符 默认为 , 修改...
  • # 将windows路径中的分隔符\转换为unix(linux)的分隔符/ @staticmethod def transform_separator(windows_path): linux_path = '' if windows_path != '': path_list = windows_path.spli...
  • hive多分隔符问题

    千次阅读 2017-05-26 16:32:25
     大数据维稳需求中,客户提供的测试数据为多个字符做分隔符('|#'),在pig中会直接报错,hive中只认第一个分隔符。 由于数据量比较大(160G),在文本中替换成单个字符分隔符已不现实,以下提供两个方案解决这一...
  • 当一个列表中存在多个分隔符,但是我们只想以第一个分隔符为分隔时,excel自带的分列功能就不够用了,这时候要是用函数来实现。 举例: 我想以"-“为分隔符,将酒店信息中英文分隔开,但是有的单元格里包含了不止一...
  • awk 命令分隔符

    千次阅读 2015-10-27 10:58:19
    awk 命令分隔符

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 514,885
精华内容 205,954
关键字:

如何去分隔符