精华内容
下载资源
问答
  • 方法一:利用grep grep -v '^\s*$' test.txt 注:-v表示将匹配的结果进行...注:d代表删除该行 方法三:利用awk awk NF test.txt 注:NF代表当前行的字段数,空行的话字段数为0,被awk解释为假,因此不进行输出...

    方法一:利用grep

    grep -v '^\s*$' test.txt

    注:-v表示将匹配的结果进行反转,正则表达式匹配空行。(空行可包括空格符制表符等空白字符)

    方法二:利用sed

    sed '/^\s*$/d' test.txt

    注:d代表删除该行

    方法三:利用awk

    awk NF test.txt

    注:NF代表当前行的字段数,空行的话字段数为0,被awk解释为假,因此不进行输出。

     

    以上三种方式均可处理包含空白字符(空格符,制表符等)的空行。

     

    方法四:若空行均由’\n'造成,则还可以利用tr命令去除空行

    tr -s '\n' < test.txt

    注:-s代表将多个连续的字符压缩成一个字符,这里是将多个‘\n'压缩成一个'\n',达到去除空行的效果。

    方法四的缺陷:如果首行就出现空行的话则无法去除首行的空行

    水平有限,如有不当之处,还望指正!

    您的关注是我不断创作的动力源泉!期待认识更多的朋友,一起交流Java相关技术栈,共同进步!阅读更多技术文章,可关注我的公众号:codecrazy4j 

    展开全文
  • 编辑和删除文本到目前为止,我们介绍了一些用于在文件中移动和选择区域的方法,现在让我们真正来修改一些文本吧。很显然你可以通过打字的方式来输入字符,但是另一些方法使删除和处理字符变得更简捷易用。基本操作...

    编辑和删除文本

    到目前为止,我们介绍了一些用于在文件中移动和选择区域的方法,现在让我们真正来修改一些文本吧。很显然你可以通过打字的方式来输入字符,但是有另一些方法使删除和处理字符变得更简捷易用。

    基本操作

    有一些用于基本操作的很酷的快捷键,他们十分易用。这些操作包括整行移动文本,整行复制,以及改变大小写。

    ctrl-T

    交换光标两边字符的位置

    cmd-J

    将下一行拼接到当前行的末尾

    ctrl-cmd-up, ctrl-cmd-down

    上移或者下移当前行

    cmd-shift-D

    复制当前行

    cmd-K, cmd-U

    将当前字符转为大写

    cmd-K, cmd-L

    将当前字符转为小写

    Atom也带有一个功能,可以对段落重新排版,在超出提供的最大长度的地方硬换行(hard-wrap)。你可以对当前选中区域格式化,使用cmd-alt-Q,使其一行的长度不超过80个字符(或者editor.preferredLineLength设置为什么都可以)。如果没有选中任何东西,当前段落会被重排。

    删除和剪切文本

    你也可以从你的缓冲区中剪切或删除文本。不要手下留情。

    ctrl-shift-K

    删除当前一行

    cmd-delete

    删除当前位置到整行末尾的内容(在mac中为cmd-fn-backspace

    ctrl-K

    剪切当前位置到整行末尾的内容

    cmd-backspace

    删除当前位置到整行开头的内容

    alt-backspace, alt-H

    删除当前位置到单词开头的内容

    alt-delete, alt-D

    删除当前位置到单词末尾的内容

    多光标选择

    Atom可以做的一件非常酷的事情,就是支持多个光标,开箱即用。这在处理一个很长的文本列表时会相当有用。

    cmd-click

    添加新的光标

    cmd-shift-L

    将一个多重选择变为多个光标

    ctrl-shift-up, ctrl-shift-down

    在当前光标之上或之下添加新的光标

    cmd-D

    选择文档中与当前所选的单词相同的下一个单词

    ctrl-cmd-G

    选择文档中与当前所选的单词相同的所有单词

    通过这些命令,你可以在文档的多个位置放置光标,并且一次性有效地在多个位置执行相同操作。

    在你执行许多重复性操作时,比如重命名变量或者修改一些文本的格式时,会十分有帮助。你可以一起使用几乎任何插件或命令 —— 比如,修改大小写,以及整行移动或者复制。

    你也可以在按下command键的同时使用鼠标选择文本,来一次性选中多个区域。

    空白字符

    Atom自带一些命令来帮助你管理你文档中的空白字符。一对非常有用的命令是把空格转换为tab,以及把tab转换为空格。如果你的文档中混用了多种空白字符,这些命令对文档的标准化有巨大帮助。空白字符命令没有相关的快捷键,所以你只能在命令面板中寻找“Convert Spaces to Tabs”(或者反过来),并且选取一个来执行。

    空白字符命令在atom/whitespace中实现。空白字符命令的设置,在whitespace包的页面中提供。

    要注意“Remove Trailing Whitespace”选项是默认开启的。意思是每次你保存在Atom中打开的文件时,Atom都会把末尾的空白字符去掉。如果你希望禁用它,在你的设置面板中打开whitespace包的页面,取消该选项的勾选。

    Atom同时也默认确保你文件中有个在末尾的空行,你也可以在上述位置禁用它。

    括号

    Atom自带一种对括号的智能处理方式。

    当你的光标覆盖他们时,Atom会自动高亮{}()[]。匹配的xml和html标签也会高亮显示。

    Atom也会自动补全[], (), {}, “”, '', “”, ‘’, «», ‹›和反引号。当你输入开头的一个时,Atom会补全另一个。如果你在一段选择区域上面输入这些括号或引号的开头,Atom会用对应符号的结尾使区域闭合。

    下面是一些其他的有趣的括号相关命令,你可以使用它们。

    ctrl-m

    跳到光标下的括号所匹配的括号。如果没有,就跳到最近的后括号。

    ctrl-cmd-m

    选择当前括号中所有文本

    alt-cmd-.

    闭合当前的xml或html标签。

    括号功能在atom/bracket-matcher包中实现。和所有这些包一样,想要修改括号处理相关的默认行为,或者直接禁用它,你可以浏览设置视图(Settings view)中这个包的页面。

    编码

    Atom也自带了一些基本的文件编码支持,如果你发现你在处理非UTF-8文件,或者你打算创建这样的文件的话。

    ctrl-shift-U

    拉下菜单来修改文件编码

    如果你弹出了编码对话框,你可以选择用来保存文件的编码。

    当你打开一个文件时,Atom会自动检测文件编码。如果检测失败,编码会默认设置为UTF-8,它也是新建立的文件的编码。

    如果你弹出编码菜单,并且修改了活动编码,文件会在下次保存时以那个编码保存。

    编码选择器在atom/encoding-selector包中实现。

    展开全文
  • Linux 删除文本中的重复行

    万次阅读 2012-10-01 18:21:17
    在进行文本处理的时候,我们经常遇到要删除重复行的情况。那怎么解决呢?下面就是三种常见方法?第一,用sort+uniq,注意,单纯uniq是不行的。shell> sort -k2n file | uniq这里我做了个简单的测试,当file中的重复...

    在进行文本处理的时候,我们经常遇到要删除重复行的情况。那怎么解决呢?

    下面就是三种常见方法?

    第一,用sort+uniq,注意,单纯uniq是不行的。

    shell> sort -k2n file | uniq

    这里我做了个简单的测试,当file中的重复行不再一起的时候,uniq将服务删除所有的重复行。经过排序后,所有相同的行都在相邻,因此unqi可以正常删除重复行。


    第二,用sort+awk命令,注意,单纯awk同样不行,原因同上。

     shell> sort -k2n file | awk '{if ($0!=line) print;line=$0}'

    当然,自己把管道后面的代码重新设计一下,可能不需要sort命令先排序拉。


    第三,用sort+sed命令,同样需要sort命令先排序。

    shell> sort -k2n file | sed '$!N; /^\(.*\)\n\1$/!P; D'


    最后附一个必须先用sort排序的文本的例子,当然,这个需要用sort排序的原因是很简单,就是后面算法设计的时候的“局部性”,相同的行可能分散出现在不同的区域,一旦有新的相同行出现,那么前面的已经出现的记录就被覆盖了,看了这个例子就好理解拉。
      
    ffffffffffffffffff
    ffffffffffffffffff
    eeeeeeeeeeeeeeeeeeee
    fffffffffffffffffff
    eeeeeeeeeeeeeeeeeeee
    eeeeeeeeeeeeeeeeeeee
    gggggggggggggggggggg

    其实,这是我随便打进去的几行字,没想到就是必须用sort的很好例子,大家可以自己试试看。



    参考推荐:

    删除文本中的重复行(sort+uniq/awk/sed)


    展开全文
  • 本次学习应用于文本处理方面,主要的功能是为了实现删除文本中的空白行,便于我们阅读和储存。 java.io包为我们提供了相关的API,实现了对所有外部系统的输入输出操作,这就是我们这章所要学习的技术。 Java为我们...

    一、前言

    本次学习应用于文本处理方面,主要的功能是为了实现删除文本中的空白行,便于我们阅读和储存。

    java.io包为我们提供了相关的API,实现了对所有外部系统的输入输出操作,这就是我们这章所要学习的技术。

    Java为我们提供了多种多样的IO流,我们可以根据不同的功能及性能要求挑选合适的IO流。

    二、分析学习

    1)数据源

    数据源data source,提供数据的原始媒介。常见的数据源有:数据库、文件、其他程序、内存、网络连接、IO设备。如图所示。

    ​ 数据源分为:源设备、目标设备。

    1. 源设备:为程序提供数据,一般对应输入流。
    2. 目标设备:程序数据的目的地,一般对应输出流。
      1

    2)数据流

    是一个抽象、动态的概念,是一连串连续动态的数据集合。

    ​ 对于输入流而言,数据源就像水箱,流(stream)就像水管中流动着的水流,程序就是我们最终的用户。我们通过流(A Stream)将数据源(Source)中的数据(information)输送到程序(Program)中。

    ​ 对于输出流而言,目标数据源就是目的地(dest),我们通过流(A Stream)将程序(Program)中的数据(information)输送到目的数据源(dest)中。
    2

    3)流的概念细分

    按流的方向分类:

    ​ 1. 输入流:数据流向是数据源到程序(以InputStream、Reader结尾的流)。

    ​ 2. 输出流:数据流向是程序到目的地(以OutPutStream、Writer结尾的流)。

    按处理的数据单元分类:

    ​ 1. 字节流:以字节为单位获取数据,命名上以Stream结尾的流一般是字节流,如FileInputStream、FileOutputStream。

    ​ 2. 字符流:以字符为单位获取数据,命名上以Reader/Writer结尾的流一般是字符流,如FileReader、FileWriter。

    按处理对象不同分类:

    ​ 1. 节点流:可以直接从数据源或目的地读写数据,如FileInputStream、FileReader、DataInputStream等。

    ​ 2. 处理流:不直接连接到数据源或目的地,是”处理流的流”。通过对其他流的处理提高程序的性能,如BufferedInputStream、BufferedReader等。处理流也叫包装流。

    ​ 节点流处于IO操作的第一线,所有操作必须通过它们进行;处理流可以对节点流进行包装,提高性能或提高程序的灵活性。

    三、编程学习

    1)任务要求

    • 完成一个 java application应用程序,实现文本文档的读取和写入,将修改后(删除空白行)的新内容存入到新的文本文档中。
    • 应用数据流的相关知识,使用BufferedReader/BufferedWriter处理流:将Reader/Writer对象进行包装,增加缓存功能,提高读写效率。使用InputStreamReader/OutputStreamWriter处理流:将字节流对象转化成字符流对象。

    2)程序代码

    /* 项目名称:Task_Shao
     * 创建时间:2019年1月23日
     * 创建者:Administrator
     * 创建地点:hb
     * 功能:删除空白行(java IO流)
     */
    import java.io.*;//导入java.io包中的所有类
    import java.util.Scanner;//导入java.util包中的Scanner类
    public class delete_blank_lines {//创建类名
    	public static void main(String[] args) throws Exception{//程序主函数入口
    		Scanner s = new Scanner(System.in);//获取键盘输入并赋值给s字符串
    	    Scanner t = new Scanner(System.in);//获取键盘输入并赋值给t字符串
    	    System.out.println("请输入想要打开的文本文档:");//输出提示信息
    	    String a = s.nextLine();//定义字符串变量,与用户输入的信息相等
    	    System.out.println("请输入想要写入内容的文本文档:");//输出提示信息
    	    String b = t.nextLine();//定义字符串变量,与用户输入的信息相等
    		File file=new File(b);//创建待写入文件		
    		if(!file.exists()) {//若指定路径下该文件不存在执行if语句
    			file.createNewFile();//在指定路径下新建该文件
    			}
    		//如果存在该文件夹则继续往下执行		
    		try{ //将逻辑语句用try包起来
            int i=0;//新建行号的符号i
    		String string=null;//新建空字符串
    		//FileInputStream fis = null;
            //BufferedInputStream bis = null;
            //FileOutputStream fos = null;
            //BufferedOutputStream bos = null;
    		//读出文档数据流方式
    		InputStreamReader isr=new InputStreamReader(new FileInputStream(a),"UTF-8");//选择编码方式,避免乱码
    		BufferedReader read=new BufferedReader(isr);//写入数据流方式
    		OutputStreamWriter osw=new OutputStreamWriter(new FileOutputStream(file),"UTF-8");//选择编码方式,避免乱码
    		BufferedWriter write=new BufferedWriter(osw);//写入数据流方式
    		while((string = read.readLine())!= null) {//readLine()方法,要读取的一行内容不为空就一直执行
    			if(string.equals("")) {//if条件语句
    			continue;//该行为空时不进行任何操作
    			}
    			else {//否则
    			i++;
    			//	write.write("["+i+"]");//可在文档中标出行号(有需要时可以取消该注释)
    			write.write(string+"\r\n");//在新文档中写入指定内容			
    			}
    		}	
    		write.close();//关闭流
    		read.close();//关闭流
    		System.out.println("所需内容已写入指定文档!");//输出提示信息	
            }
    		catch(Exception e) {//当代码异常时用catch捕获异常
    			e.printStackTrace();//printStackTrace()方法是打印异常信息在程序中出错的位置及原因
    		}		
    	}
    }
    

    3)执行结果(以西游记文本为例)

    2
    1
    3

    四、总结(Java中IO流类的体系

    Java为我们提供了多种多样的IO流,我们可以根据不同的功能及性能要求挑选合适的IO流,如图所示,为Java中IO流类的体系。

    ​ 注:这里只列出常用的类,详情可以参考JDK API文档。粗体标注为常用!

    113

    从上图发现,很多流都是成对出现的,比如:FileInputStream/FileOutputStream,显然是对文件做输入和输出操作的。我们下面简单做个总结:

    1. InputStream/OutputStream

    ​ 字节流的抽象类。

    2. Reader/Writer

    ​ 字符流的抽象类。

    3. FileInputStream/FileOutputStream

    ​ 节点流:以字节为单位直接操作“文件”。

    4. ByteArrayInputStream/ByteArrayOutputStream

    ​ 节点流:以字节为单位直接操作“字节数组对象”。

    5. ObjectInputStream/ObjectOutputStream

    ​ 处理流:以字节为单位直接操作“对象”。

    6. DataInputStream/DataOutputStream

    ​ 处理流:以字节为单位直接操作“基本数据类型与字符串类型”。

    7. FileReader/FileWriter

    ​ 节点流:以字符为单位直接操作“文本文件”(注意:只能读写文本文件)。

    8. BufferedReader/BufferedWriter

    ​ 处理流:将Reader/Writer对象进行包装,增加缓存功能,提高读写效率。

    9. BufferedInputStream/BufferedOutputStream

    ​ 处理流:将InputStream/OutputStream对象进行包装,增加缓存功能,提高 读写效率。

    10. InputStreamReader/OutputStreamWriter

    ​ 处理流:将字节流对象转化成字符流对象。

    11. PrintStream

    ​ 处理流:将OutputStream进行包装,可以方便地输出字符,更加灵活。

    建议

    ​ 上面的解释,一句话就点中了流的核心作用。大家在后面学习的时候,用心体会。
    希望大家在编程和学习的时候,多查看书籍和API集,实践才能出真知。大家都一起加油努力!~

    参考链接:
    https://blog.csdn.net/mas2005/article/details/82432068
    https://bbs.csdn.net/topics/380239879
    https://blog.csdn.net/bks429/article/details/51814520


    展开全文
  • 首先,在命令行模式输入ndd,将剪切当前行 + 随后的n-1行 然后,将光标移动到需要的位置,然后按p   删除文本内容: dG
  • 关于先删除停顿词还是先进行stem操作,推荐先删除停顿词,在进行stem操作,最后在处理一次停顿词,相信大家应该明白为什么这么做。。。 文本建模系列会不断更新。。。。
  • Shell中如何删除文本比较长的行

    千次阅读 2017-09-06 22:08:58
    的时候需要对文件执行删除删除操作,这个时候比较常用的会使用vi命令中的dd命令,比如先执行10G(跳转到第10行),然后再执行20dd(删除20行),但实际情况未必是这么常规,比如说,要删除文件中,某行长度超过200个...
  • 删除文本中的某一行

    千次阅读 多人点赞 2016-07-30 14:09:15
    其实在C++的文件操作中没有所谓的”删除”功能,不过还是可以通过其他方法实现所谓的”删除”: 将除了要删除那特定的一行之外的其他信息拷贝到一个临时文档,在将这个临时文档重新写入原文档,最后删除临时文档...
  • From: ... 删除文本中的重复行(sort+uniq/awk/sed) 三种常见方法:  第一,用sort+uniq,注意,单纯uniq是不行的。 shell> sort -k2n file | uniq >
  • 文本特征提取方法研究

    万次阅读 2017-09-27 10:25:22
    文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又许多不同。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的自然语言,缺乏计算机...
  • 项目需要EditText只能输入固定行高的内容,超出部分要删掉,本以为很简单,设置个属性就行了结果发现不是那样的,maxLength,maxLines,lines这些都不行,后来查了资料发现,没有方法可以删除多余的文本,那只能自己写监听了,...
  • 文本数据增强方法

    千次阅读 2019-07-29 22:49:00
    文本数据增强方法-百度翻译API的使用 文本数据增强不同于图像领域的数据增强,因为文本是离散的,而图像是属于连续空间的.  例如针对两张图片,可以通过线性插值,旋转或者SMOTE等方法构造出出另外一张图片;然而...
  • notepad++删除文本重复行

    千次阅读 2013-12-11 13:53:00
    网上个不错的方法,这里转一下。 先安装TextFx插件,这个插件巨NB了,什么删除空行、排序之类总之很多功能。这个插件可以通过菜单“插件(Plugins) -> Plugin Manager -> Show Plugin Manager”通过插件...
  • Java文本处理1-删除空行

    千次阅读 2019-01-19 21:42:58
    时候我们从网上下载的文本中会一些空行,这会对我们做文本行数及字符串的统计造成影响,所以就需要对文本进行预处理来删除空行,从而得到没有空行的文本,本次任务就对空行删除程序的编写进行讲解。 2、基本...
  • 基本文本聚类方法

    万次阅读 2016-06-14 20:26:11
    转自:http://blog.csdn.net/wangran51/article/details/7382258 转自:... 经过N天的努力,我的第一个文本聚类小程序终于火热出炉了.真不容易啊,在网上看了很多程序才明白其中的核心原理。其实原理
  • 使用Python中的NLTK和spaCy删除停用词与文本标准化

    千次阅读 多人点赞 2019-09-08 23:46:32
    探索不同的方法删除停用词,以及讨论文本标准化技术,如词干化(stemming)和词形还原(lemmatization) 在Python中使用NLTK,spaCy和Gensim库进行去除停用词和文本标准化 介绍 多样化的自然语言处理(NLP)是...
  • 比360强力删除还暴力的删除文件(夹)方法

    万次阅读 多人点赞 2018-08-15 21:53:29
    今天我就遇到了,个文件夹怎么删都删不掉,我特地下载了360进行强力删除都删不掉。。。真TMD的流氓。。 不过还好在网上找到了比360强力删除还牛的方法,总算是拔掉了这根心头刺。 此方法仅适用于Windows。 ...
  • 文本编辑器的组件很多像:百度的UEditor ,Vue-Quill-Editor,以及wangeditor。 组件的选择根据自己业务需求选择,本文选用的是wangeditor。 首先说一下业务需求: 表单里加富文本,要求能够加载图片,文字进行...
  • 由于要处理一个两万多行的数据,但要删除其中内容重复的行,所以找了几个方法: 1、使用EditPlus-工具-排序,勾选“删除重复”。可惜不想把内容排序,却被自动排序了。(勾选"区分位置",好像没用?),这个效率...
  • Chrome删除已存储的表单提示文本/Chrome删除自动弹出的下拉框提示 自动提示是指在chrome浏览器中点击input输入框输入内容时,chrome会自动弹出相应的提示弹框 自动提示效果 删除提示的方法 删除其中的某一项 用 ...
  • 在DOS/Windows里,文本文件的换行符为\r\n,而在*nix系统里则为\n,所以DOS/Windows里编辑过的文本文件到了*nix里,每一行都多了个^M。所以^M只是一个换行符号,没有实际的用处,我们可以将它保留,也可以将它删除。...
  • 工作和学习中,我们往往需要删除一大段文本或者excel表格内包含某一字符的所有行。ps:如果只要删除所有的特定字符(注意不是删除所有行),那直接替换为空白就行了,不赘述。工具/原料 excel表格方法/步骤1.将需要...
  • Ubuntu终端输入无法退格(删除文本)、使用↑↓方向键无法切换最近的命令,而是复制上次的命令、换行显示异常等。 3解决方法 重装ncurses-base后重启终端即可。 输入命令: sudo apt install ncurs
  • 本页主要测试删除文本的功能,经过不断验证,下面只是其中一个方法 //测试删除功能  public void testDel()throws Exception{  //此处获取的index包括多项,当个数小于8时,可以用index来标示,而当个数...
  • JAVA 删除文本文件中的空行

    千次阅读 2013-09-01 11:27:22
    import java.io.BufferedInputStream; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileWriter; import java.io.IOException;...import java.io.Inpu
  • 如何获取span中的文本内容与删除

    千次阅读 2016-10-18 16:59:51
    所有就用了以下这2中方法,如果知道原因的朋友可以在文章下面评论以下, document.getElementById("#spanID").innerHTML = "文本内容"; $("#spanID")[0].innerHTML = "文本内容"; 这是删除内容 $("#spanID")....

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 583,246
精华内容 233,298
关键字:

删除文本的方法有哪些