-
dataframe中如何筛选包含特定字符串(单个字符串、字符串列表)的列?
2021-02-22 21:14:34dataframe的某一列均为字符串格式,想筛选出含有特定字符串的行,具体实现代码如下: df[df['地址'].str.contains('北京') 这样就可以筛选出‘地址’这一列中含有‘北京’所对应的行了。 问题升级 但如果需要筛选...里斯斯里
dataframe中如何筛选包含特定字符串(单个字符python基础教程
串、字符串列表)的列?
问题描述
dataframe的某一列均为字符串格式,想筛选出含有特定字符串的行,具体实现代码如下:df[df['地址'].str.contains('北京')
这样就可以筛选出‘地址’这一列中含有‘北京’所对应的行了。
问题升级
但如果需要筛选不止一个地名,比如包含‘北京’、‘天津’、‘上海’…等城市所对应的行,经过测试,直接放入列表不行!
解决方法是将关键词都使用|进行连接,这样就可以一次性筛选出来了。citys = ['北京', '天津', '上海'] address = '|'.join(citys) df_new = df[df['地址'].str.contains(address)
这样就一次性筛选出上述三个城市对应的行了。
-
jQuery如何筛选HTML页面里面的特定字符串?
2015-11-12 08:22:44如题,比如在HTML页面里有一些文本,然后我想筛选出"jQuery"这个字符串,这个字符串在HTML页面里有多处,我如何才能将其筛选出来? -
如何在python pandas的dataframe对象筛选出包含特定字符串的行?
2020-05-08 22:29:30如何在python pandas的dataframe对象筛选出包含特定字符串的行? 以数据集df为例,df包含有name的行。如何筛选出name行中,包含‘酒’字符的行? df = df[df['name'].str.contains('酒')] 是不是超级简单,试...如何在python pandas的dataframe对象筛选出包含特定字符串的行?
以数据集df为例,df包含有name的行。如何筛选出name行中,包含‘酒’字符的行?
df = df[df['name'].str.contains('酒')]
是不是超级简单,试起来吧!
这里可以用来股票量化分析中,对行业股票分析,筛选出行业分类中包含酒的行业。
-
python字符串筛选输出_如何在Python中过滤字符串列表
2021-01-13 00:42:53可以使用filter()方法从Python中的任何字符串、列表或字典中过滤一个或多个数值。它根据任何特定条件过滤数据。当条件返回true时,它将存储数据,而返回false时将丢弃数据。本文通过使用不同的示例展示了如何在...Python使用列表数据类型在顺序索引中存储多个数据。它的工作方式类似于其他编程语言的数字数组。filter()方法是Python的一种非常有用的方法。可以使用filter()方法从Python中的任何字符串、列表或字典中过滤一个或多个数值。它根据任何特定条件过滤数据。当条件返回true时,它将存储数据,而返回false时将丢弃数据。本文通过使用不同的示例展示了如何在Python中过滤列表中的字符串数据。您必须使用Python 3+来测试本文的示例。
使用另一个列表过滤字符串列表
本示例说明了如何在不使用任何方法的情况下过滤字符串列表中的数据。 字符串列表在此使用另一个列表进行过滤。 在此,声明了两个列表变量,名称分别为list1和list2。 使用list1的值过滤list2的值。 该脚本会将list2的每个值的第一个单词与list1的值进行匹配,并打印list1中不存在的那些值。
#coding=utf-8
# 声明两个列表变量
list1 = ['Python', 'PHP', 'Java', 'Bash']
list2 = ['JavaScript是客户端脚本语言',
'PHP是服务器端脚本语言',
'Java是一种编程语言',
'Kotlin是一种静态编程语言']
# 根据第一个列表过滤第二个列表
filter_data = [x for x in list2 if
all(y not in x for y in list1)]
# 在过滤前和过滤后打印列表数据
print("第一个列表的内容:", list1)
print("第二个列表的内容:", list2)
print("过滤后的第二个列表的内容:", filter_data)
运行脚本。 在此,list1不包含单词“Kotlin”。 输出将仅包含list2中的一个值,即 ['Kotlin是一种静态编程语言']。
如何在Python中过滤字符串列表
输出如下:
第一个列表的内容: ['Python', 'PHP', 'Java', 'Bash']
第二个列表的内容: ['JavaScript是客户端脚本语言', 'PHP是服务器端脚本语言', 'Java是一种编程语言', 'Kotlin是一种静态编程语言']
过滤后的第二个列表的内容: ['Kotlin是一种静态编程语言']
使用另一个列表和自定义函数过滤字符串列表
本示例说明如何使用另一个列表和自定义过滤器功能过滤字符串列表。 该脚本包含两个名为list1和list2的列表变量。 自定义过滤器功能将找出两个列表变量的公共值。
# 声明两个列表变量
list1 = ['100', '67', '39', '505', '122', '287', '399']
list2 = ['70', '100', '308', '415', '362', '230']
# 声明一个函数来过滤第一个列表中的数据
def Filter(list1, list2):
return [n for n in list1 if
any(m in n for m in list2)]
# 在过滤器之前和之后打印列表数据
print("list1的的内容:", list1)
print("list2的的内容:", list2)
print("过滤后的数据",Filter(list1, list2))
运行脚本。 两个列表变量中都存在100的值。 运行脚本后,将生成以下输出。
list1的的内容: ['100', '67', '39', '505', '122', '287', '399']
list2的的内容: ['70', '100', '308', '415', '362', '230']
过滤后的数据 ['100']
如何在Python中过滤字符串列表
使用正则表达式过滤字符串列表
通过使用前两个示例中的all()和any()方法来过滤列表。 在此示例中,使用正则表达式从列表中过滤数据。 正则表达式是一种模式,通过该模式可以搜索或匹配任何数据。 Python中使用're'模块在脚本中应用正则表达式。 在此,使用主题代码声明列表。 正则表达式用于过滤以“ CSE”开头的主题代码。 正则表达式模式中使用'^'符号在文本的开头进行搜索。
# 导入re模块以使用正则表达式
import re
# 声明列表包含科目编号
sublist = ['IDC-108', 'OKY-309', 'IDC-709', 'PHP-102', 'MIO-801']
# 声明过滤功能
def Filter(datalist):
# 根据列表中的正则表达式搜索数据
return [val for val in datalist
if re.search(r'^IDC', val)]
# 打印过滤器数据
print(Filter(sublist))
运行脚本。 子列表变量包含两个以“IDC”开头的值。 运行脚本后,将显示以下输出。
['IDC-108', 'IDC-709']
如何在Python中过滤字符串列表
使用lamda表达式过滤字符串列表
本示例说明了使用lamda表达式从字符串列表中过滤数据。 在这里,名为search_word的列表变量用于从名为text的文本变量中过滤内容。 通过使用split()方法,基于空间将文本内容转换为名为text_word的列表。 lamda表达式将忽略text_word中存在于search_word中的那些值,并通过添加空格将过滤后的值存储在变量中。
# 声明一个包含linuxidc_word中关键词的列表
linuxidc_word = ["系统", "linuxidc", "Python", "Kotlin"]
# 定义文本,从列表中搜索单词
text = "Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!"
# 根据空格分割文本并将单词存储在列表中
text_word = text.split()
# 使用lambda表达式过滤数据
filter_text = ' '.join((filter(lambda val: val not in linuxidc_word, text_word)))
# 在过滤前和过滤后打印文本
print("\n过滤前的文本:\n", text)
print("过滤后的文本:\n", filter_text)
运行脚本。 运行脚本后,将显示以下输出。
过滤前的文本:
Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!
过滤后的文本:
Linux公社 是专业的 Linux 门户网站,实时发布 最新 资讯!
如何在Python中过滤字符串列表
使用filter()方法过滤字符串列表
filter()方法接受两个参数。 第一个参数采用函数名称或“ None”,第二个参数采用列表变量的名称作为值。 filter()方法如果返回true,则从列表中存储这些数据,否则将丢弃该数据。 在此,第一个参数值不指定任何值。 所有不为false的值将从列表中检索为已过滤数据。
#声明混合数据列表
listData = ['linuxidc', 90, 9, 'com', 100, False, 22, True, '1']
# 使用None和列表调用filter()方法
filteredData = filter(None, listData)
#过滤数据后打印列表
print('过滤后的列表:')
for val in filteredData:
print(val)
运行脚本。该列表只包含一个false值,在过滤后的数据中将省略该false值。运行脚本后将出现以下输出。
如何在Python中过滤字符串列表
总结:
当您需要从列表中搜索和检索特定值时, 过滤非常有用。我希望上面的例子能帮助读者理解从字符串列表中过滤数据的方法。
-
python字符串筛选输出_Python中过滤字符串列表的方法
2021-01-29 19:19:52可以使用filter()方法从Python中的任何字符串、列表或字典中过滤一个或多个数值。它根据任何特定条件过滤数据。当条件返回true时,它将存储数据,而返回false时将丢弃数据。本文通过使用不同的示例展示了如何在...Python使用列表数据类型在顺序索引中存储多个数据。它的工作方式类似于其他编程语言的数字数组。filter()方法是Python的一种非常有用的方法。可以使用filter()方法从Python中的任何字符串、列表或字典中过滤一个或多个数值。它根据任何特定条件过滤数据。当条件返回true时,它将存储数据,而返回false时将丢弃数据。本文通过使用不同的示例展示了如何在Python中过滤列表中的字符串数据。您必须使用Python 3+来测试本文的示例。
使用另一个列表过滤字符串列表
本示例说明了如何在不使用任何方法的情况下过滤字符串列表中的数据。 字符串列表在此使用另一个列表进行过滤。 在此,声明了两个列表变量,名称分别为list1和list2。 使用list1的值过滤list2的值。 该脚本会将list2的每个值的第一个单词与list1的值进行匹配,并打印list1中不存在的那些值。
#coding=utf-8
# 声明两个列表变量
list1 = ['Python', 'PHP', 'Java', 'Bash']
list2 = ['JavaScript是客户端脚本语言',
'PHP是服务器端脚本语言',
'Java是一种编程语言',
'Kotlin是一种静态编程语言']
# 根据第一个列表过滤第二个列表
filter_data = [x for x in list2 if
all(y not in x for y in list1)]
# 在过滤前和过滤后打印列表数据
print("第一个列表的内容:", list1)
print("第二个列表的内容:", list2)
print("过滤后的第二个列表的内容:", filter_data)
运行脚本。 在此,list1不包含单词“Kotlin”。 输出将仅包含list2中的一个值,即 ['Kotlin是一种静态编程语言']。
如何在Python中过滤字符串列表
输出如下:
第一个列表的内容: ['Python', 'PHP', 'Java', 'Bash']
第二个列表的内容: ['JavaScript是客户端脚本语言', 'PHP是服务器端脚本语言', 'Java是一种编程语言', 'Kotlin是一种静态编程语言']
过滤后的第二个列表的内容: ['Kotlin是一种静态编程语言']
使用另一个列表和自定义函数过滤字符串列表
本示例说明如何使用另一个列表和自定义过滤器功能过滤字符串列表。 该脚本包含两个名为list1和list2的列表变量。 自定义过滤器功能将找出两个列表变量的公共值。
# 声明两个列表变量
list1 = ['100', '67', '39', '505', '122', '287', '399']
list2 = ['70', '100', '308', '415', '362', '230']
# 声明一个函数来过滤第一个列表中的数据
def Filter(list1, list2):
return [n for n in list1 if
any(m in n for m in list2)]
# 在过滤器之前和之后打印列表数据
print("list1的的内容:", list1)
print("list2的的内容:", list2)
print("过滤后的数据",Filter(list1, list2))
运行脚本。 两个列表变量中都存在100的值。 运行脚本后,将生成以下输出。
list1的的内容: ['100', '67', '39', '505', '122', '287', '399']
list2的的内容: ['70', '100', '308', '415', '362', '230']
过滤后的数据 ['100']
使用正则表达式过滤字符串列表
通过使用前两个示例中的all()和any()方法来过滤列表。 在此示例中,使用正则表达式从列表中过滤数据。 正则表达式是一种模式,通过该模式可以搜索或匹配任何数据。 Python中使用're'模块在脚本中应用正则表达式。 在此,使用主题代码声明列表。 正则表达式用于过滤以“ CSE”开头的主题代码。 正则表达式模式中使用'^'符号在文本的开头进行搜索。
# 导入re模块以使用正则表达式
import re
# 声明列表包含科目编号
sublist = ['IDC-108', 'OKY-309', 'IDC-709', 'PHP-102', 'MIO-801']
# 声明过滤功能
def Filter(datalist):
# 根据列表中的正则表达式搜索数据
return [val for val in datalist
if re.search(r'^IDC', val)]
# 打印过滤器数据
print(Filter(sublist))
运行脚本。 子列表变量包含两个以“IDC”开头的值。 运行脚本后,将显示以下输出。
['IDC-108', 'IDC-709']
使用lamda表达式过滤字符串列表
本示例说明了使用lamda表达式从字符串列表中过滤数据。 在这里,名为search_word的列表变量用于从名为text的文本变量中过滤内容。 通过使用split()方法,基于空间将文本内容转换为名为text_word的列表。 lamda表达式将忽略text_word中存在于search_word中的那些值,并通过添加空格将过滤后的值存储在变量中。
# 声明一个包含linuxidc_word中关键词的列表
linuxidc_word = ["系统", "linuxidc", "Python", "Kotlin"]
# 定义文本,从列表中搜索单词
text = "Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!"
# 根据空格分割文本并将单词存储在列表中
text_word = text.split()
# 使用lambda表达式过滤数据
filter_text = ' '.join((filter(lambda val: val not in linuxidc_word, text_word)))
# 在过滤前和过滤后打印文本
print("\n过滤前的文本:\n", text)
print("过滤后的文本:\n", filter_text)
运行脚本。 运行脚本后,将显示以下输出。
过滤前的文本:
Linux公社 linuxidc 是专业的 Linux 系统 门户网站,实时发布 最新 Kotlin 资讯!
过滤后的文本:
Linux公社 是专业的 Linux 门户网站,实时发布 最新 资讯!
使用filter()方法过滤字符串列表
filter()方法接受两个参数。 第一个参数采用函数名称或“ None”,第二个参数采用列表变量的名称作为值。 filter()方法如果返回true,则从列表中存储这些数据,否则将丢弃该数据。 在此,第一个参数值不指定任何值。 所有不为false的值将从列表中检索为已过滤数据。
#声明混合数据列表
listData = ['linuxidc', 90, 9, 'com', 100, False, 22, True, '1']
# 使用None和列表调用filter()方法
filteredData = filter(None, listData)
#过滤数据后打印列表
print('过滤后的列表:')
for val in filteredData:
print(val)
运行脚本。该列表只包含一个false值,在过滤后的数据中将省略该false值。
总结:
当您需要从列表中搜索和检索特定值时, 过滤非常有用。我希望上面的例子能帮助读者理解从字符串列表中过滤数据的方法。
以上就是Python中过滤字符串列表的方法的详细内容,更多关于Python中过滤字符串列表的资料请关注脚本之家其它相关文章!
-
C语言定位并抓取文件中的特定字符串
2019-10-15 17:21:26c语言如何从一个文本中筛选出特定字符串 如图,为了将txt文件每行字符串包含的数字提取出来,编写了一个程序。 思路: 找到is,然后指针后移三位,然后到达空格,则停止。再将字符转换为数字。 具体操作: 首先用... -
awk 系列Part3:如何使用 awk 按模式筛选文本或字符串
2019-05-28 16:39:37作为 awk 命令系列的第三部分,这次我们将看一看如何基于用户定义的特定模式来筛选文本或字符串。 在筛选文本时,有时你可能想根据某个给定的条件或使用一个可被匹配的特定模式,去标记某个文件或数行字符串中的某... -
如何使用 awk 按模式筛选文本或字符串
2016-08-18 17:50:19在筛选文本时,有时你可能想根据某个给定的条件或使用一个可被匹配的特定模式,去标记某个文件或数行字符串中的某几行。使用 awk 来完成这个任务是非常容易的,这也正是 awk 中可能对你有所帮助的几个功能之一。 -
awk 系列:如何使用 awk 按模式筛选文本或字符串
2017-05-02 09:52:00作为 awk 命令系列的第三部分,这次我们将看一看如何基于用户定义的特定模式来筛选文本或字符串。 在筛选文本时,有时你可能想根据某个给定的条件或使用一个可被匹配的特定模式,去标记某个文件或数行字符串中的某... -
python对excel筛选提取文本中数字_使用Python&NLP,如何从具有大量自由文本的Excel列中提取特定的文本字符...
2021-02-03 23:29:19我对Python比较陌生,对NLP(和nltk)也很陌生,我在网上搜索过指导,但没有找到完整的解决方案。不幸的是,我一直在玩的稀疏代码是在另一个网络上,但我包括一个示例电子表格。我想得到建议的简单英语步骤(比我下面有... -
帆软中如何筛选有查询条件和没有查询条件的情况
2020-11-09 17:40:39在finereport中选择特定的参数,会返回我们要查询的数据。但如果没有输入参数值,我们却仍需要返回数据时该怎样处理?...当没有输入参数时,字符串的长度为0,当存在参数时,则可以增加关于参数的判断条件。 -
pandas 如何删掉第一行_pandas删除指定行详解
2020-12-19 14:37:33pandas删除指定行详解在处理pandas的DataFrame中,如果想像excel那样筛选,只要其中...pandas.DataFrame中删除包涵特定字符串所在的行:https://www.jb51.net/article/159052.htm以上所述是小编给大家介绍的pandas删... -
如何编写批处理文件批处理文件批处理文件
2010-04-14 10:36:10被理解成是用作定义某个要分析的字符串的。 %i 专门在 for 语句中得到说明,%j 和 %k 是通过 tokens= 选项专门得到说明的。您可以通过 tokens= 一行 指定最多 26 个符号,只要不试图说明一个高于字母 'z' 或 'Z' ... -
ASP200问.EXE
2010-05-20 13:25:0818.如何计算中英文混合字符串的长度 19.如何判断字符串是否以指定字符串开头或结尾 20.如何判断字符是否是英文字符 21.如何检测字符串出现的次数 22.如何过滤字符串中的HTML代码 23.如何截取字符串 24.如何实现字符... -
java file.io的各种使用
2014-10-20 11:42:18File可以表示一个文件的名字也可以表示某个目录下一堆文件的名字,如果是表示多个文件,那么可以使用list方法来获取他们的set集合,返回的是一系列的字符串。下面我们就来看下如何使用这个类以及相关的... -
Excel公式大全操作应用实例(史上最全)
2018-03-06 21:09:38如何筛选奇数行 函数筛选姓名 名次筛选 如何实现快速定位(筛选出不重复值) 如何请在N列中列出A1:L9中每列都存在的数值 自动为性别编号的问题 【文本与页面设置】 EXCEL中如何删除*号 将字符串中的星号“*”替换为... -
EXCEL函数公式集
2010-03-16 03:26:38如何筛选奇数行 函数筛选姓名 名次筛选 如何实现快速定位(筛选出不重复值) 如何请在N列中列出A1:L9中每列都存在的数值 自动为性别编号的问题 【文本与页面设置】 EXCEL中如何删除*号 将字符串中的星号“*”替换为... -
Visual Basic开发实战1200例(第Ⅰ卷).(清华出版.孙秀梅.巩建华).part1
2016-06-14 11:19:42实例140 获得中英文混合字符串的字节长度 实例141 获得某个字符在一个字符串中最后出现的位置 实例142 获得字符串中指定后几位字符 5.5 综合应用 实例143 从字符串中分离文件路径、文件名及其扩展名 实例144 ... -
C#全能速查宝典
2014-04-26 16:16:271.4.24 IndexOf方法——确定指定字符在字符串中的索引 65 1.4.25 IsLeapYear方法——判断年份是否为闰年 67 1.4.26 IsMatch方法——搜索正则表达式匹配项 67 1.4.27 IsUpper方法——判断是否大写 68 1.4.28 Join方法... -
Url重写篇视频------本讲将通过实例比较ASP.NET下的三种典型URL重写方案
2009-04-22 08:15:51要求用户键入查询字符串值将使 URL 的键入变得非常困难,并且只有了解查询字符串参数的用途及其名称/值对结构的富有经验的 Web 开发人员才能够对 URL 进行“删节”。 较好的方法是允许使用切合实际且容易记忆的 URL... -
中文版Excel.2007公式与函数应用宝典 1/2
2012-04-06 18:29:445.3.7 提取字符串的最后一个单词 5.3.8 提取字符串中除第一个词以外的所有词 5.3.9 提取名字的名、中间名和姓 5.3.10 删除名字中的称谓 5.3.11 计算单元格中词的数量 5.4 自定义VBA文本函数 第6章 处理Et期... -
中文版Excel.2007公式与函数应用宝典 2/2
2012-04-06 18:37:145.3.7 提取字符串的最后一个单词 5.3.8 提取字符串中除第一个词以外的所有词 5.3.9 提取名字的名、中间名和姓 5.3.10 删除名字中的称谓 5.3.11 计算单元格中词的数量 5.4 自定义VBA文本函数 第6章 处理Et期... -
CLR.via.C#.(中文第3版)(自制详细书签)Part1
2013-04-04 17:44:14· 高效使用特定的CLR类型——委托、枚举、定制attribute、数组和字符串 · 理解垃圾回收器是如何管理内存资源的 · 使用线程池、任务、取消、计时器和异步I/O操作来设计响应性强、稳定性高和伸缩性大的解决方案 · ... -
C#程序开发范例宝典电子书从1-471例后面的暂时没有
2008-10-16 21:15:36实例051 自动删除非法字符 55 实例052 为TextBox控件添加列表选择框 57 2.2 Button控件应用 58 实例053 在Button按钮中显示图标 58 2.3 ComboBox控件应用 59 实例054 将数据表中的字段添加到ComboBox控件... -
EXCEL集成工具箱V9.0 多国语言最终原版(2003-2010通用)
2011-01-07 20:40:25能批量取某列存储格按指定长度的数字并允许特定数字串的获取,例如M76000,RC76000等。而小于指定长度的数字串则不予获取。 【快速选定数据】 可瞬间选中与用户指定内容相同的当前工作表中所有存储格,方便选定、... -
JAVA面试题最全集
2010-03-13 13:09:10写一个方法,实现字符串的反转,如:输入abc,输出cba 写一个方法,实现字符串的替换,如:输入bbbwlirbbb,输出bbbhhtccc。 3.数据类型之间的转换 如何将数值型字符转换为数字(Integer,Double) 如何将数字...
-
中央广播电视大学《建筑工程项目管理》期末总复习资料(含答案).pdf
-
rabbitMQ面试题(持续更新)
-
MaxScale 实现 MySQL 读写分离与负载均衡
-
8--robot拉花咖啡机商业计划书.pdf
-
软件测试面试题(含答案)
-
GBase8s数据库的Long Transaction 发生的次数及相应的事务
-
MySQL 备份与恢复详解(高低版本 迁移;不同字符集 相互转换;表
-
中央广播电视大学《建筑结构试验》期末总复习资料(含答案).pdf
-
使用 Linux 平台充当 Router 路由器
-
1090 Highest Price in Supply Chain (25 分)
-
12-- 七ask商业计划书.pptx
-
超清晰的讲解Redis缓存穿透,击穿,雪崩
-
asp.net 4.5 练习~test4-10
-
医学微生物学真菌总论PPT课件.ppt
-
华为1+X——网络系统建设与运维(高级)
-
中央广播电视大学《建筑结构试验试题》期末总复习资料(含答案).pdf
-
中央广播电视大学《数控编程技术》期末总复习资料(含答案).pdf
-
Android RecyclerView加载复杂布局
-
中央广播电视大学《社会调查研究与方法》期末总复习资料(含答案).pdf
-
乳腺生物反应器商业计划书【恩美路演提供】.pdf