精华内容
下载资源
问答
  • python统计单词个数

    万次阅读 2019-01-16 21:53:30
    统计句子单词个数 mydict={} for i in input("英文句子").split():  if i in mydict:  mydict[i]+=1  else :  mydict[i]=1 for key,value in mydict.items():  print(key,value)...

    统计句子单词个数
    mydict={}
    for i in input("英文句子").split():
        if i in mydict:
            mydict[i]+=1
        else :
            mydict[i]=1
    for  key,value in mydict.items():
        print(key,value)

    展开全文
  • python 统计单词个数

    千次阅读 2016-06-24 14:05:00
    根据一篇英文文章统计其中单词出现最多的10个单词。 # -*- coding: utf-8 -*-import urllib2import refrom collections import Counter '''007之雷霆谷 You Only Live Twice',可以从...

    根据一篇英文文章统计其中单词出现最多的10个单词。

    # -*- coding: utf-8 -*-
    import urllib2
    import re
    from collections import Counter

    '''
    007之雷霆谷 You Only Live Twice',可以从http://novel.tingroom.com/jingdian/1584/47084.html这个地址获取,
    列出其中使用最频繁的10个单词,并给出它们的出现次数
    Python2.7上测试通过
    '''

    '''根据URL网址读取数据'''
    def Get_Data(url):
      data = urllib2.urlopen(url).read()
      return data

    '''统计单词及个数,text是要统计的文章字符串,n是统计次数最多的前几个'''
    def PrintWordsCount(text,n=1):
      '''调用Counter用正则进行拆分'''
      wordCountList = Counter(re.split(r'\W+', text, flags=re.M|re.I)).most_common(n)
      print '单词\t次数'
      print '\n'.join([w+'\t'+str(c) for w,c in wordCountList])

    #测试代码
    def test():
    url ='http://novel.tingroom.com/jingdian/1584/47084.html'
    data = Get_Data(url)
    PrintWordsCount(data,10)
    test()

    展开全文
  • 开始学习python,习题需要统计单词个数和频次。百度找到的代码好像都有问题。字节写了一个,调试通过。 环境:python: 3.9.1 64bit ; pycharm: 2020.2 电脑 win10 64 思路如下: 1. 打开文件,将所有字符读入...

    开始学习python,习题需要统计单词个数和频次。百度找到的代码好像都有问题。自己写了一个,调试通过。

    环境:python: 3.9.1 64bit ;  pycharm: 2020.2  电脑 win10  64

    测试文章:70篇短文突破中考英语词汇

    思路如下:

    1. 打开文件,将所有字符读入list:s

    2. 使用正则表达式,以非英文字符为间隔符,切片,生成一个以单词为基本元素的list

    3.由于原先非字母可能连续,故生成的list可能存在空单词,所以需要去除空串

    4.全部转成小写,并排序。

    5. 将单词顺次存入dict,如果单词存在,则个数加一,如果不存在,则将此单词存入dict,个数设置为1

    6. 输出

    代码和注释如下:

    import re  #re模块主要功能是通过正则表达式是用来匹配处理字符串
    def main(fileName):
        try:
            inf= open(fileName,'r')
            s = inf.read()
            words =re.split(r'[^a-zA-Z]',s)         #以非英文字符为间隔生成list
            realWords0= list(filter(None,words))    #去除空串
            realWords1 =[]
            for word in realWords0:
                realWords1.append(word.lower())     #均转换为小写
            realWords1.sort()
            print("word NO: ",len(realWords1))
            dict1 =dict()
            for word in realWords1:
                if(word in dict1): dict1[word] =dict1[word]+1
                else: dict1[word]=1
            for item in dict1.items():
                #print(item)
                print(item[0],item[1])
        except IOError:
            exit("That file couldn't be opened.")
        return 1
    
    main("word.txt")

    把从网络上下载的初中阅读贯通词汇粘贴到txt里面,并命名为word.txt,测试发现不能打开,研究发现,需要指定文件编码. 将打开文件的代码加入文件编码信息

    inf= open(fileName,'r',encoding='utf-8')

    重新运行程序, 系统输出如下:

    .......

    younger 2
    your 50
    zarina 1
    zebra 2
    zoo 5
    zoological 1

    word NO:  2268

    系统显示单词为2268个, 基本和初中单词2200的范围误差不大. 

     

    附录: 70篇短文突破中考英语词汇文章样例. 

     

    l. A Young Officer and an Old Soldier (1)
    A very new, young officer was at a railway station He was going to visit his mother, and he wanted to telephone her to tell her the time of his train. He looked in all his pockets, but found that he did not have the coins for the telephone, so he went outside and looked around for someone to help him.
    1.年轻军官与老兵(1)
    一位新上任的(new)年轻军官(young officer)在火车站(railway station)候车。他要去看望(visit)他的母亲(mother)。他想打电话(want to telephone sb.)告诉(tell)母亲他的列车(train)到站的时间。但寻遍了所有的口袋(pocket),却发现(find)他没有打电话用的硬币(coin),于是他走到车站外面(outside),环顾四周(look around)想找人帮忙(help)。                 
    1. A Young Officer and an Old Soldier (2)
     At last an old soldier came by, and the young officer stopped him and said,“Have you got change for ten pence?”
    “Wait a moment,”the old soldier answered, beginning to put his hand in his pocket.“I'll see whether I can help you.”
    “Don't you know how to speak to an officer?”the young man said angrily.“Now let's start again Have you got change for ten pence?”
    “No, sir,”the old soldier answered quickly.
    1.年轻军官与老兵(2)
    最后(at last)有名老兵(old soldier)路过,年轻的军官拦住他道:“你有十便士(pence)的零钱(change)吗?”
    “等会儿(wait a moment)。”老兵回答(answer),开始(begin)把手放(put)进口袋,“让我看看是否(whether)能帮助你。难道你不知道(know)该怎样跟一位长官说话(speak)吗?”年轻人生气地(angrily)说,“现在我们重新开始(start again),你有十美分的硬币吗?”
    “没有,长官(sir)。”老兵迅速(quickly)答道。 
    展开全文
  • # 排序方式用lambda ,先排个数,再按字母顺序排 sorted(temp_str, key = lambda x:[-x[1],x[0]]) # Out[4]: # [('to', 2), # ('Be', 1), # ('and', 1), # ('perform', 1), # ('promise', 1), # ('quick', 1), # ('...
    # coding: utf-8
    
    # In[1]:
    
    import collections
    
    str = "Be slow to promise and quick to perform"
    # 按空格切割
    str_split = str.split(' ')
    
    
    # In[2]:
    
    str_split
    
    # Out[2]:
    #['Be', 'slow', 'to', 'promise', 'and', 'quick', 'to', 'perform']
    
    # In[3]:
    
    # 统计每个单词的个数
    temp_str = collections.Counter(str_split).most_common()
    temp_str
    
    # Out[3]:
    # [('to', 2),
    #  ('and', 1),
    #  ('Be', 1),
    #  ('slow', 1),
    #  ('perform', 1),
    #  ('promise', 1),
    #  ('quick', 1)]
    
    # In[4]:
    
    # 排序方式用lambda ,先排个数,再按字母顺序排
    sorted(temp_str, key = lambda x:[-x[1],x[0]])
    
    # Out[4]:
    # [('to', 2),
    #  ('Be', 1),
    #  ('and', 1),
    #  ('perform', 1),
    #  ('promise', 1),
    #  ('quick', 1),
    #  ('slow', 1)]
    

     

    转载于:https://www.cnblogs.com/sjw1/p/8552764.html

    展开全文
  • 需求: 统计一篇完全由英文构成的文章中的单词的个数分析:需要判断什么是单词,并统计判断为单词的元素的个数需要: Python 正则表达式简单例子:importre pattern=re.compile(r'\w+') pattern.match('hello,...
  • #/usr//bin/envpytnon #coding:utf-8 importre ''' words='helloworda@r3143#######$dfabpple#apple##%#$3423421apple\ apple323423432422324##apple@@#@@@@@$$!!#!#' ''...
  • Python 统计单词数

    千次阅读 2021-03-28 11:36:31
    统计单词的数量 描述 输入一英文句子,以回车符结束,单词间以空格分隔,标点符号后跟至少一空格, 统计并输出单词的个数(仅统计单词,数字按单词计,不计算标点符号,重复单词出现几次就统计几次)。‪‬‪‬...
  • Spark案例:Python统计单词个数

    千次阅读 2018-02-17 07:25:12
    Spark案例:Python统计单词个数 1、Python项目PythonSparkWordCount 2、input目录里的文本文件test.txt 3、创建word_count.py文件实现词频统计 import os import shutil from pyspark import ...
  • Python进行统计单词个数

    万次阅读 2019-02-27 22:32:43
    在这里我们用字典来实现,首先读取一文件中的字符串,去掉标点符号以及空格存到word列表中,在写入字典中根据count方法读取某个单词出现的个数。不明白这counts方法的可以去看这篇文章...
  • python 统计文章单词个数

    万次阅读 2017-11-29 10:08:21
    代码 def getText(): txt= open ( "article.txt" ...###这里就让它输出10看看得了 ...此代码有效的前提是你...在里面写上你要统计单词。 (一定要将py和文章放在同一地方)比如都放在桌面 运行效果如下
  • 核心:切割字符串,在这里需要调用re模块中的... short,you need python?' lis01 = re.split(r'[,.!? ]',str01) #re模块中的split支持多选择的切割 切割符写在[]中即可 dic01 = {word:lis01.count(word) for word i...
  • 有时候我们想统计一下单词的个数,比如四六级,在四六级中出现的高频词汇,统计一下我们日常说话的常用字等。利用所学知识编写。 import operator #这里是初始文档 f = open('word.txt','r',encoding='utf-8') ...
  • 我知道怎么统计字符个数 但是不知道这个单词个数要怎么统计哇? <p><img alt="" height="305" src="https://img-ask.csdnimg.cn/upload/1622545380948.png" width="1083" /></p>
  • 主要介绍了Python实现统计英文单词个数及字符串分割方法,本文分别给出代码实例,需要的朋友可以参考下
  • lines_count = 0 words_count = 0 chars_count = 0 words_dict = {...
  • lines_count = 0 words_count = 0 chars_count = 0 words_dict = ...
  • with open('统计单词个数.txt','r',encoding='utf-8') as f: new_lines='' all_the_lines=f.readlines() for every_line in all_the_lines: for i in range(0,len(every_line)): if ord(every_line[i])<65 ...
  • python统计文本中单词个数

    千次阅读 2014-04-11 15:55:16
    /usr/bin/env python file_name="hello.txt" line_counts=0 word_counts=0 char_counts=0 file=open(file_name,"r") for line in file.readlines(): words=line.split(' ') line_counts+=1 word_
  • Python实现统计字符串中单词个数

    万次阅读 2019-05-08 23:19:26
    Python实现统计字符串中单词个数.
  • Python统计txt文件中的英文单词个数

    千次阅读 2017-09-10 07:37:40
    函数:example.strip()分离此行的单词sum()函数的第一参数是一列表(list),第二参数可以直接省去python风格的代码只要一行:sum([len(line.split()) for line in open("C:\\Users\\dell\\Desktop\\123.txt", ...
  • 给定一word.txt文件,统计文件中每英文单词出现的次数,保存在word2.txt中。 实现: word.txt: Python2.7下的统计脚本: import collections import re def word_cal(): with open('word.txt','r') as...
  • 蓝桥杯 算法提高 不同单词个数统计 Python 编写一个程序,输入一个句子,然后统计出这个句子当中不同的单词个数。例如:对于句子“one little two little three little boys”,总共有5个不同的单词:one, little, ...
  • sorted(dict_1.items(),key=lambda asd:asd[1],reverse=True)dict.items()返回一list,其中每一项元素都是一元组(key,value), lambda匿名函数 asd[0]即键 ,1为值

空空如也

空空如也

1 2 3 4 5 ... 17
收藏数 324
精华内容 129
关键字:

python统计单词个数

python 订阅