欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python练习册(四)——统计英文单词

程序员文章站 2022-05-28 18:37:16
...

problem0004统计英文单词

第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数。

demo:

#!/bin/python3

import re
def get_word_frequencies(file_name):
    dic = {}
    txt = open(file_name, 'r').read().splitlines()
    no_flag=0
    for line in txt:
        line = re.sub(r'[.?!,""/\W]', ' ', line)   #要替换的标点符号,英文字符可能出现的
        for word in line.split():
            #当字符为纯数字的时候,跳过不统计
            if word.isdigit():
                    pass
       #         print("number is ++++++++++++++++++++:",word)
            else:
                dic.setdefault(word.lower(), 0)  #不区分大小写
                dic[word.lower()] += 1
    print (dic)

if __name__ == '__main__': 
       get_word_frequencies("WhatisPython.txt")   

参考:[Python]任一个英文的纯文本文件,统计其中的单词出现的个数。(考虑单词-分行)

效果:

原文本:
Python练习册(四)——统计英文单词
统计图:
Python练习册(四)——统计英文单词