Python练习册(四)——统计英文单词
程序员文章站
2022-05-28 18:37:16
...
problem0004统计英文单词
第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数。
demo:
#!/bin/python3
import re
def get_word_frequencies(file_name):
dic = {}
txt = open(file_name, 'r').read().splitlines()
no_flag=0
for line in txt:
line = re.sub(r'[.?!,""/\W]', ' ', line) #要替换的标点符号,英文字符可能出现的
for word in line.split():
#当字符为纯数字的时候,跳过不统计
if word.isdigit():
pass
# print("number is ++++++++++++++++++++:",word)
else:
dic.setdefault(word.lower(), 0) #不区分大小写
dic[word.lower()] += 1
print (dic)
if __name__ == '__main__':
get_word_frequencies("WhatisPython.txt")
参考:[Python]任一个英文的纯文本文件,统计其中的单词出现的个数。(考虑单词-分行)
效果:
原文本:
统计图:
下一篇: 英文单词排序(java)