Python词频统计的两种方法详解

程序员文章站 2022-06-18 07:54:52

目录统计文件里每个单词的个数思路：想法成立开始实践方法一：方法二：总结统计文件里每个单词的个数思路：分别统计文档中的单词，与出现的次数用两个列表将其保存起来，最后再用zip()函数连接输出**想法成立...

统计文件里每个单词的个数

思路：

分别统计文档中的单词，与出现的次数

用两个列表将其保存起来，最后再用zip()函数连接输出**

想法成立开始实践

方法一：

# 导入文件
with open("passage.txt", 'r') as file:
    dates = file.readlines()
# 处理
words = []
for i in dates:
    words += i.replace("\n", "").split(" ")  # 用空字符来代替换行 words +是为了不被覆盖无+将只有最后一条数据
    # print(i.replace("\n","").split(" "))
setwords = list(set(words))  # 集合自动去重
num = []  # 统计一个单词出现的次数
for k in setwords:
    count = 0
    for j in words:
        if k == j:
            count = count + 1
    num.append(count)
print(num)
print(setwords)
# 输出
for x, y in zip(setwords, num):  # 将两个列表用zip结合
    print(x + ":" + str(y))、

效果图：

Python词频统计的两种方法详解

方法二：

此方法用来字典，较前一个相对简洁一点

# 导入
with open("passage.txt", 'r') as file:
    dates = file.readlines()
# 处理
words = []
for i in dates:
    words += i.replace("\n", "").split(" ")
    # print(i.replace("\n","").split(" "))
# setwords=list(set(words))  #可以不用这个
print(words)
print("-" * 40)
# print(setwords)
diccount = dict()
for i in words:
    if (i not in diccount):
        diccount[i] = 1  # 第一遍字典为空 赋值相当于 i=1，i为words里的单词
        # print(diccount)
    else:
        diccount[i] = diccount[i] + 1  # 等不在里面的全部遍历一遍赋值就都在里面了，我们再来记数
print(diccount)

效果图：

Python词频统计的两种方法详解

统计的文档

Python词频统计的两种方法详解

总结

本篇文章就到这里了，希望能够给你带来帮助，也希望您能够多多关注的更多内容!

Python词频统计的两种方法详解

目录

统计文件里每个单词的个数

思路：

想法成立开始实践

方法一：

方法二：

总结

详解Python中的new()方法的使用

对python requests的content和text方法的区别详解

python3对拉勾数据进行可视化分析的方法详解

Python实现朴素贝叶斯分类器的方法详解

Python 统计字数的思路详解

python pandas修改列属性的方法详解

对python tkinter窗口弹出置顶的方法详解

对Python中创建进程的两种方式以及进程池详解

Python实现优先级队列结构的方法详解

详解Python中的new、init、call三个特殊方法

Python词频统计的两种方法详解

目录

统计文件里每个单词的个数

思路：

想法成立开始实践

方法一：

方法二：

总结

详解Python中的__new__()方法的使用

对python requests的content和text方法的区别详解

python3对拉勾数据进行可视化分析的方法详解

Python实现朴素贝叶斯分类器的方法详解

Python 统计字数的思路详解

python pandas修改列属性的方法详解

对python tkinter窗口弹出置顶的方法详解

对Python中创建进程的两种方式以及进程池详解

Python实现优先级队列结构的方法详解

详解Python中的__new__、__init__、__call__三个特殊方法

详解Python中的new()方法的使用

详解Python中的new、init、call三个特殊方法