欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python中词频统计以及sort的排序用法

程序员文章站 2022-06-04 18:55:58
...

统计单词出现的次数可采用如下代码:

counts[word] = counts[word] + 1

当遇到一个新词是,则需要在字典中新建键值对:

counts[new_word] = 1

因此,无论是否在字典中,加入字典counts中的处理逻辑可以统一表示如下:

if word in counts:
    counts[wors] = counts[wors] + 1
else:
    count[word] = 1
  

或者,这个处理逻辑也可以简洁地表示为:

 counts[word] = counts.get(word,0) + 1

counts.get(word,0) + 1表示:如果word在counts中,则返回word对应的值,如果word不在counts中,则返回0.

接下来就是对刚刚词频统计的排序:

items = list(counts.items())             #将字典转化为列表
items.sort(key=lambda  x : x[1], reverse=True) #对列表第二列(原先的字典的值)进行排序。
#其中,x也可以是其他的符号,如y、z都可以