Python中词频统计以及sort的排序用法
程序员文章站
2022-06-04 18:55:58
...
统计单词出现的次数可采用如下代码:
counts[word] = counts[word] + 1
当遇到一个新词是,则需要在字典中新建键值对:
counts[new_word] = 1
因此,无论是否在字典中,加入字典counts中的处理逻辑可以统一表示如下:
if word in counts:
counts[wors] = counts[wors] + 1
else:
count[word] = 1
或者,这个处理逻辑也可以简洁地表示为:
counts[word] = counts.get(word,0) + 1
counts.get(word,0) + 1表示:如果word在counts中,则返回word对应的值,如果word不在counts中,则返回0.
接下来就是对刚刚词频统计的排序:
items = list(counts.items()) #将字典转化为列表
items.sort(key=lambda x : x[1], reverse=True) #对列表第二列(原先的字典的值)进行排序。
#其中,x也可以是其他的符号,如y、z都可以