欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python统计长字符串中字符频次【入门必学】

程序员文章站 2022-07-10 20:50:45
以下笔记是我在数据分析小组所整理分享的心得。相关背景是:我选择中文词频统计案例作为考察大家python基础功掌握程度。 通过《Python读取文件内容为字符串的方法》,我们已经拿到那个很长的字符了。现在我们需要统计这个字符串中,有哪些字符,每个字符分别出现了多少次。 这里还要注意:不管你是为了Pyt ......

以下笔记是我在数据分析小组所整理分享的心得。相关背景是:我选择中文词频统计案例作为考察大家python基础功掌握程度。

通过《python读取文件内容为字符串的方法》,我们已经拿到那个很长的字符了。现在我们需要统计这个字符串中,有哪些字符,每个字符分别出现了多少次。
Python统计长字符串中字符频次【入门必学】

这里还要注意:不管你是为了python就业还是兴趣爱好,记住:项目开发经验永远是核心,如果你没有2020最新python入门到高级实战视频教程,可以去小编的python交流.裙 :七衣衣九七七巴而五(数字的谐音)转换下可以找到了,里面很多新python教程项目,还可以跟老司机交流讨教!

方法1:

这个方法相当简单,掌握《自学是门手艺》第一章就能写出来。零基础自学编程,代码写成这样能满足需求,但它逐个逐个计数,比较笨拙。

rlt = {}
for i in content:
    if i in rlt.keys():
        rlt[i] += 1
    else:
        rlt[i] = 1
复制代码

方法2:

利用 python 内置函数 count() 来统计每个字符出现的次数,同时通过if i not in rlt.keys():确保每个字符只用统计一次。方法2比1要效率一些。

rlt = {}
for i in content:
    if i not in rlt.keys():
        rlt[i] = content.count(i)
        
复制代码

方法3:

数据分析自学小组成员 jeff 代码是这么写的:

rlt = {}
for i in content:
    rlt.setdefault(i,content.count(i))

复制代码

这里有一个大家之前没看到过、或没用过的方法 setdefault(),你如果去搜python setdefault()拿到它的说明,会发现它一定程度上相当于封装了方法2。

python 字典 setdefault() 函数和 get()方法 类似, 如果键不存在于字典中,将会添加键并将值设为默认值。

小结

这里分享一个小常识是,编程世界里,一门编程语言会自带很多封装好、高效、好用的函数、类、库等等,你根据自己需求去搜,就会找到它们。是的,方法几乎总是非常多的。

作为零基础自学编程的人,你刚起步,你可以不知道 setdefault() 但你所掌握的基础功,足够让你能写出方法 1 或者 2。

现在你可能会心急,怎么自己这个不知道,哪个也没听说过?——没关系的,你只要掌握:会拆解、勤搜索、多使用。使用也分两层,既可以自己多敲代码,也应该多读别人的代码,琢磨同一个需求的不同实现方法,整理成类似这种笔记,然后点滴积累你的牛逼。
最后注意:不管你是为了python就业还是兴趣爱好,记住:项目开发经验永远是核心,如果你没有2020最新python入门到高级实战视频教程,可以去小编的python交流.裙 :七衣衣九七七巴而五(数字的谐音)转换下可以找到了,里面很多新python教程项目,还可以跟老司机交流讨教!

本文的文字及图片来源于网络加上自己的想法,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。