python基础练习题
程序员文章站
2024-02-24 13:44:40
...
python库,果然简单。识别中文分词,如果用C或者JAVA,需要写多少行?
import jieba
s = "中国特色*进入新时代,我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。"
n = len(s)
wordlist=jieba.lcut(s)
m = len(wordlist)
print("中文字符数为{},中文词语数为{}。".format(n, m))
print(wordlist)
>>>
================== RESTART: D:\19python\二级python\textdd.py ==================
Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\ADMINI~1\AppData\Local\Temp\jieba.cache
Loading model cost 1.378 seconds.
Prefix dict has been built succesfully.
中文字符数为56,中文词语数为29。
['中国', '特色', '*', '进入', '新', '时代', ',', '我国', '社会', '主要矛盾', '已经', '转化', '为', '人民', '日益增长', '的', '美好生活', '需要', '和', '不', '平衡', '不', '充分', '的', '发展', '之间', '的', '矛盾', '。']
>>>