部分代码3

程序员文章站 2024-03-20 10:29:22

...

#!/usr/bin/env python
#-*- coding:utf-8 -*-
#author: Enoch time:2018/10/30 0030

import re
import time
from collections import Counter
import os
import sys
import cProfile

###################################################################################
#Name:count_words
#Inputs:file name,the first n words, stopfile name
#outputs:None
#Author: Thomas
#Date:2018.10.22
###################################################################################
def CountPhrases(file_name,k):

    totalNum = 0

    t0 = time.clock()
    with open(file_name) as f:
        txt = f.read()
    txt = txt.lower()
    txt = re.sub(r'\s+',' ',txt)
    pword = r'(([a-z]+ )+[a-z]+)'  # extract sentence
    pattern = re.compile(pword)
    sentence = pattern.findall(txt)
    txt = ','.join([sentence[m][0] for m in range(len(sentence))])

    pattern = "[a-z]+[0-9]*"
    for i in range(k-1):
        pattern += "[\s|,][a-z]+[0-9]*"
    wordList = []
    for i in range(k):
        if( i == 0 ):
            tempList = re.findall(pattern, txt)
        else:
            wordpattern = "[a-z]+[0-9]*"
            txt = re.sub(wordpattern, '', txt, 1).strip()
            tempList = re.findall(pattern, txt)
        wordList += tempList
    tempc = Counter(wordList)

    dicNum = {}
    phrases = tempc.keys()
    for phrase in phrases:
        if (',' not in phrase):
            dicNum[phrase] = tempc[phrase]
            totalNum += tempc[phrase]
    dicNum = sorted(dicNum.items(), key=lambda k: k[0])
    dicNum = sorted(dicNum, key=lambda k: k[1], reverse=True)
    t1 = time.clock()

    for letter, fre in dicNum[:2]:
        print("|\t{:15}|{:<11.2%}|".format(letter, fre / totalNum))
    print(t1 - t0)


CountPhrases('../gone_with_the_wind.txt', 2)

部分代码3

部分代码1

部分代码2

部分代码3

20模1-3-叶结点数一棵包含有2019个结点的二叉树，最多包含多少个叶结点？

部分代码4

二分查找、二分边界查找算法的模板代码总结-Java实现

java二分查找代码实现

Java编程：二分查找算法实现代码

Java二分查找代码实现

java二分查找算法非递归代码实现

部分代码3

部分代码1

部分代码2

部分代码3

20模1-3-叶结点数 一棵包含有2019个结点的二叉树，最多包含多少个叶结点？

部分代码4

二分查找、二分边界查找算法的模板代码总结-Java实现

java二分查找代码实现

Java编程：二分查找算法实现代码

Java二分查找代码实现

java二分查找算法非递归代码实现

20模1-3-叶结点数一棵包含有2019个结点的二叉树，最多包含多少个叶结点？