欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

哈利波特英文单词统计频率

程序员文章站 2024-02-23 23:26:34
...
package 课堂测试1;

public class wordArray {
private int num;
private String word;
public int getNum() {
	return num;
}
public void setNum(int num) {
	this.num = num;
}
public String getWord() {
	return word;
}
public void setWord(String word) {
	this.word = word;
}


};
package 课堂测试1;

import java.io.BufferedReader;
import java.io.FileReader;
import java.util.ArrayList;

import java.util.Map;
import java.util.TreeMap;

public class Words {

	public static void main(String[] args) throws Exception {
		// TODO 自动生成的方法存根
		 /*ArrayList<String> wordRecord = new ArrayList<String>();
		 ArrayList<Integer> wordNum=new ArrayList<Integer>();*/
		BufferedReader br=new BufferedReader(new FileReader("E:\\student.txt"));
		StringBuffer sb=new StringBuffer();
		 String text=null;
		/*while((text=br.read())!=-1) {
			char c=(char)text;
			if(c==' '||c=='\n') {
			}
		}*/
		 while((text=br.readLine())!=null) {
			 sb.append(text);
		 }
		 br.close();
		 String str=sb.toString();
		 String words[]=str.split("[^(a-zA-z)]+");
		 wordArray wa[]=new wordArray[words.length];
		 //Map<String,Integer>map=new TreeMap<String,Integer>();
		 
			 /*Integer num=m.get(a);
			 m.put(a,(num==null)?1:num+1);*/
		 int num=0;
		for(int i=0;i<words.length;i++) {
			int k=0;
			if(words[i]!=null) {
				for(int j=i;j<words.length;j++) {
					if(words[i].equals(words[j])) {
						wa[num].setWord(words[i]);
						wa[num].setNum(++k);
						
						words[j]=null;}
				}
						num++;	
					}	
				}
		for(int i=0;i<10;i++) {
			System.out.println(wa[i].getWord()+wa[i].getNum());
		}
			}
		
	};

  

package 课堂测试1;
import java.io.BufferedReader;
import java.io.FileReader;
import java.util.*;
public class test2 {
    public static void main(String [] args) throws Exception {

        BufferedReader br = new BufferedReader(new FileReader("E:\\student.txt"));
/*FileReader用缓冲区读取文本文件。通过查源码得知方法三内部实现时是使用数组形式来缓冲字符数据的
      BufferedReader提供了按行读取文本文件的方法readLine();readLine()返回行有效数据,不包含换行符,未读取到数据返回null
      https://blog.csdn.net/sutaotao_s77/article/details/79251364 */
        StringBuffer sb = new StringBuffer();
        /*当对字符串进行修改的时候,需要使用 StringBuffer 和 StringBuilder 类。 
        和 String 类不同的是,StringBuffer 和 StringBuilder 类的对象能够被多次的修改,并且不产生新的未使用对象*/
        String text =null;
        while ((text=br.readLine())!= null){
            sb.append(text);// 将读取出的字符追加到stringbuffer中
        }
        br.close();  // 关闭读入流
        String str = sb.toString(); // 将stringBuffer转为字符即返回此序列中数据的字符串表示形式
        String[] words = str.split("[^(a-zA-Z)]+");  // 非单词的字符来分割,得到所有单词split 方法
        //将一个字符串分割为子字符串,然后将结果作为字符串数组返回。 [^abc] 任何字符,除了 a、b 或 c(否定) [a-zA-Z] a到 z 或 A到 Z,两头的字母包括在内(范围)
        //String[] words = str.split(" ");
        Map<String ,Integer> map = new HashMap<String, Integer>() ;

        for(String word :words){
            if(map.get(word)==null){  // 若不存在说明是第一次,则加入到map,出现次数为1
                map.put(word,1);
            }else{
                map.put(word,map.get(word)+1);  // 若存在,次数累加1
            }
        }

        // 排序
        List<Map.Entry<String ,Integer>> list = new ArrayList<Map.Entry<String,Integer>>(map.entrySet());
//在java中,如果要对集合对象或数组对象进行排序,需要实现Comparator接口以达到我们想要的目标
        Comparator<Map.Entry<String,Integer>> comparator = new Comparator<Map.Entry<String, Integer>>() {
            public int compare(Map.Entry<String, Integer> left, Map.Entry<String, Integer> right) {
                return (left.getValue().compareTo(right.getValue()));
            }
        };
        // 集合默认升序升序
        Collections.sort(list,comparator);

        for(int i=0;i<10;i++){// 由高到低输出
            System.out.println(list.get(list.size()-i-1).getKey() +":"+list.get(list.size()-i-1).getValue());
        }
    }
}

第一篇代码始终调不对,还差对单词的排序以及统计出现的频率没有完成,第二篇代码是从网上改编过来的,运行是成功了,但是由于我对Java的认知还不深,以至于后面关于排序那部分代码搞不清,我弄明白的地方均已做了详细注释。
通过这次测试感触挺深的,最大的收获就是我彻底学会了文件的读写操作。问题不少,我不会怎么把这个复杂问题模块化,不知道该怎样去分化这个程序又该如何贯连。比如这篇代码我不知道怎样把那些相同的单词挑出来并同时计算个数。用什么方法,新建类还是ArrayList或者二维数组,又该怎么用,我做题时思路很混乱,几乎不知该如何下手。
我觉得自己以后需要加强练习,并且学会逐渐地积累阅读各种类型难度代码,形成自己的一套代码库,这样才能对以后遇到的各种问题不至于手足无措。最后想说的就是代码中的问题我会逐渐改正并完善的。