Java编程通过匹配合并数据实例解析(数据预处理)
程序员文章站
2023-12-12 16:34:52
本文研究的主要是java编程通过匹配合并数据(数据预处理)的相关内容,具体如下。
数据描述
以下程序是对如下格式的数据进行合并处理。
这个表的每一行表示用户id及...
本文研究的主要是java编程通过匹配合并数据(数据预处理)的相关内容,具体如下。
数据描述
以下程序是对如下格式的数据进行合并处理。
这个表的每一行表示用户id及用户的特征。其中,一个用户只有一个特征向量,即第一列不会重复。
这张表的第一列,表示用户的id,第二列表示用户所看的电影,第三列表示用户对电影的打分(1-13分),第四列表示用户对电影的打分,但分值范围是1-5分。
问题描述
在做数据预处理时,如何将第二张表添加上用户特征呢?其实,方法很简单,将第二张表的用户id与第一张表的用户id进行匹配就行。合并结果如下图所示。
数据处理程序
package deal; import java.io.bufferedreader; import java.io.file; import java.io.fileinputstream; import java.io.ioexception; import java.io.inputstreamreader; import java.math.bigdecimal; import java.util.arraylist; import java.util.hashmap; import java.util.list; /* * author:合肥工业大学 管院学院 钱洋 * email:1563178220@qq.com */ public class getpuser { public static list<string> readdocs(string docspath,string code) throws ioexception{ bufferedreader reader = new bufferedreader( new inputstreamreader( new fileinputstream( new file(docspath)),code)); string s=null; list<string> userproductscore=new arraylist<string>(); while ((s=reader.readline())!=null) { userproductscore.add(s); } reader.close(); return userproductscore; } public static hashmap<string, string> mapread(string docspath1,string code1) throws ioexception{ bufferedreader reader1 = new bufferedreader( new inputstreamreader( new fileinputstream( new file(docspath1)),code1)); string s1=null; hashmap<string,string> userfeaturemap=new hashmap<string,string>(); while ((s1=reader1.readline())!=null) { string arr[]=s1.split("\t"); string feature=""; for (int i = 1; i < arr.length; i++) { bigdecimal db = new bigdecimal(arr[i]); string ii = db.toplainstring(); feature+=ii+" "; } userfeaturemap.put(s1.split("\t")[0], feature); } reader1.close(); return userfeaturemap; } public static list<string> match(list<string> userproductscore,hashmap<string, string> userfeaturemap) throws ioexception{ list<string> userscoreandfeature=new arraylist<>(); for (int i = 0; i < userproductscore.size(); i++) { //获取用户id string user_id=userproductscore.get(i).split("\t")[0]; //获取用户特征 string userfeature = userfeaturemap.get(user_id); userscoreandfeature.add(userproductscore.get(i)+"\t"+userfeature); system.out.println(userproductscore.get(i)+"\t"+userfeature); } return userscoreandfeature; } public static void main(string[] args) throws ioexception { //读取两个文本 list<string> userproductscore=readdocs("data/train/ydata-ymovies-user-movie-ratings-train-v1_0.txt","gbk"); hashmap<string, string> userfeaturemap=mapread("data/fileofuser/yahoo.txt","utf-8"); //匹配结果 match(userproductscore,userfeaturemap); } }
总结
以上就是本文关于java编程通过匹配合并数据实例解析(数据预处理)的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!