欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java编程实现基于用户的协同过滤推荐算法代码示例

程序员文章站 2024-03-31 13:25:16
协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛...

协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。

协同过滤又可分为评比(rating)或者群体过滤(social filtering)协同过滤以其出色的速度和健壮性,在全球互联网领域炙手可热

usercf的核心思想即为根据用户数据模拟向量相似度,我们根据这个相似度,来找出指定用户的相似用户,然后将相似用户买过的而指定用户没有买的东西推荐给指定用户,推荐度的计算也是结合了相似用户与指定用户的相似度累加。注意这里我们默认是用户的隐反馈行为,所以每一个物品的影响因子默认为1。

package cn.csu.cfutils;
import java.util.hashmap;
import java.util.hashset;
import java.util.iterator;
import java.util.map;
import java.util.map.entry;
import java.util.scanner;
import java.util.set;
/** 
 * 基于用户的协同过滤推荐算法实现 
a a b d 
b a c 
c b e 
d c d e 
 * @author administrator 
 * 
 */
public class usercf {
	public static void main(string[] args) {
		/** 
   * 输入用户-->物品条目 一个用户对应多个物品 
   * 用户id 物品id集合 
   * a  a b d 
   * b  a c 
   * c  b e 
   * d  c d e 
   */
		scanner scanner = new scanner(system.in);
		system.out.println("input the total users number:");
		//输入用户总量 
		int n = scanner.nextint();
		int[][] sparsematrix = new int[n][n];
		//建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】 
		map<string, integer> useritemlength = new hashmap<>();
		//存储每一个用户对应的不同物品总数 eg: a 3 
		map<string, set<string>> itemusercollection = new hashmap<>();
		//建立物品到用户的倒排表 eg: a a b 
		set<string> items = new hashset<>();
		//辅助存储物品集合 
		map<string, integer> userid = new hashmap<>();
		//辅助存储每一个用户的用户id映射 
		map<integer, string> iduser = new hashmap<>();
		//辅助存储每一个id对应的用户映射 
		system.out.println("input user--items maping infermation:<eg:a a b d>");
		scanner.nextline();
		for (int i = 0; i < n ; i++){
			//依次处理n个用户 输入数据 以空格间隔 
			string[] user_item = scanner.nextline().split(" ");
			int length = user_item.length;
			useritemlength.put(user_item[0], length-1);
			//eg: a 3 
			userid.put(user_item[0], i);
			//用户id与稀疏矩阵建立对应关系 
			iduser.put(i, user_item[0]);
			//建立物品--用户倒排表 
			for (int j = 1; j < length; j ++){
				if(items.contains(user_item[j])){
					//如果已经包含对应的物品--用户映射,直接添加对应的用户 
					itemusercollection.get(user_item[j]).add(user_item[0]);
				} else{
					//否则创建对应物品--用户集合映射 
					items.add(user_item[j]);
					itemusercollection.put(user_item[j], new hashset<string>());
					//创建物品--用户倒排关系 
					itemusercollection.get(user_item[j]).add(user_item[0]);
				}
			}
		}
		system.out.println(itemusercollection.tostring());
		//计算相似度矩阵【稀疏】 
		set<entry<string, set<string>>> entryset = itemusercollection.entryset();
		iterator<entry<string, set<string>>> iterator = entryset.iterator();
		while(iterator.hasnext()){
			set<string> commonusers = iterator.next().getvalue();
			for (string user_u : commonusers) {
				for (string user_v : commonusers) {
					if(user_u.equals(user_v)){
						continue;
					}
					sparsematrix[userid.get(user_u)][userid.get(user_v)] += 1;
					//计算用户u与用户v都有正反馈的物品总数
				}
			}
		}
		system.out.println(useritemlength.tostring());
		system.out.println("input the user for recommendation:<eg:a>");
		string recommenduser = scanner.nextline();
		system.out.println(userid.get(recommenduser));
		//计算用户之间的相似度【余弦相似性】 
		int recommenduserid = userid.get(recommenduser);
		for (int j = 0;j < sparsematrix.length; j++) {
			if(j != recommenduserid){
				system.out.println(iduser.get(recommenduserid)+"--"+iduser.get(j)+"相似度:"+sparsematrix[recommenduserid][j]/math.sqrt(useritemlength.get(iduser.get(recommenduserid))*useritemlength.get(iduser.get(j))));
			}
		}
		//计算指定用户recommenduser的物品推荐度 
		for (string item: items){
			//遍历每一件物品 
			set<string> users = itemusercollection.get(item);
			//得到购买当前物品的所有用户集合 
			if(!users.contains(recommenduser)){
				//如果被推荐用户没有购买当前物品,则进行推荐度计算 
				double itemrecommenddegree = 0.0;
				for (string user: users){
					itemrecommenddegree += sparsematrix[userid.get(recommenduser)][userid.get(user)]/math.sqrt(useritemlength.get(recommenduser)*useritemlength.get(user));
					//推荐度计算
				}
				system.out.println("the item "+item+" for "+recommenduser +"'s recommended degree:"+itemrecommenddegree);
			}
		}
		scanner.close();
	}
}

结果:

input the total users number:
6
input user--items maping infermation:<eg:a a b d>
aassdd
djshgjh
2415231424
dsjkj dklsjf ladkjsf
df8g78dfg78 8787 
48787 sdfasd
{dklsjf=[dsjkj], sdfasd=[48787], 8787=[df8g78dfg78], ladkjsf=[dsjkj]}
{aassdd=0, df8g78dfg78=1, 48787=1, 2415231424=0, djshgjh=0, dsjkj=2}
input the user for recommendation:<eg:a>
aassdd
0
aassdd--djshgjh相似度:nan
aassdd--2415231424相似度:nan
aassdd--dsjkj相似度:nan
aassdd--df8g78dfg78相似度:nan
aassdd--48787相似度:nan
the item dklsjf for aassdd's recommended degree:nan
the item sdfasd for aassdd's recommended degree:nan
the item 8787 for aassdd's recommended degree:nan
the item ladkjsf for aassdd's recommended degree:nan

总结

以上就是本文关于java编程实现基于用户的协同过滤推荐算法代码示例的全部内容,希望对大家有所帮助。如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!