Android Java实现余弦匹配算法示例代码
程序员文章站
2024-02-29 14:20:28
java实现余弦匹配算法
最近在做一个通讯交友的项目,项目中有一个这样的需求,通过用户的兴趣爱好,为用户寻找推荐兴趣相近的好友。其实思路好简单,把用户的兴趣爱...
java实现余弦匹配算法
最近在做一个通讯交友的项目,项目中有一个这样的需求,通过用户的兴趣爱好,为用户寻找推荐兴趣相近的好友。其实思路好简单,把用户的兴趣爱好和其他用户的兴趣爱好进行一个匹配,当他们的爱好相似度比较高的时候就给双方进行推荐。那么如何进行比较是一个问题,其实我们可以通过余弦匹配算法来对用户的兴趣爱好进行比较,根据计算出来的值来得到一个兴趣爱好相近好友列表,并进行排序。
因为我做的项目是android端的,所以算法是通过java实现的,废话不过多说了,下面是算法的实现:
package com; import java.util.hashmap; import java.util.iterator; import java.util.map; /** * 余弦匹配算法 * */ public class similardegreebycos { /** * 计算两个字符串的相似度,简单的余弦计算,未添权重 * @param str1 * @param str2 * @return 返回计算的相识度 */ public static double getsimilardegree(string str1, string str2) { //创建向量空间模型,使用map实现,主键为词项,值为长度为2的数组,存放着对应词项在字符串中的出现次数 map<string, int[]> vectorspace = new hashmap<string, int[]>(); int[] itemcountarray = null;//为了避免频繁产生局部变量,所以将itemcountarray声明在此 //以空格为分隔符,分解字符串 string strarray[] = str1.split(" "); for(int i=0; i<strarray.length; ++i) { if(vectorspace.containskey(strarray[i])) ++(vectorspace.get(strarray[i])[0]); else { itemcountarray = new int[2]; itemcountarray[0] = 1; itemcountarray[1] = 0; vectorspace.put(strarray[i], itemcountarray); } } strarray = str2.split(" "); for(int i=0; i<strarray.length; ++i) { if(vectorspace.containskey(strarray[i])) ++(vectorspace.get(strarray[i])[1]); else { itemcountarray = new int[2]; itemcountarray[0] = 0; itemcountarray[1] = 1; vectorspace.put(strarray[i], itemcountarray); } } //计算相似度 double vector1modulo = 0.00;//向量1的模 double vector2modulo = 0.00;//向量2的模 double vectorproduct = 0.00; //向量积 iterator iter = vectorspace.entryset().iterator(); while(iter.hasnext()) { map.entry entry = (map.entry)iter.next(); itemcountarray = (int[])entry.getvalue(); vector1modulo += itemcountarray[0]*itemcountarray[0]; vector2modulo += itemcountarray[1]*itemcountarray[1]; vectorproduct += itemcountarray[0]*itemcountarray[1]; } vector1modulo = math.sqrt(vector1modulo); vector2modulo = math.sqrt(vector2modulo); //返回相似度 return (vectorproduct/(vector1modulo*vector2modulo)); } /** * 主方法 */ public static void main(string args[]) { string str1 = "阳光活泼 跑步 羽毛球"; string str2 = "爱美食 跑步 篮球 足球 冰棒球 骑马 游泳"; string str3 = "90后 动漫 旅游 爱美女"; string str4 = "阳光活泼 爱游戏 爱代码 码农"; string str5 = "羽毛球 羽毛球 羽毛球 羽毛球"; string str6 = "阳光活泼 跑步 羽毛球"; system.out.println("str1和str2相识度:" + similardegreebycos.getsimilardegree(str1, str2)); system.out.println("str1和str3相识度:" + similardegreebycos.getsimilardegree(str1, str3)); system.out.println("str1和str4相识度:" + similardegreebycos.getsimilardegree(str1, str4)); system.out.println("str1和str5相识度:" + similardegreebycos.getsimilardegree(str1, str5)); system.out.println("str1和str6相识度:" + similardegreebycos.getsimilardegree(str1, str6)); } }
效果:
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!