欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python 求向量的余弦值操作

程序员文章站 2022-03-16 19:44:23
1、余弦相似度余弦相似度衡量的是2个向量间的夹角大小,通过夹角的余弦值表示结果,因此2个向量的余弦相似度为:余弦相似度的取值为[-1,1],值越大表示越相似。向量夹角的余弦公式很简单,不在此赘述,直接...

1、余弦相似度

余弦相似度衡量的是2个向量间的夹角大小,通过夹角的余弦值表示结果,因此2个向量的余弦相似度为:

Python 求向量的余弦值操作

余弦相似度的取值为[-1,1],值越大表示越相似。

向量夹角的余弦公式很简单,不在此赘述,直接上代码:

def cosvector(x,y):
  if(len(x)!=len(y)):
    print('error input,x and y is not in the same space')
    return;
  result1=0.0;
  result2=0.0;
  result3=0.0;
  for i in range(len(x)):
    result1+=x[i]*y[i]  #sum(x*y)
    result2+=x[i]**2   #sum(x*x)
    result3+=y[i]**2   #sum(y*y)
  #print(result1)
  #print(result2)
  #print(result3)
  print("result is "+str(result1/((result2*result3)**0.5))) #结果显示
cosvector([2,1],[1,1])

一个计算二维数组余弦值的例子:

#求余弦函数
def cosvector(x,y):
  if(len(x)!=len(y)):
    print('error input,x and y is not in the same space')
    return;
  result1=0.0;
  result2=0.0;
  result3=0.0;
  for i in range(len(x)):
    result1+=x[i]*y[i]  #sum(x*y)
    result2+=x[i]**2   #sum(x*x)
    result3+=y[i]**2   #sum(y*y)
  #print("result is "+str(result1/((result2*result3)**0.5))) #结果显示
  return result1/((result2*result3)**0.5)
#print("result is ",cosvector([2,1],[1,1]))
 
#计算query_output(60,20)和db_output(60,20)的余弦值,用60*1的向量存储 
cosresult= [[0]*1 for i in range(60)] 
 
for i in range(60):
  cosresult[i][0]=cosvector(query_output[i], db_output[i])
 
print(cosresult)
--------------------------------------------------------------------------------------------
#计算query_output和db_output的余弦值,用60*1的向量存储
rows=query_output.shape[0] #行数
cols=query_output.shape[1] #列数
cosresult= [[0]*1 for i in range(rows)] 
 
for i in range(rows):
  cosresult[i][0]=cosvector(query_output[i], db_output[i])
 
#print(cosresult)
#将结果存入文件中,并且一行一个数字
file=open('cosresult.txt','w')
for i in cosresult:
 file.write(str(i).replace('[','').replace(']','')+'\n') #\r\n为换行符 
file.close()

补充:python实现余弦近似度

方法一:

def cos(vector1,vector2): 
  dot_product = 0.0 
  norma = 0.0 
  normb = 0.0 
  for a,b in zip(vector1,vector2): 
    dot_product += a*b 
    norma += a**2 
    normb += b**2 
  if norma == 0.0 or normb==0.0: 
    return none 
  else: 
    return 0.5 + 0.5 * dot_product / ((norma*normb)**0.5) #归一化 <span style="font-family: arial, helvetica, sans-serif;">从[-1,1]到[0,1]</span>

方法二:

num = float(a.t * b) #若为行向量则 a * b.t
denom = linalg.norm(a) * linalg.norm(b)
cos = num / denom #余弦值
sim = 0.5 + 0.5 * cos #归一化  从[-1,1]到[0,1]

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。