计算不同长度矩阵和向量余弦相似性的有效方法?

2024-04-26 00:14:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图计算向量矩阵和向量的余弦相似性。在

我正在使用此函数:

    matrix_example =  [list([u'phase', u'nepal', u'formulation', u'workshop', u'janakpur', u'kamala', u'river', u'system', u'stakeholder', u'dhanusa']) list([u'ready', u'flood', u'myself', u'with', u'upcoming', u'interview', u'crack', u'video', u'escape', u'reality', u'life', u'bts_twt']) list([u'what', u'possibly', u'could', u'wrong', u'some', u'flood', u'some', u'storm', u'fire', u'trump', u'environment', u'chief', u'suggests', u'global'])]

    vector_example = [u'evidently' u'that' u'blue' u'wave' u'calmed' u'blue' u'trickle' u'every' u'looking' u'more' u'more' u'like' u'tsunami']



def cos_matrix_multiplication(matrix, vector):

    #Calculating pairwise cosine distance using matrix vector multiplication.

    dotted = np.reshape(matrix.dot(vector))
    matrix_norms = np.linalg.norm(matrix, axis=1)
    vector_norm = np.linalg.norm(vector)
    matrix_vector_norms = np.multiply(matrix_norms, vector_norm)
    neighbors = np.divide(dotted, matrix_vector_norms)
    return neighbors

但是,我有这个错误,因为矩阵中的向量的长度和inpu向量的长度不一样。在

^{2}$

我找到了一些响应,以便处理不同长度的向量,但我无法将其应用于向量矩阵。我要处理大量的数据,要用向量对来处理会很长时间。在


Tags: normexamplemorenp矩阵someblue向量