如何连接两个TFIDF向量以及可以输入到模型中的其他特征？

1条回答

网友

1楼 · 发布于 2024-06-16 08:25:02

在我之前有一条评论回答了这个问题，但我再也看不到这条评论了。我显然忘记了这个方法，但是在我的程序的其他区域使用了它

使用numpy.hstack（tup）或numpy.vstack（tup），其中

tup-ndarray序列
除了可以是任意长度的一维阵列外，阵列必须沿第二个轴具有相同的形状

它返回一个堆叠的：ndarray

这里有一些代码以防万一

注意：我这里没有余弦相似性计算。你想怎么做就怎么做。我试着尽快做到这一点，但也要尽可能清楚。希望这对别人有帮助

def computeTF_IDF(trainX1, trainX2, testX1, testX2):
 vectorX1 = TfidfVectorizer(....)
 tfidfX1 = vectorX1.fit_Trasnsform(trainX1)

 vectorX2 = TfidfVectorizer(....)
 tfidfX2 = vectorX2.fit_Trasnsform(trainX2)

 tfidf_testX1= vec_body.transform(testX1)
 tfidf_testX2 = vec_headline.transform(testX2)
 
 # Optionally, you can insert code from * to ** here from below.

 return vectorX1, tfidfX1, ... , tfidf_testX1, tfidf_testX2

# Call TF-IDF function to compute.
trainX1_tfidf, trainX2_tfidf, testX1_tfidf , testX2_tfidf = computeTFIDF(trainX1,...,testX2)

#*

# Stack matrices horizontally (column wise) using hstack().
trainX_tfidf = scipy.sparse.hstack([trainX1_tfidf, trainX2_tfidf])
testX_tfidf = scipy.sparse.hstack([testX1_tfidf, testX2_tfidf])

# Convert Spare Matrix into an Array using toarray() 
trainX_tfidf_arr = trainX_tfidf.toarray()
testX_tfidf_arr = testX_tfidf.toarray()

# Concatenate TF-IDF and Cosine Similarity using numpy.c_[], 
# which is just another column stack.
trainX_tfidf_cos = np.c_[trainX_tfidf_arr, cosine_similarity]
testX_tfidf_cos = np.c_[testX_tfidf_arr, cosine_similarity_test]

#**

# You can now pass this to your Keras model.

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何连接两个TFIDF向量以及可以输入到模型中的其他特征？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >