如何将连续变量矢量化以作为FAISS/HARRE的输入

2024-05-15 14:25:09 发布

您现在位置:Python中文网/ 问答频道 /正文

根据FAISS和Hatter的文档和教程,我了解他们都需要word2vec或手套嵌入等输入

我有一个包含30个连续变量(和10K个样本)的数据集(附图片),我想使用FAISS/HARRET查找给定样本的ANN。数据来自不同的传感器,每列都有一个固定的上限

如何对输入进行向量化(最好是python),以便为每个示例生成的向量具有空间关系(因为word2vec或手套向量具有空间关系,我们可以使用距离函数找到相似性)

enter image description here


Tags: 数据文档关系空间教程传感器word2vec向量