我有两件事要做。你知道吗
1)我必须提取任何包含发票数据的CVS文件的头文件。 具体而言:发票号码、地址、位置、实物。 我被要求为这个任务创建一个文本分类器,因此分类器将遍历任何CVS文件并识别这4个标题。你知道吗
2)在分类器识别出4个单词后,我必须找到附加该列的数据并创建一个类。你知道吗
我研究了这个问题,我认为必须采用的三种方法是: 1) 坏话 2) 文字嵌入 3) K-均值聚类
单词包可以识别单词,但它没有给我单词本身的位置,以便我去抓取列并创建类。你知道吗
我相信,对于这个任务来说,wordembedded过于复杂了,即使给我文件中单词的位置也太耗时了
K-means似乎简单而有效,它告诉我单词在哪里。你知道吗
我开始编码前的问题
我错过什么了吗。我的推理正确吗? 最重要的是第二个问题 一旦在CSV文件中确定了单词的位置,我将如何将其转换为编码,以便将数据附加到该列中
我只想:
相关问题 更多 >
编程相关推荐