我有一个关于文本处理的任务,我不知道如何将不同表中的一些列合并到一个表中
所以情况是这样的:
我有一个名为list
的表,其中有id_doc
和title
列
然后我创建一个名为term_list
的新表,当我对来自list
的标题进行文本处理时,该表包含一个结果项列表。你知道吗
term_list
表有id_term
、term
、df
和idf
列。最后,我想要一个名为term_freq
的表,它有id
、id_term
、id_doc
、tf
和normalized_tf
列
示例:
表list
如下所示:
id_doc titles
11 information retrieval system
12 operating system
13 business information
表term_list
如下:
id_term term df idf
21 information 2 --
22 retrieval 1 --
23 system 2 --
24 operating 1 --
25 business 1 --
我想问一下如何创建一个表term_freq
,使表变成这样?你知道吗
id id_term id_doc tf normalized_tf
31 21 11 1 --
32 22 11 1 --
33 23 11 1 --
34 24 12 1 --
35 23 12 1 --
36 25 13 1 --
37 21 13 1 --
主要问题是我必须将id_term
和id_doc
连接到一个表中,一个id_doc
与几个id_term
有关系,但我不知道如何关联,因为list
和term_list
没有任何类似的列。你知道吗
请帮忙:(
您可以迭代
term_list
中的行:对于每个
term
make:并将对
id_term
和id_doc
保存在表term_freq
中。你知道吗相关问题 更多 >
编程相关推荐