我需要将一些json文件解析为一个数据帧。我想让一列包含文本中的单词,另一列包含相应的实体–当“value”对应于单词时,实体将是下面文本的“Type”,否则我想指定标签“O”。你知道吗
下面是一个例子。 这是JSON文件:
{"Text": "I currently use a Netgear Nighthawk AC1900. I find it reliable.",
"Entities": [
{
"Type": "ORGANIZATION ",
"Value": "Netgear"
},
{
"Type": "DEVICE ",
"Value": "Nighthawk AC1900"
}]
}
以下是我想要的:
WORD TAG
I O
currently O
use O
a O
Netgear ORGANIZATION
Nighthawk AC1900 DEVICE
. O
I O
find O
it O
reliable O
. O
有人能帮我分析一下吗?我不能使用split(),因为有时值由两个单词组成。希望这是清楚的。谢谢您!你知道吗
我不知道你所需要的是否就是你所期望的输出。 我给你的解决方案是“脏”(更多的元素和列标签放在第一位) 你可以设法清理它,并把它的格式,你需要的。因为您没有提供一段代码来开始,所以您可以完成它。 最终您会发现stackoverflow的目的不是让人们为您编写代码,而是让人们帮助您完成正在尝试的代码。你知道吗
这是输出:
这是一个困难的问题,取决于本例中没有哪些数据以及需要的输出。实体值中是否有重复数据?秩序重要吗?你想在输出中重复吗?你知道吗
可以使用以下几种工具:
相关问题 更多 >
编程相关推荐