Python中文
首页
教程
问答
标签
搜索
登录
注册
我是否应该为命名实体识别提取域名词?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我的问题也许不完全是编程,但我知道许多有才华的程序员都在做NLP,也许还能够回答我的问题。在</p> <p>我用域词编译了一个文档,对其执行模糊匹配以提取文本中的命名实体。格式如下:</p> <pre><code> "ferry names": [ { "stena danica": [ "stena danica", "danica" ] }, </code></pre> <p>外部对象是类别,内部对象是实体。最里面的列表是可以调用实体的同义词列表。 现在,我的命名实体识别,虽然很简单,但效果很好。不过,为了方便起见,我决定把传来的文字全部删掉。在</p> ^{pr2}$ <p>词干分析器(nltk snowball-stemmer,SwedishStemmer)工作得很出色,但它也可以对领域词进行词干,在本例中,<code>Stena Danica</code>。在</p> <p><strong>问题:</strong>我不确定如何处理这个问题,我是应该简单地将词干转换为非词干领域的单词,还是将词干的版本与同义词放在一起? 尽管如此,它仍然会被模糊匹配器拾取,但它可能会引入问题。非常感谢。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你的问题其实只有一个答案:两种方法都试,测试(在你没有用于培训的数据上),然后选择最有效的。在</p> <p>一般来说,最好的方法取决于域,取决于训练数据的数量,等等,试试看吧。没有人能确切地预测它。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么我的神经网络模型的准确性不能在这个训练集上得到提高?
6 回答
为什么我的神经网络模型的权重变化不大?
1 回答
为什么我的神经网络的成本不断增加?
6 回答
为什么我的神经网络的输入pickle文件是19GB?
5 回答
为什么我的神经网络给属性错误?“非类型”对象没有属性“形状”
10 回答
为什么我的神经网络训练这么慢?
1 回答
为什么我的神经网络输出错误?
5 回答
为什么我的神经网络预测适用于MNIST手绘图像时是正确的,而适用于我自己的手绘图像时是不正确的?
8 回答
为什么我的神经网络验证精度比我的训练精度高,而且它们都是常数?
4 回答
为什么我的私人用户间聊天会显示在其他用户的聊天档案中?
2 回答
为什么我的积分的绝对误差估计值大于积分(使用scipy.integrate.nqad)?
6 回答
为什么我的积层回归器得分比它的组件差?
3 回答
为什么我的移动方法不起作用?
8 回答
为什么我的稀疏张量不能转换成张量
9 回答
为什么我的稀疏张量不能转换成张量?
8 回答
为什么我的程序“停止”了?
9 回答
为什么我的程序一直试图占用所有可用的CPU
5 回答
为什么我的程序不使用指定的代理
1 回答
为什么我的程序不工作(python帮助中的反向函数)?
2 回答
为什么我的程序不工作时,我使用多处理模块
2 回答