如何从分类广告中提取街道地址?

2024-06-11 22:53:14 发布

您现在位置:Python中文网/ 问答频道 /正文

有很多分类广告以非HTML格式(纸张、文本、文字等)出现,它们倾向于出售房屋、汽车、出租、租赁、公寓等。分类广告例如,一个出租公寓的广告具有以下特征:大小、面积、地点、价格、联系方式。等等

我的问题是如何提取广告所居住或在前一篇文章中提到的街道地址(文章/地点中提到的地址)?在

有没有使用NLTK和python解决这个问题的方法?? 假设文章的源文件在普通文本文件(.txt)中。在


Tags: 文本地址html格式文章特征汽车广告
1条回答
网友
1楼 · 发布于 2024-06-11 22:53:14

如果源代码是.txt格式,正则表达式可能是最好的解决方案。 我认为为所有任意类型的广告编写一个regex并不容易(甚至可能),但是示例越多,搜索效果越好。在

相关问题 更多 >