用于将非结构化fr地址字符串解析为地址组件的库
fraddress的Python项目详细描述
帧地址分析器
fr address是一个python库,用于使用从模式学习的自定义nlp模型将非结构化fr地址字符串解析为地址组件。 这个库依赖于parserator库。
如何使用fraddress
用pip安装fraddress。
pip install fraddress
然后用parse或tag解析一些地址。
>>> import fraddress
>>> fraddress.parse('51 rue Nationale Paris 75006')
[('51', 'AddressNumber'), ('rue', 'StreetType'), ('Nationale', 'StreetName'), ('Paris', 'City'), ('75006', 'Zipcode')]
>>> fraddress.tag('51 rue Nationale Paris 75006')
OrderedDict([('AddressNumber', '51'), ('StreetType', 'rue'), ('StreetName', 'Nationale'), ('City', 'Paris'), ('Zipcode', '75006')])
检查训练模式
转到training目录并检查文件trained_pattern.txt,查看模型已经知道哪个模式。
如何训练新的解析器
您只需要一些培训数据来教您的解析器有关其域的知识,然后follow the instructions of the U.S version。