我正在解析一个大型DBF文件以导入mongodb。你知道吗
DBF文件中的一个字段称为Description
,如下所示
WOMEN'S CC CROPPED TOP T-SHIRT - MELANGE GREY - S
WOMEN'S CC CROPPED TOP T-SHIRT - MELANGE GREY - M
WOMEN'S CC CROPPED TOP T-SHIRT - WHITE- L
WOMEN'S CC CROPPED TOP T-SHIRT- WHITE -XL
WOMEN'S CC CROPPED TOP T-SHIRT- WHITE -2XL
WOMEN'S CC CROPPED TOP T-SHIRT- WHITE -3XL
JUNIOR EP ORGANIC T-SHIRT - YELLOW- 3-4 YRS
JUNIOR EP ORGANIC T-SHIRT - YELLOW - 5-6 YRS
EP ORGANIC BIB - PINK -ONE SIZE
最好的方法是什么来分割它,这样我就有了product name
、colour
和size
?你知道吗
在大多数情况下,我可以:
try:
description, colour_name, size = style_meta_attributes['CN_DESC'].split('- ')
if colour_name not in colour_names:
colour_names.append(colour_name)
if size not in sizes_names:
sizes_names.append(size)
except:
try:
description, colour_name, size = style_meta_attributes['CN_DESC'].split(' -')
...
对于每个splits = [' - ', '- ', ' -', ' -', ' - ', '-']
但是当我有T-SHIRT
或3-4 YRS
的时候,这就起作用了
非常感谢您的建议。你知道吗
试试看
其思想是要求在分隔符之前或之后(或两侧)使用空格。你知道吗
相关问题 更多 >
编程相关推荐