擅长:python、mysql、java
<p>正如奥斯汀在上面指出的,有些类别是短语而不是单词。没有简单的方法来区分“成熟时的黄色和白色大小”这样的东西,以确定新线应该走向何方。所以,你需要提前有一个详尽的清单,列出所有可能的类别。如果你能提供,有很多方法可以做到这一点。这里有一个简单的例子:</p>
<pre><code>s = "Breed: Pembroke Welsh Corgi Price: $2,200 Gender: Female Nickname: Koko Age: 9 Weeks Old Color Markings: yellow and white Size at Maturity: Medium Availability Date: 09/30/2018 Shipping Area: Worldwide Payment Method: Money Order/Cashier's Check, Paypal, Credit Cards, Cash"
categories = ['Breed', 'Price', 'Gender:', 'Nickname', 'Age', 'Color/Markings',
'Size at Maturity', 'Availability Date', 'Shipping Area',
'Payment Method']
for cat in categories:
s = s.replace(cat + ':', '\n' + cat + ':')
print(s)
</code></pre>
<p>不过,如果可能的话,最好先修复生成此数据的内容,以便它具有适当的分隔符。你知道吗</p>