如何删除项目数量少于一定数量或有Pandas叮咬的行？

con = sqlite3.connect('/Users/mo/EXP/NAV/afm.db') sql = """ select * from stillinger limit 1000 """ dfs = pd.read_sql(sql, con) plb = """ select PLATSBESKRIVNING from stillinger limit 1000 """ dfp = pd.read_sql(plb, con);dfp

ts = s0.str.lower().str.split();ts 0 [medrek, rekrytering, söker, uppdrag, manpower... 1 [familj, barn, tjejer, kille, söker, pair, vil... 2 [uppgift, blir, tillsammans, medarbetare, leda... 3 [behov, operasjonssykepleiere, langtidsoppdrag... 4 [detta, perfekta, jobbet, arbetstiderna, varda... 5 [familj, paris, barn, söker, älskar, barn, vil... 6 [alla, inom, cafe, restaurang, förekommande, a... 7 [diskare, till, cafe, dubbel, sökes, arbetet, ... 8 [diskare, till, thelins, konditori, sökes, arb...

r = s0.str.split().apply(lambda x: [item for item in x if item not in mswl]);r 0 [uppdrag, bemanningsföretag, erbjuds, tillägg,... 1 [föräldrarna, citycentre, stort, tomt, mamman,... 2 [utveckla, övergripande, strategiska, frågor, ... 3 [erfaring, sykepleier, legitimasjon] 4 [arbetstiderna, vardagar, härliga, människor, ... 5 [paris, utav, badrum, båda, yngsta, endast, fö... 6 [förekommande, emot, utbildning] 7 [] 8 [thelins] 9 [paris, baby, månader, våning, delar, badrum, ...

dr = pd.DataFrame(r) dr0 = dr[dr.astype(str)['PLATSBESKRIVNING'] != '[]'].reset_index(drop=True); dr0 PLATSBESKRIVNING 0 [uppdrag, bemanningsföretag, erbjuds, tillägg,... 1 [föräldrarna, citycentre, stort, tomt, mamman,... 2 [utveckla, övergripande, strategiska, frågor, ... 3 [erfaring, sykepleier, legitimasjon] 4 [arbetstiderna, vardagar, härliga, människor, ... 5 [paris, utav, badrum, båda, yngsta, endast, fö... 6 [förekommande, emot, utbildning] 7 [thelins] 8 [paris, baby, månader, våning, delar, badrum, ...

dr1 = dr0['PLATSBESKRIVNING'].apply(str); len(dr1),type(dr1), dr1 0 ['uppdrag', 'bemanningsföretag', 'erbjuds', 't... 1 ['föräldrarna', 'citycentre', 'stort', 'tomt',... 2 ['utveckla', 'övergripande', 'strategiska', 'f... 3 ['erfaring', 'sykepleier', 'legitimasjon'] 4 ['arbetstiderna', 'vardagar', 'härliga', 'männ... 5 ['paris', 'utav', 'badrum', 'båda', 'yngsta', ... 6 ['förekommande', 'emot', 'utbildning'] 7 ['thelins'] 8 ['paris', 'baby', 'månader', 'våning', 'delar'...

0 ['uppdrag', 'bemanningsföretag', 'erbjuds', 't... 1 ['föräldrarna', 'citycentre', 'stort', 'tomt',... 2 ['utveckla', 'övergripande', 'strategiska', 'f... 3 ['arbetstiderna', 'vardagar', 'härliga', 'männ... 4 ['paris', 'utav', 'badrum', 'båda', 'yngsta', ... 5 ['paris', 'baby', 'månader', 'våning', 'delar'... . .

2条回答

网友

1楼 · 编辑于 2024-05-23 16:47:27

您可以使用apply len，然后选择数据将其存储在您喜欢的dataframe变量中，即

df[df['PLATSBESKRIVNING'].apply(len)>3]

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-05-23 16:47:27

只需测量列表中的项目数并筛选长度小于3的行

dr0['length'] = dr0['PLATSBESKRIVNING'].apply(lambda x: len(x))
cond = dr0['length'] > 3
dr0 = dr0[cond]

相关问题更多 >

编程相关推荐

热门问题

热门文章