在大Pandas中旋转每组问题的回答

在大Pandas中旋转每组

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

假设你有一个像 <pre><code>>>> df = pd.DataFrame({"cid": np.arange(64)//8, "price": np.arange(64)}) >>> df.head() cid price 0 0 0 1 0 1 2 0 2 3 0 3 4 0 4 </code></pre> 那么我想你可以通过组合<code>groupby</code>和{<cd2>}得到你想要的： ^{pr2}$ 这给了 <pre><code>>>> pivoted cid price1 price2 price3 price4 price5 price6 price7 price8 0 0 0 1 2 3 4 5 6 7 1 1 8 9 10 11 12 13 14 15 2 2 16 17 18 19 20 21 22 23 3 3 24 25 26 27 28 29 30 31 4 4 32 33 34 35 36 37 38 39 5 5 40 41 42 43 44 45 46 47 6 6 48 49 50 51 52 53 54 55 7 7 56 57 58 59 60 61 62 63 </code></pre> 旁白：在字符串的末尾加上数字，例如“price5”，通常不是一个好主意。你不能真的和他们一起工作，他们不像你期望的那样分类，等等 <hr/> 首先，我们创建一个列，显示价格中的某个指数： <pre><code>>>> df["num"] = df.groupby("cid")["price"].cumcount() + 1 >>> df.head(10) cid price num 0 0 0 1 1 0 1 2 2 0 2 3 [etc.] 7 0 7 8 8 1 8 1 9 1 9 2 </code></pre> 然后我们<code>pivot</code>： <pre><code>>>> pivoted = df.pivot(index="cid", columns="num", values="price") >>> pivoted num 1 2 3 4 5 6 7 8 cid 0 0 1 2 3 4 5 6 7 1 8 9 10 11 12 13 14 15 2 16 17 18 19 20 21 22 23 3 24 25 26 27 28 29 30 31 4 32 33 34 35 36 37 38 39 5 40 41 42 43 44 45 46 47 6 48 49 50 51 52 53 54 55 7 56 57 58 59 60 61 62 63 </code></pre> 然后我们修复列： <pre><code>>>> pivoted.columns = "price" + pivoted.columns.astype(str) >>> pivoted price1 price2 price3 price4 price5 price6 price7 price8 cid 0 0 1 2 3 4 5 6 7 1 8 9 10 11 12 13 14 15 2 16 17 18 19 20 21 22 23 3 24 25 26 27 28 29 30 31 4 32 33 34 35 36 37 38 39 5 40 41 42 43 44 45 46 47 6 48 49 50 51 52 53 54 55 7 56 57 58 59 60 61 62 63 </code></pre> 最后我们重置索引： <pre><code>>>> pivoted = pivoted.reset_index() >>> pivoted cid price1 price2 price3 price4 price5 price6 price7 price8 0 0 0 1 2 3 4 5 6 7 1 1 8 9 10 11 12 13 14 15 2 2 16 17 18 19 20 21 22 23 3 3 24 25 26 27 28 29 30 31 4 4 32 33 34 35 36 37 38 39 5 5 40 41 42 43 44 45 46 47 6 6 48 49 50 51 52 53 54 55 7 7 56 57 58 59 60 61 62 63 </code></pre>

在大Pandas中旋转每组

1 个回答

相关Python问题