好的,这是我真正的数据帧,我想用list对特定值进行重塑。所以 我有这个数据框要重新塑造
[Out] = df
Keterangan Q2 2019 Q2 2018
0 Kas 22686796.0 27421625.0
1 Giro pada bank indonesia 68409507.0 71159442.0
2 Giro pada bank lain 15675129.0 12584938.0
3 Giro pada bank lain pihak ketiga 88548.0 92417.0
4 Giro pada bank lain pihak berelasi 41391653.0 84668151.0
5 Penempatan pada bank indonesia dan bank lain 1825890.0 2349900.0
6 Penempatan pada bank indonesia dan bank lain pihak ketiga 28443695.0 30264303.0
7 Penempatan pada bank indonesia dan bank lain pihak berelasi 144798482.0 154020507.0
8 Efek-efek yang diperdagangkan -758.0 -758.0
9 Efek-efek yang diperdagangkan pihak ketiga 24081797.0 9396553.
10 Efek-efek yang diperdagangkan pihak berelasi 20253524.0 20584035.0
11 Cadangan kerugian penurunan nilai pada efek-efek 2713267.0 6858655.0
12 Efek yang dibeli dengan janji dijual kembali 7014696.0 10165310.0
13 Wesel ekspor dan tagihan lainnya 573030.0 1477693.0
14 Wesel ekspor dan tagihan lainnya pihak ketiga 335008.0 485810.0
15 Wesel ekspor dan tagihan lainnya pihak berelasi 748120507.0 709223043.0
16 Tagihan akseptasi 113999397.0 110787114.0
17 Tagihan akseptasi pihak ketiga -38848157.0 -35017982.0
18 Tagihan akseptasi pihak berelasi NaN NaN
19 Tagihan derivatif NaN NaN
20 Tagihan derivatif pihak ketiga NaN NaN
21 Pinjaman yang diberikan NaN NaN
22 Pinjaman yang diberikan pihak ketiga NaN NaN
23 Pinjaman yang diberikan pihak berelasi NaN NaN
24 Cadangan kerugian NaN NaN
我想用我以前拥有的特定列表来重塑它,这是我的列表
my_list = ['Giro pada bank lain', 'Penempatan pada bank indonesia dan bank lain', 'Efek-efek yang diperdagangkan', 'Wesel ekspor dan tagihan lainnya', 'Tagihan akseptasi', 'Tagihan derivatif', 'Pinjaman yang diberikan']
所以,如果列['Keterangan']上的字符串contain与列表中的项目字符串匹配,它将改变特定列[2019年第2季度]和[2018年第2季度]的形状,使其向下移动。这里是我想要的数据帧
[Out] : df1
Keterangan Q2 2019 Q2 2018
0 Kas 22686796.0 27421625.0
1 Giro pada bank indonesia 68409507.0 71159442.0
2 Giro pada bank lain Nan Nan
3 Giro pada bank lain pihak ketiga 15675129.0 12584938.0
4 Giro pada bank lain pihak berelasi 88548.0 92417.0
5 Penempatan pada bank indonesia dan bank lain Nan Nan
6 Penempatan pada bank indonesia dan bank lain pihak ketiga 41391653.0 84668151.0
7 Penempatan pada bank indonesia dan bank lain pihak berelasi 1825890.0 2349900.0
8 Efek-efek yang diperdagangkan Nan Nan
9 Efek-efek yang diperdagangkan pihak ketiga 28443695.0 30264303.0
10 Efek-efek yang diperdagangkan pihak berelasi 144798482.0 154020507.0
11 Cadangan kerugian penurunan nilai pada efek-efek -758.0 -758.0
12 Efek yang dibeli dengan janji dijual kembali 24081797.0 9396553
13 Wesel ekspor dan tagihan lainnya Nan Nan
14 Wesel ekspor dan tagihan lainnya pihak ketiga 20253524.0 20584035.0
15 Wesel ekspor dan tagihan lainnya pihak berelasi 2713267.0 6858655.0
16 Tagihan akseptasi Nan Nan
17 Tagihan akseptasi pihak ketiga 7014696.0 10165310.0
18 Tagihan akseptasi pihak berelasi 573030.0 1477693.0
19 Tagihan derivatif NaN NaN
20 Tagihan derivatif pihak ketiga 335008.0 485810.0
21 Pinjaman yang diberikan NaN NaN
22 Pinjaman yang diberikan pihak ketiga 748120507.0 709223043.0
23 Pinjaman yang diberikan pihak berelasi 113999397.0 110787114.0
24 Cadangan kerugian -38848157.0 -35017982.0
我必须尝试一些代码来重塑它,将df.index移到另一列,并将列['Keterangan']切换为索引
match = df['Keterangan'].str.fullmatch('|'.join(entry for entry in my_list))
df['shift'] = match.cumsum()
df['index'] = df.index
df.set_index('Keterangan', drop=True, inplace=True)
和它的工作,使转移和开关指数
Q2 2019 Q2 2018 shift index
Keterangan
Kas 22686796.0 27421625.0 0 0
Giro pada bank indonesia 68409507.0 71159442.0 0 1
Giro pada bank lain 15675129.0 12584938.0 1 2
Giro pada bank lain pihak ketiga 88548.0 92417.0 1 3
Giro pada bank lain pihak berelasi 41391653.0 84668151.0 1 4
Penempatan pada bank indonesia dan bank lain 1825890.0 2349900.0 2 5
Penempatan pada bank indonesia dan bank lain pihak ketiga 28443695.0 30264303.0 2 6
Penempatan pada bank indonesia dan bank lain pihak berelasi 144798482.0 154020507.0 2 7
Efek-efek yang diperdagangkan -758.0 -758.0 3 8
Efek-efek yang diperdagangkan pihak ketiga 24081797.0 9396553.0 3 9
Efek-efek yang diperdagangkan pihak berelasi 20253524.0 20584035.0 3 10
Cadangan kerugian penurunan nilai pada efek-efek yang 2713267.0 6858655.0 3 11
Efek yang dibeli dengan janji dijual kembali 7014696.0 10165310.0 3 12
Wesel ekspor dan tagihan lainnya 573030.0 1477693.0 4 13
Wesel ekspor dan tagihan lainnya pihak ketiga 335008.0 485810.0 4 14
Wesel ekspor dan tagihan lainnya pihak berelasi 748120507.0 709223043.0 4 15
Tagihan akseptasi 113999397.0 110787114.0 5 16
Tagihan akseptasi pihak ketiga -38848157.0 -35017982.0 5 17
Tagihan akseptasi pihak berelasi NaN NaN 5 18
Tagihan derivatif NaN NaN 6 19
Tagihan derivatif pihak ketiga NaN NaN 6 20
Pinjaman yang diberikan NaN NaN 7 21
Pinjaman yang diberikan pihak ketiga NaN NaN 7 22
Pinjaman yang diberikan pihak berelasi NaN NaN 7 23
Cadangan kerugian NaN NaN 7 24
接下来,我想要一个执行最后一个代码来重新移位列
df = df.apply(lambda row: df.shift(row.at['shift']).iloc[row.at['index']],
axis='columns')
df[list(match)] = np.nan
但是,它出现了一个问题。。它是这样说的。但是,我已经检查了df['index']类型是否为int64。为什么本栏不能应用iloc
TypeError Traceback (most recent call last)
<ipython-input-67-0f4a937e0002> in <module>()
----> 1 df = df.apply(lambda row: df.shift(row.at['shift']).iloc[row.at['index']],
axis='columns')
2 df[list(match)] = np.nan
/usr/local/lib/python3.6/dist-packages/pandas/core/indexing.py in _getitem_axis(self, key, axis)
1491 key = item_from_zerodim(key)
1492 if not is_integer(key):
-> 1493 raise TypeError("Cannot index by location index with a non-integer key")
1494
1495 # validate the location
TypeError: Cannot index by location index with a non-integer key
如何解决问题并获得我希望的df1?有人能解决吗
我现在明白是什么导致了问题。如果你看看结果
你会看到类似的东西
这些行是一个统一类型的系列,这里是
float64
从documentation开始:
还有一些问题。看看这些简单的例子
您将看到以下输出
两者都是系列。在第一个例子中,Pandas看到所有类型都是数值的,因此它选择了最好的数值类型来容纳这两个值的类型,即
float
。在第二种情况下,由于字符串的缘故,Pandas选择了object
,这几乎可以容纳所有类型在来自other question的数据帧中,2中有一个字符串。三,。列(
'Nan'
,它不是NaN
!),它导致类型object
,在下面的例子中还导致apply
中row
变量中的类型object
。这里的数据帧在2中有tpyefloat
。三,。列(NaN
的类型是float
),因此也是row
变量中的float
。这就是为什么原始代码适用于第一个示例,但不适用于这里。(至少我是这么想的,我可能错了。)我已经相应地调整了suggestion中的代码(
int
casts)相关问题 更多 >
编程相关推荐