如何将列内容解包到由单元格值确定的新列

STUDENT_ID TEST_SCORE_1 TEST_SCORE_2 MATHS 001 85 93 ALGEBRA_B+,GEOMETRY_A-,TRIGONOMETRY_C 002 73 95 ALGEBRA_B,GEOMETRY_B+,CALCULUS_C

STUDENT_ID TEST_SCORE_1 TEST_SCORE_2 ALGEBRA GEOMETRY TRIGONOMETRY CALCULUS 001 85 93 B+ A- C NaN 002 73 95 B B+ NaN C

1条回答

网友

1楼 · 发布于 2024-06-16 12:48:40

您可以在这里使用正则表达式和pivot

u = df.MATHS.str.extractall(r'([a-zA-Z]+)_([A-F][+-]?)').reset_index(1, drop=True)

#               0   1
# 0       ALGEBRA  B+
# 0      GEOMETRY  A-
# 0  TRIGONOMETRY   C
# 1       ALGEBRA   B
# 1      GEOMETRY  B+
# 1      CALCULUS   C

p = u.pivot(columns=0, values=1)

# 0 ALGEBRA CALCULUS GEOMETRY TRIGONOMETRY
# 0      B+      NaN       A-            C
# 1       B        C       B+          NaN

pd.concat([df.iloc[:, :-1], p], axis=1)

   STUDENT_ID  TEST_SCORE_1  TEST_SCORE_2 ALGEBRA CALCULUS GEOMETRY TRIGONOMETRY
0           1            85            93      B+      NaN       A-            C
1           2            73            95       B        C       B+          NaN

正则表达式解释

(                            # capture group 1
  [a-zA-Z]                   # match letters
  +                          # match 1 or more times
)
_                            # match the _ character
(                            # capture group 2
  [A-F]                      # match A-F (possible grades)
  [+-]                       # match either + or -
  ?                          # optional match of the + or -
)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将列内容解包到由单元格值确定的新列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >