多维np数组的列表序列

array([array(['1', '2', '3', '4'], dtype='<U1'), array(['5', '6', '7', '8'], dtype='<U1'), array(['9', '10', '11', '12'], dtype='<U2'), array(['13', '14', '15', '16'], dtype='<U2')], dtype=object)

1条回答

网友

1楼 · 发布于 2024-06-16 10:11:28

您可以直接使用df.A上的^{}和参数expand=True进行操作，然后使用values例如：

df = pd.DataFrame({'A':['70 80 82','151 150 147']})
print (df.A.str.split(' ',expand=True).values)
array([['70', '80', '82'],
       ['151', '150', '147']], dtype=object)

使用您的方法，如果所有字符串包含相同数量的数字，您仍然可以使用^{}获得相同的结果：

print (np.stack(df.A.apply(lambda x: np.array(x.split(" "))).values))

编辑：对于不同之处，我不确定我能解释得足够好，但我尝试了。让我们定义

arr1 = df.A.str.split(' ',expand=True).values
arr2 = df.A.apply(lambda x: np.array(x.split(" "))).values

首先，您可以注意到形状不同：

print(arr1.shape)
(2, 3)
print(arr2.shape)
(2,)

所以我想说的一个区别是arr2是一个1D元素数组，碰巧也是1D数组。当您使用values构造arr2时，它从序列df.A.apply(lambda x: np.array(x.split(" ")))构造1D数组，而不查看该序列中的类型。对于arr1，区别在于df.A.str.split(' ',expand=True)不是序列而是数据帧，因此使用values将构造一个形状为(number of rows,nb of columns)的二维数组。在这两种情况下，您都使用了values，但在序列的单元格中实际拥有一个数组（正如在您的方法中创建的那样）不会创建2D数组

然后，如果您想要访问任何元素（例如第一行第二个元素），您可以通过arr1[0,1]来完成，而arr2[0,1]将抛出一个错误，因为此结构不是2D数组，但是arr2[0][1]给出了很好的答案，因为您访问了arr2中第一个1D数组的第二个元素[1]

我希望它能给出一些解释

相关问题更多 >

编程相关推荐

热门问题

热门文章