Pandaspd数据帧转换为元组而不是Datafram

2024-03-28 15:55:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我首先使用BeautifulSoup:

mydivs = soup.findAll('div', {"class": "content"})

使mydivs中的每个mydiv看起来像这样,例如:

^{pr2}$

然后我想将每个div中的每个文本块存储为数据帧中的行。我希望数据帧看起来像:

index posts
0     <div class="content">A number of  <br/><br/>three  ... </div>
1     <div class="content">Stack ... <br/><br/>overflow  ... </div>
...

这是我试过的密码

A=[]
indices=[]
j=0

for div in mydivs:
    A.append(div)
    indices.append(j)
    j+=1

DF = pd.DataFrame({'index': indices, "posts": A})

当我打印出shape我得到

print DF.shape()
TypeError: 'tuple' object is not callable

但是,我希望DF是一个数据帧,而不是tuple。我该怎么解决这个问题?在


Tags: 数据brdivdfindexcontentclassposts