请帮助,这可怜的,挣扎的,哲学和;经济专业的人
我正试图从韩国网站“finance.naver.com”获取三星电子的市值
(不需要是三星,我只需要为我的定量投资目的爬升市值)
该网站是 https://finance.naver.com/item/main.nhn?code=005930
这是我的密码
from bs4 import BeautifulSoup
import requests
mkc_url = 'https://finance.naver.com/item/main.nhn?code=005930'
mkc_result = requests.get(mkc_url)
mkc_obj = BeautifulSoup(mkc_result.content, "html.parser")
我发现目标号码在'div'标签'first'类中
mkc = mkc_obj.find("div",{"class": "first"})
在“div”标签中,我发现号码在“em”标签中,“u market\u sum”id
em_id = mkc.find("em", {"id":"_market_sum"})
最后我得到了这样的结果
"조' 是韩国货币的度量单位,所以我想删除除数字以外的所有内容,但我不知道如何删除
我所做的是将结果放入数据框,并尝试使用“.str.strip”删除除数字以外的所有内容
df_mkc = pd.DataFrame(em_id)
df_mkc[0] = df_mkc[0].str.strip('\n')
df_mkc[0] = df_mkc[0].str.strip('\t')
df_mkc[0] = df_mkc[0].str.strip()
df_mkc = df_mkc.replace({'\$': '', ',': ''}, regex=True)
它变得越来越可怕
我在这一点上敲了一下
请帮忙
谢谢你的好意、惠斯顿和慷慨
定义了
em_id
之后,通过执行然后,您可以使用(多亏了this answer)消除空白
最后,如果货币总是相同的,您可以通过执行以下操作创建一个包含两个数值的列表
您可能希望通过执行以下操作来除去
4,299
中的逗号并使用
现在
mcap_list
等于[290,4299]
另一种解决方案是使用^{} 和^{} ,考虑到以下虚拟数据帧:
相关问题 更多 >
编程相关推荐