Пожалуйста, помогите, этот бедный, трудолюбивый, специализирующийся на философии и экономике человек.
Я пытаюсь получить рыночную капитализацию Samsung Electronics с корейского сайта «finance.naver.com»
(Это не должен быть Samsung, мне просто нужно просканировать marketcap для моей количественной инвестиционной цели)
веб-сайт https://finance.naver.com/item/main.nhn?code=005930
это изображение веб-страницы и целевой номер в красном поле
это мой код
from bs4 import BeautifulSoup
import requests
mkc_url = 'https://finance.naver.com/item/main.nhn?code=005930'
mkc_result = requests.get(mkc_url)
mkc_obj = BeautifulSoup(mkc_result.content, "html.parser")
Я нашел целевой номер в теге 'div', 'first' class
mkc = mkc_obj.find("div",{"class": "first"})
в теге 'div', я обнаружил, что число находится в теге 'em', id _market_sum
em_id = mkc.find("em", {"id":"_market_sum"})
finanlly я получил такой результат
'조' - мера корейской валюты, поэтому я хотел удалить все, кроме цифр, но я не сделал не знаю, как
Я поместил этот результат в DataFrame и попытался удалить все, кроме чисел, используя .str.strip
df_mkc = pd.DataFrame(em_id)
df_mkc[0] = df_mkc[0].str.strip('\n')
df_mkc[0] = df_mkc[0].str.strip('\t')
df_mkc[0] = df_mkc[0].str.strip()
df_mkc = df_mkc.replace({'\$': '', ',': ''}, regex=True)
и это становится все более и более уродливым
В этот момент я отключился
Пожалуйста, помогите !!!
Спасибо за всю вашу доброту, мудрость и щедрость