Не могу заменить строковый символ "-" в кадре данных на ноутбуке Jupyter - PullRequest
0 голосов
/ 02 января 2019

Я импортирую данные из "url = (" http://finviz.com/quote.ashx?t=" + symbol.lower ()) "

и получаю таблицу:

        P/B    P/E Forward P/E   PEG Debt/Eq EPS (ttm) Dividend %     ROE  \
AMZN  18.73  92.45       56.23  2.09    1.21     16.25          -  26.70%   
GOOG   4.24  38.86           -  2.55       -     26.65          -       -   
PG     4.47  22.67       19.47  3.45    0.61      4.05      3.12%  18.80%   
KO    11.04  30.26       21.36  4.50    2.45      1.57      3.29%  15.10%   
IBM    5.24   9.28        8.17  9.67    2.37     12.25      5.52%  30.90%   

         ROI   EPS Q/Q Insider Own  
AMZN   3.50%  1026.20%      16.20%  
GOOG       -    36.50%       5.74%  
PG    13.10%    15.50%       0.10%  
KO    12.50%    56.80%       0.10%  
IBM   17.40%     0.70%       0.10%  

Тогда я пыталсяпреобразовать строку в число с плавающей точкой:

df = df[(df['P/E'].astype(float)<20) & (df['P/B'].astype(float) < 3)] 

и получил «ValueError: не удалось преобразовать строку в число с плавающей точкой:«

Я думаю, что значения 0,70% и знак «-» являются проблемой.

Я пытался:

df.replace("-","0")
df.replace('-', 0)
df.replace('-', nan)

Но ничего не работает.

Ответы [ 2 ]

0 голосов
/ 02 января 2019

Вы должны использовать numpy:

import numpy as np

, затем следующую замену:

df = df.replace('-', np.nan)

Далее, измените тип данных:

df = df['Forward P/E'].astype(float)

Наконец, вы можетепроверить, является ли тип данных float64.

0 голосов
/ 02 января 2019

Возможно, вам придется вернуть его обратно

df=df.replace("-","0")

И я рекомендую to_numeric

df['P/E']=pd.to_numeric(df['P/E'],errors = 'coerce')
df['P/B']=pd.to_numeric(df['P/B'],errors = 'coerce')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...