Изменение имен столбцов из фрейма данных - PullRequest
0 голосов
/ 10 ноября 2019

У меня есть дата-фрейм со всеми компаниями, перечисленными в S & P500, с их ежедневными данными. Однако в каждом имени столбца данных есть нежелательный "/n", добавленный к нему, и я хочу удалить его.

Я получаю следующую ошибку:

df.columns = df.columns.str.replace('*.\n.*', '')
  File "C:\Python37\lib\site-packages\pandas\core\strings.py", line 1843, in wrapper
    return func(self, *args, **kwargs)
  File "C:\Python37\lib\site-packages\pandas\core\strings.py", line 2716, in replace
    self._parent, pat, repl, n=n, case=case, flags=flags, regex=regex
  File "C:\Python37\lib\site-packages\pandas\core\strings.py", line 619, in str_replace
    compiled = re.compile(pat, flags=flags)
  File "C:\Python37\lib\re.py", line 234, in compile
    return _compile(pattern, flags)
  File "C:\Python37\lib\re.py", line 286, in _compile
    p = sre_compile.compile(pattern, flags)
  File "C:\Python37\lib\sre_compile.py", line 764, in compile
    p = sre_parse.parse(p, flags)
  File "C:\Python37\lib\sre_parse.py", line 930, in parse
    p = _parse_sub(source, pattern, flags & SRE_FLAG_VERBOSE, 0)
  File "C:\Python37\lib\sre_parse.py", line 426, in _parse_sub
    not nested and not items))
  File "C:\Python37\lib\sre_parse.py", line 651, in _parse
    source.tell() - here + len(this))
re.error: nothing to repeat at position 0 (line 1, column 1)

Эта функция вызывает ошибку:

def remove_extra_characters(df):
    df.columns = df.columns.str.replace('*.\n.*', '')

1 Ответ

0 голосов
/ 10 ноября 2019

Вот, пожалуйста! Новые строки исчезнут! :)

import pandas as pd

data = [['tom', 10], ['nick', 15], ['juli', 14]]

df = pd.DataFrame(data, columns=['Name\n\n\n', 'Age\n\n'])

df.rename(columns={old:old.strip() for old in df.columns}, inplace=True)

print(df)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...