Невозможно понять значение регулярного выражения и ввода в pd.replace (regex = False, inplace = False) - PullRequest
0 голосов
/ 08 июня 2018

DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad', axis=None)

Может ли кто-нибудь объяснить значение регулярного выражения и место в приведенной выше строке?

1 Ответ

0 голосов
/ 08 июня 2018

из документа:

регулярное выражение: bool или типы, аналогичные to_replace, по умолчанию False

Следует ли интерпретировать to_replace и / или значение как регулярные выражения.Если это True, то to_replace должен быть строкой.В противном случае to_replace должно быть None, потому что этот параметр будет интерпретироваться как регулярное выражение или список, dict или массив регулярных выражений.

inplace: boolean, по умолчанию False

Если True, вместо.Примечание: это изменит любые другие представления этого объекта (например, столбец из DataFrame).Возвращает вызывающую сторону, если это True.

In [39]: import pandas as pd

In [40]: df = pd.DataFrame({"country":["United Kingdom of Great Britain", "Ireland", "United Kingdom of Great Britain & Ireland"], "value":[12,31, 43]})

In [41]: df
Out[41]: 
                                     country  value
0            United Kingdom of Great Britain     12
1                                    Ireland     31
2  United Kingdom of Great Britain & Ireland     43

, передавая шаблон регулярного выражения ^ и * в строке как параметр to_place и value, который заменит соответствующий шаблон значением

In [42]: df.country.replace("^United Kingdom of Great Britain.*", "United Kingdom", regex=True, inplace=True)

In [43]: df
Out[43]: 
          country  value
0  United Kingdom     12
1         Ireland     31
2  United Kingdom     43

сверху Строка "United Kingdom ......." заменяется значением United Kingdom и inplace = True изменяет тот же кадр данных df.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...