na_rep в pandas .Series.str.cat, кажется, не работает при попытке объединить несколько столбцов - PullRequest
0 голосов
/ 02 апреля 2020

У меня странная проблема. У меня есть файл Excel с некоторыми пустыми полями. По умолчанию они представлены нансами в дате. У меня есть 80 столбцов, и я хочу объединить данные построчно, например. из столбцов 7-11 (заголовки столбцов - это числа в моем случае).

Пример функции слияния:

value.old_positions = [7, 8, 9, 10, 11]
value.sep = ' '
def merge(df, value):
        df['merged'] = ''
        df = df.astype(str)
        df['merged'] = df['merged'].str.cat(
            df[value.old_positions], sep=value.sep, na_rep=''
        )
        return df['merged']

например. строка ввода в excel:

--- 541 G Winter Road Mr --- пустая ячейка --- Эмма ---- Оклахома --- 41820

например , строка вывода в excel:

541 G Winter Road Mr nan Эмма Оклахома 41820

nan указывает здесь пустое поле в Excel

Когда я использовал этот метод, но я объединял два столбца na_rep работал нормально. Может кто-нибудь объяснить, почему он не работает с несколькими столбцами, или показать лучший способ объединения длинных столбцов (6,5 тыс. Строк)?

С уважением, Ред.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...