Как разделить текст по символам в Pandas - PullRequest
0 голосов
/ 17 февраля 2020

В настоящее время я использую этот код:

df['name'] = df['name'].str.split("",expand=True,n=20)

Ошибка:

ValueError: split() requires a non-empty pattern match.

Ошибка находится в этой строке внутри Pandas код

-> 1387             f = lambda x: regex.split(x, maxsplit=n)

Он работает в некоторых Python средах, но не во всех, даже если версия Pandas такая же

Я получаю эту ошибку в некоторых python средах, таких как Google colab. Вероятно, относится к версии Regex. Мне было интересно, есть ли альтернатива этой линии, которая одинаково быстро?

1 Ответ

1 голос
/ 17 февраля 2020

первый параметр split необязателен, если вы не добавляете какие-либо значимые данные для разделения, тогда почему бы просто не проигнорировать этот параметр.

df['name'] = df['name'].str.split(expand=True,n=20)

по умолчанию, он будет разделен пробелами

если вы хотите разделить по каждому символу, тогда напишите значимое регулярное выражение для разделения на

, если вы хотите разделить по любому числу или символу, используйте как

df['names'].str.split(r"[a-zA-Z0-9]",expand=True, n=20)

если вы хотите разделить на что-то, то

 df['names'].str.split(r".?",expand=True, n=20)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...