Question

В настоящее время я использую этот код:

df['name'] = df['name'].str.split("",expand=True,n=20)

Ошибка:

ValueError: split() requires a non-empty pattern match.

Ошибка находится в этой строке внутри Pandas код

-> 1387             f = lambda x: regex.split(x, maxsplit=n)

Он работает в некоторых Python средах, но не во всех, даже если версия Pandas такая же

Я получаю эту ошибку в некоторых python средах, таких как Google colab. Вероятно, относится к версии Regex. Мне было интересно, есть ли альтернатива этой линии, которая одинаково быстро?

Sanjay · Answer 1 · 17 февраля 2020

первый параметр split необязателен, если вы не добавляете какие-либо значимые данные для разделения, тогда почему бы просто не проигнорировать этот параметр.

df['name'] = df['name'].str.split(expand=True,n=20)

по умолчанию, он будет разделен пробелами

если вы хотите разделить по каждому символу, тогда напишите значимое регулярное выражение для разделения на

, если вы хотите разделить по любому числу или символу, используйте как

df['names'].str.split(r"[a-zA-Z0-9]",expand=True, n=20)

если вы хотите разделить на что-то, то

 df['names'].str.split(r".?",expand=True, n=20)

Как разделить текст по символам в Pandas

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как разделить текст по символам в Pandas

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов