Как токенизировать один столбец в CSV-файле с 2 столбцами, используя Pandas DataFrame - PullRequest
0 голосов
/ 24 января 2019

Я пытаюсь выполнить анализ настроений с помощью байесовского классификатора, и у меня есть файл CSV, состоящий из строк со следующей структурой:

Column 1: Either 1 or 0 
Column 2: String 

Example: 1 | This is a great movie 

Я использую панды при чтении файла CSV (read_csv),

После прочтения каждой строки из файла CSV имеет следующую структуру:

1;This is a great movie
0;This is a bad movie

Я хотел бы разбить каждую строку на столбец 2. Однако мне не удалось это сделать.Как мне решить эту проблему?

1 Ответ

0 голосов
/ 24 января 2019

Предполагая, что df выглядит так (просто замените имя столбца от 0 до column_name, которое у вас есть в качестве заголовка:

                        0
0  1;This is a great movie
1    0;This is a bad movie

pd.DataFrame(df[0].apply(lambda x: x.split(";")).values.tolist(),columns=['A','B'])
   A                      B
0  1  This is a great movie
1  0    This is a bad movie
...