Кадр данных панд. Согласованность столбцов. Привести целочисленные значения к фиксированной длине - PullRequest
0 голосов
/ 28 августа 2018

Я открываю файл .tsv следующим образом:

cols = ['movie id','movie title','genre']
movies = pd.read_csv('movies.dat', sep='::', index_col=False, names=cols, encoding="UTF-8",)

+---+----------+-------------------------------------+
|   | movie id |             movie title             |
+---+----------+-------------------------------------+
| 0 |        8 | La sortie des usines Lumière (1895) |
| 1 |       12 | The Arrival of a Train (1896)       |
| 2 |       91 | Le manoir du diable (1896)          |
| 3 |      417 | Le voyage dans la lune (1902)       |
+---+----------+-------------------------------------+

В исходном файле .tsv все значения в столбце идентификатора фильма имеют фиксированную длину и начинаются с 0, например, 0000008, 0000012, 0000091, 0000417.

Мне нужно объединить этот столбец позже с другим фреймом данных, который имеет номера в формате tt0000008, tt0000012. Для этого я пытаюсь получить цифры полностью, не пропуская 0.

Как бы иметь полные числа, такие как 0000008, 0000012, 0000091, 0000417?

1 Ответ

0 голосов
/ 28 августа 2018

Я рекомендую преобразовать в str, затем отформатировать с pad или rjust

s.astype(str).str.rjust(7,'0')
Out[168]: 
0    0000008
1    0000012
2    0000091
3    0000417
dtype: object
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...