У меня есть кадр данных, который выглядит следующим образом:

Я не уверен, что такое технический термин (я думаю, что это тайлинг), но я хочу добавить в него новый столбец, содержащий строку чисел в диапазоне от 1 до 5, которая равномерно распределяется как можно лучше, поэтому мой фрейм данных выглядит примерно так:

Как мне это сделать?
Заранее спасибо.
РЕДАКТИРОВАТЬ 2018-11-08:
Попросили вставить фактические данные в вопрос.
Как мои данные выглядят в настоящее время:
Name Score
Harry 43
Sally 234
Mary 54
John 34
Francis 12
Devon 43
James 54
Holly 65
Molly 23
Nancy 12
Ben 32
Вот как я хочу, чтобы это выглядело:
Name Score Tile
Harry 43 1
Sally 234 1
Mary 54 1
John 34 2
Francis 12 2
Devon 43 3
James 54 3
Holly 65 4
Molly 23 4
Nancy 12 5
Ben 32 5
РЕДАКТИРОВАТЬ ДАЛЬНЕЙШИЙ ВОПРОС 2018-11-08:

Name Animals Tile
Mary cat 1
John cat 2
Molly cat 3
Harry dog 1
Sally dog 2
Francis dog 3
James dog 1
Devon horse 1
Nancy mouse 1
Ben mouse 2
Holly snake 1
import pandas as pd
df=pd.DataFrame({'Name':['Harry','Sally','Mary','John','Francis','Devon','James','Holly','Molly','Nancy','Ben'], 'Score': [43,234,54,34,12,43,54,65,23,12,32],
'Animal': ['dog', 'dog', 'cat', 'cat', 'dog', 'horse', 'dog', 'snake', 'dog', 'mouse', 'horse']})
tiles = pd.qcut(df.index, 3, labels=False)
tiles=tiles+1
df['tiles']=tiles
print(df)
ДАЛЬНЕЙШЕЕ РЕДАКТИРОВАНИЕ ДАЛЬНЕЙШЕГО ВОПРОСА 2018-11-08:
Я изменил свой код так:
import pandas as pd
import numpy as np
df=pd.DataFrame({'Name':['Harry','Sally','Mary','John','Francis','Devon','James','Holly','Molly','Nancy','Ben'], 'Score': [43,234,54,34,12,43,54,65,23,12,32],
'Animal': ['dog', 'dog', 'cat', 'cat', 'dog', 'horse', 'dog', 'snake', 'dog', 'mouse', 'horse']})
tiles = pd.qcut(np.arange(len(df["Animal"])),3)
df['tiles']=tiles
print (df)
И я получил следующий результат:
