Я хотел бы ускорить операции на DataFrame
, применяя Index
во время загрузки (read_sql
). Но я не хочу менять большие части кода с разумного имени переменной на неопределенное c имя переменной index
. Давайте объясним это на примере:
Допустим, у меня есть DataFrame, подобный этому:
df = pd.read_sql(sql=QRY, con=connection)
| Name | Grade | | | |
|--------|-------|---|---|---|
| Peter | 2 | | | |
| Albert | 1 | | | |
| Lea | 1 | | | |
, так что позже я смогу получить доступ к столбцу, используя df.Name
:
| Name |
|--------|
| Peter |
| Albert |
| Lea |
но теперь, применяя index_col
df = pd.read_sql(sql=QRY, con=connection, index_col='Name')
| Index | Grade | | | |
|--------|-------|---|---|---|
| Peter | 2 | | | |
| Albert | 1 | | | |
| Lea | 1 | | | |
, больше невозможно получить доступ к переменной с помощью df.Name
. Я мог получить к нему доступ, используя df.index
, но это значительно снизило бы качество кода. Можно ли связать Index
с оригиналом index_col
? И есть ли решение для MultiIndex
(бонус)?