Я строю простой точечный график, который читает данные из файла xls.
Это классический график ожидаемой продолжительности жизни x ВВП на душу населения. Вот код:
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.cm as cm
#ler a terceira sheet da planilha
data = pd.read_excel('sample.xls', sheet_name=0)
data.head()
plt.scatter(x = data['LifeExpec'],
y = data['GDPperCapita'],
s = data['PopX1000'],
c = data['PopX1000'],
cmap=cm.viridis,
edgecolors = 'none',
alpha = 0.7)
for estado in range(len(data['UF'])):
plt.text(x = data['LifeExpec'][estado],
y = data['GDPperCapita'][estado],
s = data['UF'][estado],
fontsize = 14)
plt.colorbar()
plt.show()
Файл .xls:

Столбец "Население" из файла xls (PopX1000) определяет размеры пузырьков и в настоящее время также определяет их цвета.
Я бы хотел, чтобы пузыри меняли размеры в зависимости от населения (как они делают сейчас), но цвета меняются в зависимости от региона, в котором находится штат.
Мне кажется, я не могу просто изменить свойство c, поскольку оно ожидает значение с плавающей запятой.
Любые советы о том, как это сделать?