Очень просто. Вы можете использовать LabelEncoder
для преобразования категориального в числовое значение.
Пример:
from sklearn.preprocessing import LabelEncoder
import numpy as np
#data
location = np.array(['a','b','a'])
defects = np.array([1,2,1])
# the encoder
lb_make = LabelEncoder()
converted= lb_make.fit_transform(location) # convert to numerical
print(converted)
array([0, 1, 0])
np.corrcoef(defects,converted)[0][1]
0.9999999999999998