Итак, я работал через практическое машинное обучение с Scikit-Learn, Keras и TensorFlow. В этой главе они используют этот код
import numpy as np
import hashlib
def test_set_check(identifier, test_ratio, hash = hashlib.md5):
return bytearray(hash(np.int64(identifier)).digest())[-1] < 256 * test_ratio
def split_train_test_by_id(data, test_ratio, id_column):
ids = data[[id_column]]
in_test_set = ids.apply(lambda id_: test_set_check(id_,test_ratio))
return data.loc[~in_test_set], data.loc[in_test_set]
housing_with_id = housing.reset_index()
housing_with_id["id"]= housing["longitude"]*1000 + housing["latitude"]
train_set, test_set = split_train_test_by_id(housing_with_id, 0.2, "id")
Но я продолжаю получать сообщение об ошибке
IndexingError: Неустранимая логическая серия, предоставляемая в качестве индексатора (индекс логической серии и индексированного объекта не совпадают).