Недопустимая логическая серия, представленная как ошибка индексатора - PullRequest
0 голосов
/ 30 марта 2020

Итак, я работал через практическое машинное обучение с Scikit-Learn, Keras и TensorFlow. В этой главе они используют этот код

   import numpy as np
   import hashlib

   def test_set_check(identifier, test_ratio, hash = hashlib.md5):
     return bytearray(hash(np.int64(identifier)).digest())[-1] < 256 * test_ratio

   def split_train_test_by_id(data, test_ratio, id_column):
     ids = data[[id_column]]
     in_test_set = ids.apply(lambda id_: test_set_check(id_,test_ratio))
     return data.loc[~in_test_set], data.loc[in_test_set]

  housing_with_id = housing.reset_index()

  housing_with_id["id"]= housing["longitude"]*1000 + housing["latitude"]
  train_set, test_set = split_train_test_by_id(housing_with_id, 0.2, "id")

Но я продолжаю получать сообщение об ошибке

IndexingError: Неустранимая логическая серия, предоставляемая в качестве индексатора (индекс логической серии и индексированного объекта не совпадают).

...