Я недавно начал работать в Python и pyspark.Пожалуйста, не возражайте, если вопрос выглядит неубедительным.
Df - это мой массив данных, который был преобразован с помощью панд из CSV-файла, в котором переменная Real_XYZ_PQ_N0 названа переменной.
Когда я использую следующую строку кода:
df = pandas.read_csv(csv_filename)
serial_id= df['sid'].unique()
for sid in serial_id:
macros = macro_file[macro_file['sid'] == sid]
df['Real_XYZ_PQ'] =(((df['Real_XYZ']/df.Real_XYZ.shift(3))**4)-1)*100
Я получаю следующую ошибку: -
KeyError: 'Real_XYZ'
У меня есть этопеременная в моем CSV-файле, а также когда я использую df.columns я получаю Real_XYZ_PQ в наборе результатов.Хотя, когда я использую df.head (5), я не могу увидеть столбец Real_XYZ_PQ.Может кто-нибудь дать мне знать, что может быть возможной причиной.Может кто-нибудь также сказать мне, что функция сдвига здесь делает с набором результатов.
Я выполняю свой код в блокноте jupyter.