Я пытаюсь придумать быстрый способ создания «инверсии» с целью обучения регрессионной модели логистики c. У меня есть транзакции продаж (т. Е. isSold = 1 ), и я хочу создать строки данных для эквивалента isSold = 0 для 2-й даты (поскольку, очевидно, у меня нет данных для этого) ... Используя приведенный ниже пример, мне нужно создать 4 новые строки для 'ABC1', 'DEF2', 'GHI3', 'JKL4' с нижеприведенным (Обратите внимание, что MNO5 не требуется, поскольку есть уже доступны данные за 2/2/20).
students = [ ('ABC1', '1/1/20', '5.00' , '2' , '1') ,
('DEF2', '1/1/20', '4.95' , '1' , '1' ) ,
('GHI3', '1/1/20', '6.50' , '1' , '1' ) ,
('JKL4', '1/1/20', '7.10' , '1' , '1' ) ,
('MNO5', '1/1/20', '8.45' , '2' , '1') ,
('MNO5', '2/1/20', '8.45' , '1' , '1') ]
df = pd.DataFrame(students, columns = ['Item' , 'Date', 'UnitPrice' ,'Quantity', 'isSold'], index=['a', 'b', 'c' , 'd' , 'e' , 'f'])
Любые / все идеи приветствуются - спасибо.