Я новичок в Pandas с Python, и я хочу попросить о помощи с чем-то, что, по моему мнению, легко для кого-то более опытного, чем я.
У меня есть файл журнала, в котором в этом файле есть несколько столбцов. Эти столбцы могут иметь разные состояния.
Я думаю, что пример лучше:
ID | ANSWER | DETAIL | .. | OTHERS
12345 | Complete | Answer_OK | .. | whatever
12346 | Incomplete | Answer_NOK | .. | whatever
12345 | Complete | Answer_NOK | .. | whatever
Затем мне нужно подсчитать записи «ID», когда ответ = Incomplete, но не подсчитывать, когда «ID» имеет «Answer_OK» и в то же время «Answer_NOK».
В Excel это довольно просто, потому что вы создаете динамическую c таблицу и новый столбец, в который помещаете предложение IF, которое проверяет (IF A1 > 0 and A2 > 0, 0, 1)
, а позже вы суммируете новый столбец и получаете номер, но в Pandas я не могу сделать это легко.