Как создать несколько новых переменных на основе набора существующих переменных и списков в python df - PullRequest
0 голосов
/ 23 февраля 2019

Я новичок в python и хотел бы создать новые переменные на основе значений в существующих переменных, если они соответствуют значениям в заданных списках, как в примере ниже.

df1["Fruits"] = np.where(df1["Record1"].isin(Fruits), "yes", "no")

Как я могу проверить не только одну переменную, но и несколько переменных одновременно и вместо да / нет поместить значение первой существующей переменной в новую переменную?

Что-то вроде:

df1["Fruits"] = np.where(df1["Record1" “Record2” “Record3”].isin(Fruits), "ValueOfFirstHit", "no")

Как создать несколько новых переменных всегда на основе одного и того же набора существующих переменных (запись1, запись2, запись3), но проверяя разные списки (например, фрукты, овощи, хлеб и т. Д.).У меня уже есть список этих списков.И есть ли способ дать новым переменным имена соответствующих списков?

В конце я хотел бы, чтобы df выглядел как таблица ниже.

 *Existing variables           //   New variables

 Record1  / Record2 / Record3  // Fruits  / Vegetables / Breads

 Apple    / Orange  / Tomato   // Apple   / Tomato     / No

 Tomato   / salad   / baguette // No      / Tomato     / Baguette

 orange   / banana  / apple    // Orange  / No         / No*

В реальном случае имеется около 100 столбцов записей, с миллионами наблюдений в 100 000 с и в зависимости от интересующего вас результата от нескольких десятков до сотен списков.

Спасибоочень заранее.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...