Метка кодирует переменную с несколькими значениями - PullRequest
0 голосов
/ 05 февраля 2020

Моя переменная состоит из нескольких ингредиентов. Каждый состоит из разных ингредиентов, разделенных запятой. Я использовал One Hot Encoding для нескольких значений (MultiLabelBinarizer ()), но это увеличило мою размерность набора данных.

У нас есть подходящий метод для этой ситуации?

Моя переменная выглядит так:

df['ingredients_str'].head()

0    romaine lettuce, black olives, grape tomatoes
1    plain flour,ground pepper,salt,tomatoes
2    eggs,pepper,salt,mayonaise,cooking oil
3    water,vegetable oil,wheat,salt
4    black pepper,shallots,cornflour,cayenne
Name: ingredients_str, dtype: object
...