Пытаясь найти эффективный подход к проблеме.
У меня есть структура классификации, которую я создаю, которая выглядит следующим образом:
Food Drinks Condiments Other
chocolate wine ketchup anything else
beef alcohol mustard
meat water honey
avocado liquor
bread
Данные, которые у меня выглядят следующим образом:
ID FieldOne FieldTwo FieldThree FieldFour
210 beefmeat chocolate/twi kaetfn chocolate
1520 .winefk avocadocho NULL imhungry
8889 kjhajgkjte test.com subtle NULL
1381 NULL NULL NULL NULL
Допустим, я ищу по 4 различным текстам / 4 различным ссылочным полям (FieldOne: FieldFour), и у этого есть 2 метода категоризации процесса.Определите подкатегории, затем определите категории.
Второй шаг прост, я просто классифицирую Еду, Напитки и т. Д. На основе столбца подкатегории, созданного на первом шаге.
На первом этапе я играю с идеями,
Это делается в большем масштабе, и в идеале я хотел бы найти 4 справочных поля в определенном порядке: чтобы сначала соответствовало любым подкатегориям продуктов питания (например, шоколад, говядина),затем сопоставьте любые подкатегории Напитков и т. д. (наконец, все, что не соответствует, - Другое).
Я думал, что смогу объединить 4 ссылочных поля в одну строку, один столбец -> выполнить поиск в объединенном поле снекоторые пересматривают и создают несколько операторов CASE WHEN для категоризации, но я не уверен, как применить порядок, который я хочу, к классификации с помощью CASE WHEN или есть ли более эффективный подход.
Конечный результат будет выглядеть (справочные поля не обязательны, но подумал, что было бы неплохо увидеть, как результаты выровнены):
ID FieldOne FieldTwo FieldThree FieldFour Subcategory Category
210 beefmeat chocolate/twi kaetfn chocolate chocolate Food
1520 avocadocho .winefk NULL imhungry avocado Food
8889 kjhajgkjte test.com subtle NULL Other Other
1381 NULL NULL NULL NULL NULL NULL