Эффективный метод для регулярного выражения и подкатегории в предпочтительном порядке - PullRequest
0 голосов
/ 09 декабря 2018

Пытаясь найти эффективный подход к проблеме.

У меня есть структура классификации, которую я создаю, которая выглядит следующим образом:

Food           Drinks          Condiments          Other 

chocolate      wine            ketchup             anything else
beef           alcohol         mustard
meat           water           honey
avocado        liquor 
bread

Данные, которые у меня выглядят следующим образом:

ID    FieldOne     FieldTwo       FieldThree    FieldFour
210   beefmeat     chocolate/twi  kaetfn        chocolate
1520  .winefk      avocadocho     NULL          imhungry
8889  kjhajgkjte   test.com       subtle        NULL       
1381  NULL         NULL           NULL          NULL       

Допустим, я ищу по 4 различным текстам / 4 различным ссылочным полям (FieldOne: FieldFour), и у этого есть 2 метода категоризации процесса.Определите подкатегории, затем определите категории.

Второй шаг прост, я просто классифицирую Еду, Напитки и т. Д. На основе столбца подкатегории, созданного на первом шаге.

На первом этапе я играю с идеями,

Это делается в большем масштабе, и в идеале я хотел бы найти 4 справочных поля в определенном порядке: чтобы сначала соответствовало любым подкатегориям продуктов питания (например, шоколад, говядина),затем сопоставьте любые подкатегории Напитков и т. д. (наконец, все, что не соответствует, - Другое).

Я думал, что смогу объединить 4 ссылочных поля в одну строку, один столбец -> выполнить поиск в объединенном поле снекоторые пересматривают и создают несколько операторов CASE WHEN для категоризации, но я не уверен, как применить порядок, который я хочу, к классификации с помощью CASE WHEN или есть ли более эффективный подход.

Конечный результат будет выглядеть (справочные поля не обязательны, но подумал, что было бы неплохо увидеть, как результаты выровнены):

ID    FieldOne     FieldTwo       FieldThree    FieldFour  Subcategory     Category
210   beefmeat     chocolate/twi  kaetfn        chocolate  chocolate       Food
1520  avocadocho   .winefk        NULL          imhungry   avocado         Food
8889  kjhajgkjte   test.com       subtle        NULL       Other           Other
1381  NULL         NULL           NULL          NULL       NULL            NULL
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...