Я понимаю, что название немного нечеткое, но позвольте мне проиллюстрировать.
У меня есть фрейм данных, который (упрощенно) выглядит так:
Date | transaction | amount
01-01-2020 | something keywordA something | 50
01-01-2020 | something something keywordB | 152
02-01-2020 | keywordA something else | 200
et c
Затем первое, что я делаю, это добавляю пустой столбец под названием «категория», например:
df['Category'] = ''
Теперь у меня также есть список таких списков:
categories={'category A':['keywordA','keywordB'], 'category B':['keywordC']}
et c
Теперь я хочу посмотреть, содержит ли столбец транзакции для каждой строки одно из ключевых слов и содержит ли он, например. keywordA Я хочу, чтобы столбец категории был заполнен «категорией A».
Итак, во-первых, я не уверен, что использование dict списков - это способ go здесь. Во-вторых, я мог бы, вероятно, go строка за строкой, выполнить функцию типа contains и сравнить с каждым элементом в dict, но из того, что я прочитал, повторение каждой строки обычно является плохой практикой, когда вы используете pandas, и просто интуитивно это будет очень плохо масштабируется.
Итак ... какие-нибудь намеки на то, в каком направлении мне следует смотреть?