Я ищу хороший подход для обозначения около 10 000 транзакций + на основе различных условных выражений, потому что это займет много времени, чтобы сделать все вручную.
Например, если имя транзакции содержит «Оболочка» метка будет «Транспорт» или если имя содержит «ресторан», метка будет «Еда».
Одна из возможностей состоит в том, чтобы создать для l oop, но это станет беспорядок спустя некоторое время. Это будет выглядеть так:
for i in df_transactions.index:
if 'Shell' in df_transactions['Name'][i]:
df_transactions['Label'][i] = 'Transport'
if 'Restaurant' etc....
Я также попробовал np.select, но мне нужно назначить одно значение, если одно из нескольких условий является правильным.
Мне нужен помеченный набор данных для обучения классификатора с помощью машинного обучения. У транзакции есть такие функции, как описание, сумма, номер счета и т. Д. c.
Я не в состоянии получить набор помеченных данных деловым партнером или чем-то еще.
Помощь приветствуется!