У меня есть фрейм данных со столбцом с названиями должностей и названием компании в одной строке каждой строки df ['Titles'] , у меня также есть список всех возможных названий компаний список заданий
Я пытаюсь создать новый столбец df ['Company'] на основе условия совпадения со списком / серией, но оба варианта не работают из-за того, что я думаю это грязный список / серия
мой список / серия насчитывает около 3000+ имен, и мне интересно, как лучше всего его очистить, используя общее регулярное выражение или что-то еще?
код для список, затем ряд был предоставлен мне пользователем стека и выглядит следующим образом:
df['Company'] = df['Title'].str.contains('|'.join(joblist))
df['Company'] = df['Title'].str.extract(f'({"|".join(joblist)})', expand=False)
ошибки следующие;
Список возвращает: 'ошибка несбалансированная скобка в позиции 8466 '
Серия возвращает:' bad escape \ C at position 9401 '
Я очистил некоторые базовые c вещи, такие как «s», чтобы просто «s» орех все еще получил обе ошибки, любая помощь приветствуется, спасибо!