Я пытаюсь получить жирную / италийскую c строку снизу html код:
<div class="cmp-Review-author">
<span class="cmp-ReviewAuthor" itemprop="author" itemscope="" itemtype="http://schema.org/Person">
<meta itemprop="name" content="***TIER I ASSOCIATE PICKER/ PPQA ASSOCIATE***">
<a class="cmp-ReviewAuthor-link" rel="nofollow" href="/cmp/Amazon.com/reviews?fjobtitle=Order+Picker">TIER I ASSOCIATE PICKER/ PPQA ASSOCIATE</a>
<!-- -->(***Former Employee***)<!-- --> -
<a class="cmp-ReviewAuthor-link" rel="nofollow" href="/cmp/Amazon.com/reviews?fcountry=US&floc=Edgerton%2C+KS">***Edgerton, KS***</a>
- <!-- -->***March 5, 2020***</span></div>
и сохранить их в отдельных столбцах в фрейме данных.
Я могу получить строку как
TIER I ASSOCIATE PICKER/ PPQA ASSOCIATE (Former Employee) - Edgerton, KS - March 5, 2020
, но не уверен, как разделить ее на позицию, сотрудник, местоположение, дату, поскольку эта структура различна для каждой строки позиции: (см. пример)
- Сотрудник по обслуживанию клиентов (бывший сотрудник) - Миссури-Сити, Техас - 19 декабря 2019 г.
- Сборщик, процессор, привратник, посол, решатель проблем, инструктор уровня 3 (бывший сотрудник) - Хеврон, Кентукки - 6 марта , 2020
- Курьер (Текущий сотрудник) - Мангейм - 6 марта 2020 года
- Сборщик / Упаковщик (Бывший работник) - Норт Рэндалл, Огайо - 5 марта 2020 года
- Tdr (Текущий сотрудник) - 5300 holibird Avenue - 5 марта 2020 г. Любая идея?