Разделение записей из LinkedIn для имени и должности - PullRequest
0 голосов
/ 30 марта 2019

Я пытаюсь собрать некоторую базовую информацию о сотрудниках из профилей LinkedIn (как учебное упражнение из школы), используя селен и bs4. Я попадаю в ту часть, где каждый профиль представлен в следующем формате:

[['\ nКевин Джонсон \ n \ xa0 \ n \ xa0 \ n \ n Кевин Джонсон является влиятельным лицом \ n \ n \ n', '\ nпрезидент и главный исполнительный директор в Starbucks \ n'], [' \ nСатья Наделла \ n \ xa0 \ n \ xa0 \ n \ n Сатья Наделла - влиятельный человек \ n \ n \ n ',' \ nГрейтер Сиэтл \ n '], [' \ nКлара Ши \ n \ xa0 \ n \ xa0 \ n \ n Клара Ши является влиятельным лицом \ n \ n \ n ',' \ nCEO в Microsoft \ n ']]

Я хочу, чтобы каждый сотрудник был в своих списках для последующего добавления в CSV-файл. Как я могу использовать разделение каждой записи, чтобы она содержала только имя человека и его должностную инструкцию (например, ['Кевин Джонсон', 'президент и генеральный директор Starbucks']?

...