Извлечение строк из шаблона в кадре данных pandas - PullRequest
0 голосов
/ 09 мая 2020

У меня есть фрейм данных со столбцом, заполненным строками, как показано ниже:

1 Janus Henderson Research Fund Class N 2 Calvert Equity Fund Class A 3 Invesco Diversified Dividend Fund R5 Class 4 Prudential Day One 2035 Fund Class R3 5 TETON Convertible Securities Fund Class C ...<br> 24991 BlackRock Asian Dragon Fund,Inc.Class R 24993 MFS Blended Research International Equity Fund... 24994 ClearBridge Small Cap Fund Class A 24995 Federated Equity Income Fund, Inc. Class A Shares

Я хочу извлечь класс каждой из строк. например, строка 1 как класс N, строка 2 как classA и т. д. в некоторых строках нет слова class вместе, которое я хотел бы иметь как NA. также некоторые строки имеют метку класса перед словом class. как мне go извлечь это? приветствуются любые указания

1 Ответ

0 голосов
/ 09 мая 2020

Вы можете написать функцию синтаксического анализа, которая получает строку и ищет слово «Class», а затем возвращает все, что рядом с ним. Например, эта функция может использовать txt.split('Class'). После того, как вы напишете эту функцию, вы можете использовать apply() (метод dataframe), чтобы применить его к каждой строке отдельно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...