Используя Python, я хочу найти текстовую строку в Col2 на основе Col1. Таким образом, в приведенном ниже примере, если текст / строка 9880, то в Col2 я хочу найти текст с 9880.xxx, а затем извлечь его в новую строку в новом столбце. Я хочу быть в состоянии сделать это для нескольких строк.
Приведенный ниже пример содержится в одной строке Excel, поэтому текст в столбце col2 находится в одной ячейке Excel.
Example: data in Excel
Col1 Col2
9880 | line of text |
single | 9880.01 |
Excel | line of text |
row | 9880.02 |
| line of text |
| 9880.03 |
New column: Colx
Excel row1 9880.01
Excel row2 9880.02
Excel row3 9880.03
Я знаю, как читать данные Excel, сохранять их в массив данных и записывать обратно в Excel. Мне нужна помощь в поиске и извлечении части.
Может быть, я смогу сделать это, используя команду Pandas split, затем расплавить, а затем следовать Groupby.
Я попытался найти похожие примеры в переполнении стека, но что-то вроде этого было здесь: Python - извлечение текста из строки . Все остальное было связано с использованием VBA.
Любые предложения приветствуются.
Отредактировано 28/06/2018: я думаю, что могу достичь этого, используя команду 'findall', но не уверен в том, как создать цикл for, чтобы он мог перейти к следующему элементу в фрейме данных, считанном с Excel. Возможно, используйте перечисление из списка, который я ищу.
9880 'line of text'
9450 'line of text'
4530 'line of text'