Пример Dataframe - результат ранее очищенного pandas.read_excel:
import pandas as pd
import numpy as np
raw_data = {'ref': ['409075', '405168', '035751', '039374', '331949', '331951', '307128'],
'description': ['Product 7 (12X)', 'Product 6 (8X)', 'Product 2', 'Product 1', 'Product 2', 'Product 3', 'Product 3'],
'maker': [np.nan, np.nan, 'Companyname1', 'Comp.2', 'Company3', 'Company name 4', 'Maker 5'],
'type': [np.nan, np.nan, 'Rev. 0', np.nan, np.nan, np.nan, 'Type 5'],
'qty': [6, 4, 4, 2, 12, 12, 12],
'val': [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, np.nan],
'serial': [np.nan, np.nan, np.nan, 58690, 900078, 69402, 900078]}
df = pd.DataFrame(raw_data, columns = ['ref_maker', 'description', 'serial', 'maker', 'type', 'val, ''qty'])
Ниже приведен желаемый результат (в столбцах):
- исх
- a) описание + b) создатель + c) тип + d) val + e) серийный номер
- кол-во
условие: результирующий составной столбец описания не должен содержать более 30 символов и не должен вырезать импортированные ячейки.
(Частично охвачено: Подготовить Pandas DataFrame для записи Excel * )
| ref | description (max 30 ch.) | qty |
|-------- |---------------------------- |----- |
| 409075 | Product 7 (12X) | 6 |
| 405168 | Product 6 (8X) | 4 |
| 35751 | Product 2 | 4 |
| | MKR: Companyname1 | |
| | Type: Rev. 0 | |
| 39374 | Product 1 | 2 |
| | MKR: Comp.2; SRL: 58690 | |
| 331949 | Product 2 | 12 |
| | MKR: Company3; SRL: 900078 | |
| 331951 | Product 3 | 12 |
| | MKR: Company name 4 | |
| | SRL: 69402 | |
| 307128 | Product 3 | 12 |
| | MKR: Maker 5; Type: Type 5 | |
| | SRL: 900078 | |
Я пытался найти решения, но мне не удалось изменить их в соответствии с моими потребностями из-за непонимания их (правильно). Надеюсь соответствовать требованиям.
Благодарен за любую помощь и подсказки.