Я автоматически извлекаю табличные данные из PDF-файлов с помощью Camelot. Очень часто обнаружение краев приводит к автоматическому выравниванию текста в средней ячейке.
Поэтому мне нужно обрабатывать извлеченный pandas-dataframe дальше. Я хочу распространить текст, который выровнен по центру, по другим ячейкам, строго говоря, копируя его симметрично.
Так что, если обе соседние ячейки имеют "значение", np.nan обе получат скопированное значение, еслис обеих сторон две ячейки имеют np.nan, все четыре из них получают значение средней ячейки и т. д.
Это пример текущего кадра данных.
Column_1 Column_2 Column_3 Column_4
5 np.nan 6 np.nan
np.nan some Text np.nan 12
7 some other Text 8 np.nan
Ожидаемый результат должен быть следующим:
Column_1 Column_2 Column_3 Column_4
5 np.nan 6 12
some Text some Text some Text 12
7 some other Text 8 12