введите описание изображения здесь Имеется неструктурированный отчет или счет-фактура (пробелы, ,, / :, цифры, алфавиты, @@, без шаблона)
Приложение: Управление персоналом
Гранулярность: Искать - Подробности
Поставщик: Общедоступный
Экземпляр: Доставка
Дата - Время: 2018/03/05 19:37:10
Счет-фактура
счет от JBR-0560-00089000
Delivery:
Network:
Организация: партнер
Регион:
Финансы: окупаемость
Миссия: Важная
Природа
Тип экземпляра и передача
Подробности
(Перевод) отправлено на сайт (регион)
Доставка товара
Статус:
Характер доставки: Обычный
подтверждение 4859nb576ZNP57387f7df7df8
Ссылка: Нет
Ответить
Sender Details: xxx debt of a Invoice bill
Daily need Pvt LIMITED
Denmark
Приемник: Poly clean
Подробности: Duabi
Столбец 1: Инвойс №
Ab2345345 @@
Столбец 2: Дата
12/ 05/2009 2009 12 мая
Колонка 3: Политика
Политика страны Недавнее обновление
Колонка 4:
Колонка 5: Колонка 6: .....................
У меня есть изображение с деталями транзакции, путем чтения изображения с использованием Tesseract, извлеченного из NOTEPAD.Теперь из Блокнота нужно извлечь только столбцы и их значения.
Я сделал разделение всего текстового файла с помощью ';'затем данные превращались в каждую строку в каждую строку.
импорт панд как pd df = pd.read_csv (r'C: \ Desktop \ data_ge.txt ', sep = ";", encoding = "utf8") df.head (30)
вывод:
Наличие отчета или счета-фактуры Приложение: Управление персоналом
Детализация: Поиск - Подробности
Поставщик: Общедоступный
Экземпляр: Доставка
Дата - Время: 2018/03/0519:37:10 Счет-фактура на содержание от JBR-0560-00089000
Доставка:
Сеть:
Организация: Партнер
Регион:
Финансы: окупаемость
Миссия: Важная природа
Тип экземпляра и передача
Подробности
(Передача) отправлено на сайт (регион)
Доставка товара
Статус:
Характер доставки: Обычный
Проверка 4859nb576ZNP57387f7df7df8
Ссылка:ни один