Я работаю над проектом, в котором мне нужно прочитать какой-нибудь общий текст ... Я ищу любой API, который я могу читать общий текст, а также могу конвертировать его в файл .csv ...
Может ли кто-нибудь PLZ помочь ...
использование Java на ОС Windows ...
-------------------------- ПОДРОБНЕЕ ------------------- -------------------------------------------------- ------------------
позвольте мне уточнить:
Предположим, у меня есть документ в формате pdf или документ любого типа. Я намерен использовать опцию «Печать на общий текстовый принтер» и получить файл в этом формате. Наконец, я собираюсь использовать некоторый API, который позволит мне программно читать этот файл общего текстового формата. Я намерен извлечь текст из этого общего текстового файла.
Итак, будь то любой файл (.doc / .pdf / .xls и т. Д. Wtatever), я намерен создать файл общего текстового формата, используя опцию печати. Затем запустите мой код, чтобы прочитать эти файлы и извлечь некоторую информацию.
PS: Предположим, у меня есть форма отчета о состоянии со стандартными полями. Хорошо. Но некоторые люди могут представить в .pdf, некоторые в .doc, некоторые в текстовом формате. Но каждый документ содержит одни и те же поля, но, возможно, с разными форматами.
Теперь я ищу общее решение, с помощью которого я смогу преобразовать каждый тип файла в общий формат текстового файла, а затем применить некоторую логику для извлечения полей моего отчета о состоянии.