Я имею дело с тоннами документов PDF (данные петеций), заполненными текстовыми данными, имеющими номера, табличные данные и т. Д. c. Задача клиента - обобщить любой данный документ, чтобы уменьшить трудозатраты при чтении всего документа. Я пробовал обычные методы, такие как lSA, Gensim-sumrizer, BERT, Pryummarizer.
Результаты не совсем хорошие. Пожалуйста, предложите мне какой-нибудь способ, где я смогу найти обобщитель отраслевого уровня (обобщающий / обобщающий), который дал бы мне хорошее начало для решения этой проблемы.