Я разбил документ PDF на параграфы. Я хотел бы объединить документы, однако мне нужно сохранить порядок абзацев. По сути, мне нужно выполнить последовательную кластеризацию.
Как я могу реализовать эту задачу?
Спасибо.