Я использую Camelot для извлечения текста из нескольких PDF-файлов.Конкретная таблица из PDF (показанная ниже)

доставляет мне проблемы при извлечении.Одиночные крестики действуют как единое целое, когда я строю таблицу (показано ниже)

Я хотел бы знать, почему отдельные людиИкс все сгруппированы, как видно на графике?и как я могу разделить их, чтобы использовать их позже?