Мы работаем над предложениями, извлеченными из PDF.Проблема состоит в том, что он включает заголовок, нижние колонтитулы, оглавление и т. Д. Есть ли способ определить, является ли предложение, которое мы получаем при передаче документа в spacy, полным предложением.Есть ли способ отфильтровать части предложений, такие как названия