Мне нужно извлечь первый абзац ниже.
corpus = "CHRISTINE MOORMAN and REBECCA J. SLOTEGRAAF*
Current interdisciplinary research suggests that organizational capabil-
ities have a direct, unconditional impact on firm performance. The authors
extend this literature by developing a framework that proposes a contin-
gency approach to the value of organizational capabilities. This frame-
work highlights the effect of information in the external environment in
stimulating firms to deploy their technology and marketing capabilities to
influence the level and speed of relevant product development activities.
The Contingency Value of Complementary Capabilities in Product Development."
Мне удалось выбрать заглавные буквы из корпуса в качестве начальной, но не удалось установить конечную точку.
my Шаблон регулярного выражения для поиска в верхнем регистре:
r'+[A-Z]\W\s'
Приведенный выше текст был взят из файла PDF, поэтому я был бы очень признателен, если бы я смог найти общий шаблон для получения аналогичного текста из других файлов.
Найдите образец изображения в формате PDF: https://ibb.co/FW9V0nk
preferred_output = ['Current interdisciplinary research suggests that organizational capabil-ities have a direct, unconditional impact on firm performance. The authors extend this literature by developing a framework that proposes a contin-gency approach to the value of organizational capabilities. This frame-work highlights the effect of information in the external environment in stimulating firms to deploy their technology and marketing capabilities to
influence the level and speed of relevant product development activities.']