Мне нужно извлечь заголовки и фрагмент текста под ними из текстового файла в Python, используя регулярные выражения, но я нахожу это трудным.
Я преобразовал PDF в текст, чтобы он теперь выглядел следующим образом:
До сих пор я мог получить всечисловые заголовки (12.4.5.4, 12.4.5.6, 13, 13.1, 13.1.1, 13.1.12) с использованием следующего регулярного выражения:
import re
with open('data/single.txt', encoding='UTF-8') as file:
for line in file:
headings = re.findall(r'^\d+(?:\.\d+)*\.?', line)
print(headings)`
Я просто не знаю, как получить сформулированную частьэтих заголовков или абзаца текста под ними.
РЕДАКТИРОВАТЬ - Вот текст:
IS EN 60601-1: 2006 & A1: 2013 & AC: 2014 & A12: 2014
60601-1 © IEC: 2005 60601-1 © IEC: 2005
- 337 - - 169 -
12.4.5.4 Другое ME ИЗДЕЛИЕ, производящее диагностическое или терапевтическое излучение При необходимостиПРОИЗВОДИТЕЛЬ должен указать в ПРОЦЕССЕ УПРАВЛЕНИЯ РИСКАМИ РИСКИ, связанные с ME ИЗДЕЛИЕМ, производящим диагностическое или терапевтическое излучение, отличное от диагностического рентгеновского излучения и лучевой терапии (см. 12.4.5.2 и 12.4.5.3).
Соответствие проверяют осмотром ФАЙЛА УПРАВЛЕНИЯ РИСКАМИ.
12.4.6 Диагностическое или терапевтическое акустическое давление Когда это применимо, ИЗГОТОВИТЕЛЬ должен указать в ПРОЦЕССЕ УПРАВЛЕНИЯ РИСКАМИ РИСКИ, связанные с диагностическим или терапевтическим лечением. акустическое давление.
Соответствие проверяют осмотром ФАЙЛА УПРАВЛЕНИЯ РИСКАМИ.
13 * ОПАСНЫЕ СИТУАЦИИ и условия неисправностей
13.1 Особые ОПАСНЫЕ СИТУАЦИИ
13.1.1 При применении ЕДИНЫХ НЕИСПРАВНОСТЕЙ, как описано в 4.7 и перечисленных в 13.2, по одному, ОПАСНЫЕ СИТУАЦИИ в 13.1.2–13.1.4 (включительно) не должны возникатьв ME ИЗДЕЛИЯ.
Отказ любого компонента за раз, который может привести к ОПАСНОЙ СИТУАЦИИ, описан в 4.7.
- Выбросы, деформация ENCLOSURE или превышение максимальной температуры
13.1.2 Не допускаются следующие ОПАСНЫЕ СИТУАЦИИ: - выброс пламени, расплавленного металла, ядовитых или воспламеняющихся веществв опасных
количествах;
- деформация ENCLOSURES до такой степени, что нарушается соответствие 15.3.1;-
температуры ПРИКЛАДНЫХ ЧАСТЕЙ, превышающие допустимые значения, указанные в таблице 24, при измерении, как описано в 11.1.3;температуры деталей ME ИЗДЕЛИЯ, которые не являются ПРИКЛАДНЫМИ ЧАСТЯМИ, но могут быть затронуты, превышая допустимые значения в Таблице 23 при измерении и регулировке, как описано в 11.1.3;
-
- превышение допустимых значений для «других компонентов и материалов», указанных в таблице 22, в 1,5 раза минус 12,5 ° C. Пределы обмоток приведены в таблице 26, таблице 27 и таблице 31. Во всех других случаях применяются допустимые значения таблицы 22.
Температуры должны измеряться с использованием метода, описанного в 11.1.3.
ОДИНОЧНЫЕ НЕИСПРАВНОСТИ в пунктах 4.7, 8.1 b), 8.7.2 и 13.2.2, касающиеся излучения пламени, расплавленного металла или воспламеняющихся веществ, не должны применяться к частям и компонентам, если: -Конструкция или цепь питания ограничивают рассеиваемую мощность в ОДНОМ ОТКАЗЕ
СОСТОЯНИЕ менее 15 Вт или рассеиваемую энергию менее 900 Дж.