Как извлечь различное подмножество данных в текстовый файл и передать каждое подмножество в другой текстовый файл? - PullRequest
1 голос
/ 26 апреля 2019

У меня мало текстовых файлов, и мне нужно поднастроить данные подзаголовка и содержимое этих данных подзаголовка и передать в другой файл.

Текстовый файл выглядит так

Notes 

1. content

2. here also there will be some content till n lines

rule Note 

1. n line content (a) for every section

Add Notes

(a) some content

other Note

1. the rest of file
***Code***
    with open(file,encoding='utf8') as in_file: 
        s = in_file.read() 

        for i, char in enumerate(s): 
            if s[i:i+5] == 'Notes': 
                break      

        for j in range(i,0,-1): 
            if s[j] == '\n': 
                break
        rest_of_file = s[j+1:]

Приведенный выше код извлекает данные из текстового файла из Notes. так что мой ожидаемый вывод что-то выглядит так в 1-й итерации и нужно передать в другой файл

Notes 

1. content

2. here also there will be some content till n lines

2-я итерация

rule Note 

1. n line content (a) for every section

3-я итерация

Add Notes

(a) some content

Последняя итерация

other Note

1. the rest of file

Примечание: Это один файл, который имеет все подзаголовки с шаблоном, но может не совпадать для всех текстовых файлов. в некоторых файлах могут отсутствовать заметки, в некоторых могут отсутствовать правила для заметок и добавления заметок, в некоторых файлах могут присутствовать другие заметки, например,

Единственный общий шаблон, который я нашел здесь, это Note

любой подход хорош любой может помочь с этим пожалуйста ... готов к работе с красивым супом тоже

1 Ответ

0 голосов
/ 06 мая 2019

Подход для этого

  1. передал все в список
  2. если в элементах появляется примечание, получить индекс элемента в списке
  3. на основе списка индексов разделить его на разные секции

Пример кода здесь:

как получить подмножество списка из индекса списка в python

...