python извлечение текстовых данных - PullRequest
0 голосов
/ 26 апреля 2020

Я должен извлечь указанный элемент c и связанные с ним данные ответа из текстового файла (текст 2). И я использую эту процедуру для извлечения всех необходимых данных, касающихся списка элементов, из другого текстового файла (текст 1). Кроме того, из полученных данных я хотел бы извлечь 2 наиболее интенсивных ответа для каждого элемента. Как я могу достичь этого процесса? Могу ли я иметь некоторые примеры кодов для старта? Пожалуйста, найдите схему здесь (цель и необходимые данные выделены жирным шрифтом):

** - Текст 1 *: *

  • Ритонавир
  • Олей c кислота
  • Докозан c кислота
  • 1,1'-оксибис [2,3,4,5,6-пентабромбензол]
  • Додеканой c Кислота

- Текст 2:

  • Название: Ритонавир
  • Синон: $: 00in-source
  • DB #: MoNA000010
  • InChIKey: NCDNCNXCDXHOMX-XGKFQTDJSA-N
  • Тип_прибора: Waters Synapt G2
  • Formula: C37
  • MW: 720
  • ExactMass: 720,3127606360001
  • Комментарии: "вычислено SMILES = O C (= N C (CC = 1C = CC = СС1) C (О) * тысяча семьдесят-пять * (N = C (О) C (N = C (O) N (* 1 079 *) CC = 2н = C (SC2 ) C (C) C) C (C) C) CC = 3C = CC = CC3) OCC = 4SC = NC4 "", вычислено InChI = InChI = 1S / C37H48N6O5S2 / c1 -24 (2) 33 (42-36 (46) 43 (5) 20-29-22-49-35 (40-29) 25 (3) 4) 34 (45) 39-28 (16-26-12 -8-6-9-13-26) 18-32 (44 ) 31 (17-27-14-10-7-11-15-27) 41-37 (47) 48-21-30-19-38-23-50-30 / h6-15,19,22-25 , 28,31-33,44H, 16-18,20-21H2,1-5H3, (Н, 39,45) (Н, 41,47) (Н, 42,46) / t28-, 31-, 32 -, 33- / m0 / s1 "" comment = Waters MSE spectrum "" SPLASH = splash10-01dj-0490400400-51a0b80eb0fdf1a6ade4 "" submitter = Тобиас Кинд (Университет Калифорнии, Дэвис) "" Рейтинг MoNA = 2.1428571428571432 "
  • Num Peaks: 8
  • 140.0537 18.018018
  • 171.0959 18.018018
  • 197.0750 31.031031
  • 268.1487 100.000000
  • 296.1429 50.050050
  • 426.1854 65.065065
  • 494.3260 12.012012
  • 721.3204 80.080080
...