Разбор строк на основе предварительно определенного шаблона - PullRequest
0 голосов
/ 30 октября 2019

Я пытаюсь проанализировать потоки конфиденциальных результатов College Конфиденциальности (пример: https://talk.collegeconfidential.com/stanford-university/1587085-stanford-2018-rea-results-only-thread.html).) Существует шаблон, который большинству, хотя и не всем, постов соответствует поля для Решения, SAT, ACT, GPA, AP принятыи т. д.

Я полагаю, что я мог бы использовать регулярные выражения / строковые методы Python для получения всей этой информации для каждого поста, но есть ли более простой способ сделать это (другими словами, есть липакет, который мог бы извлечь эту информацию для меня по заданному шаблону?)

...