Я работаю над извлечением текста с помощью Python.Вывод не так желателен как я хочу!
У меня есть текстовый файл, содержащий такую информацию:
FN Clarivate Analytics Web of Science
VR 1.0
PT J
AU Chen, G
Gully, SM
Whiteman, JA
Kilcullen, RN
AF Chen, G
Gully, SM
Whiteman, JA
Kilcullen, RN
TI Examination of relationships among trait-like individual differences,
state-like individual differences, and learning performance
SO JOURNAL OF APPLIED PSYCHOLOGY
CT 13th Annual Conference of the
Society-for-Industrial-and-Organizational-Psychology
CY APR 24-26, 1998
CL DALLAS, TEXAS
SP Soc Ind & Org Psychol
RI Gully, Stanley/D-1302-2012
OI Gully, Stanley/0000-0003-4037-3883
SN 0021-9010
PD DEC
PY 2000
VL 85
IS 6
BP 835
EP 847
DI 10.1037//0021-9010.85.6.835
UT WOS:000165745400001
PM 11125649
ER
, и когда я использую свой код, подобный этому
import random
import sys
filepath = "data\jap_2000-2001-plain.txt"
with open(filepath) as f:
articles = f.read().strip().split("\n")
articles_list = []
author = ""
title = ""
year = ""
doi = ""
for article in articles:
if "AU" in article:
author = article.split("#")[-1]
if "TI" in article:
title = article.split("#")[-1]
if "PY" in article:
year = article.split("#")[-1]
if "DI" in article:
doi = article.split("#")[-1]
if article == "ER#":
articles_list.append("{}, {}, {}, https://doi.org/{}".format(author, title, year, doi))
print("Oh hello sir, how many articles do you like to get?")
amount = input()
random_articles = random.sample(articles_list, k = int(amount))
for i in random_articles:
print(i)
print("\n")
exit = input('Please enter exit to exit: \n')
if exit in ['exit','Exit']:
print("Goodbye sir!")
sys.exit()
Извлечение не включает данные, которые имеютбыло введено после перевода строки, если я запустил этот код, вывод будет выглядеть как «AU Chen, G» и не включает другие имена, то же самое с заголовком и т. д. и т. д.
Мой вывод выглядит так:
Чен, Г. Исследование взаимосвязи между чертами, 2000, doi.dx.10.1037 // 0021-9010.85.6.835
Желаемый результат должен быть:
Чен, Г., Gully, SM., Whiteman, JA., Kilcullen, RN., 2000, Исследование взаимосвязей между индивидуальными различиями, подобными состоянию, индивидуальными различиями в состоянии и успеваемостью, doi.dx.10.1037 // 0021-9010.85.6.835
но извлечение включает только первый ряд каждой строки -
Есть предложения?