Библиотеки Python - Разделение цитирования публикации - PullRequest
0 голосов
/ 20 февраля 2019

У меня есть куча цитатных строк, которые я хочу разделить на одну цитату.Вот пример, который я нашел на сайте цитирования OWL.У меня есть комбинации типов цитирования MLA, APA и т. Д.Есть ли библиотека Python или другое приложение, которое может разбить эти строки на элементы в списке.Я старался избегать регулярных выражений из-за разнообразия типов цитирования, а также пытался разбивать по '/ n', однако некоторые мои строки не имеют разделителей '/ n' ... так что вы можете увидеть проблему.Мне интересно, есть ли лучший способ для захвата.Я не ищу записи имени, даты, названия ... нашел библиотеку, которая делает это ... Мне просто нужно разделить строки.Любая помощь могла бы быть полезна!!!!Спасибо !!

Строка ввода - образец

Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.

Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.

Выход - образец

['Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.',
'Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.']

Ответы [ 2 ]

0 голосов
/ 20 февраля 2019

Если вы хотите разбить строку s с помощью разделителя новой строки \n, вы можете использовать строковый метод splitlines() с listcomp для фильтрации пустых элементов:

[i for i in s.splitlines() if i]
0 голосов
/ 20 февраля 2019

Попробуйте split, а затем удалите пустые элементы с помощью filter:

string = '''Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.

Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.'''

result = list(filter(None, string.split('\n')))

Вывод:

['Dean, Cornelia. "Executive on a Mission: Saving the Planet." The New York Times, 22 May 2007, www.nytimes.com/2007/05/22/science/earth/22ander.html?_r=0. Accessed 12 May 2016.', 'Ebert, Roger. Review of An Inconvenient Truth, directed by Davis Guggenheim. rogerebert.com, 1 June 2006, www.rogerebert.com/reviews/an-inconvenient-truth-2006. Accessed 15 June 2016.']
...