я пытаюсь получить выражение из каждого предложения - PullRequest
1 голос
/ 23 февраля 2020

Я пытаюсь получить определенные предложения с разными типами предложений из числа ссылок

это ссылки

Goldberg, Yoav (2016). "A Primer on Neural Network Models for Natural Language Processing". Journal of Artificial Intelligence Research. 57: 345–420. arXiv:1807.10854.

Goodfellow, Ian; Bengio, Yoshua; Courville, Aaron (2016). Deep Learning. MIT Press.

Choe, Do Kook; Charniak, Eugene. "Parsing as Language Modeling". EMNLP 2016.

Vinyals, Oriol; et al. "Grammar as a Foreign Language" (PDF). NIPS2015.

Winograd, Terry (1971). Procedures as a Representation for Data in a Computer Program for Understanding Natural Language (Thesis).

Schank, Roger C.; Abelson, Robert P. (1977). Scripts, Plans, Goals, and Understanding: An Inquiry Into Human Knowledge Structures. Hillsdale: Erlbaum. ISBN 0-470-99033-3.

Mark Johnson. How the statistical revolution changes (computational) linguistics. Proceedings of the EACL 2009 Workshop on the Interaction between Linguistics and Computational Linguistics.

Philip Resnik. Four revolutions. Language Log, February 5, 2011.

Kishorjit, N.; Vidya, Raj RK.; Nirmal, Y.; Sivaji, B. (2012). "Manipuri Morpheme Identification" (PDF). Proceedings of the 3rd Workshop on South and Southeast Asian Natural Language Processing (SANLP). COLING 2012, Mumbai, December 2012: 95–108.

Mittal (2011). "Versatile question answering systems: seeing in synthesis". IJIIDS. 5 (2): 119–142. doi:10.1504/IJIIDS.2011.038968.

PASCAL Recognizing Textual Entailment Challenge (RTE-7) https://tac.nist.gov//2011/RTE/

Yi, Chucai; Tian, Yingli (2012), "Assistive Text Reading from Complex Background for Blind Persons", Camera-Based Document Analysis and Recognition, Springer Berlin Heidelberg, pp. 15–28, CiteSeerX 10.1.1.668.869, doi:10.1007/978-3-642-29364-1_2, ISBN 9783642293634

, поскольку вы можете видеть, что каждое предложение отличается, и каждый раз, когда я пытаюсь получить определенное предложение из ссылок, не все предложения получают правильно

это одно из выражений, которое я пробовал ([.]((?<=.)(.*)\.?)), и это результат enter image description here

результат отличается, и не все из них получаются правильно. и так как я новичок в регулярных выражениях, я до сих пор не знаю, какое выражение использовать, пожалуйста, помогите мне.

1 Ответ

2 голосов
/ 23 февраля 2020

Похоже, что все предложения, которые вы хотите найти, идут сразу после:

  • точка, за которой следует пробел (соответствует (?<=\. )) или

  • a ,, что не сразу после символа слова, за которым следует пробел (соответствует (?<=\B, ))

И все совпадения начинаются с заглавной буквы, которой, возможно, предшествует " (соответствует "?[A-Z])

Сложите все эти условия вместе, и вы получите:

(?:(?<=\. )|(?<=\B, ))"?[A-Z].+

https://regex101.com/r/gATQDH/1

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...