У меня есть файл, который содержит
{{cite web |url=http://www.canada.lu |title=Gouvernement du Canada -
Government of Canada |publisher= |accessdate=20 February 2015}}
{{cite book
|url=https://books.google.com/?id=U3L6H8eOIb0C&pg=PA117&dq=Estonia+and+Luxembourg#PPA118,M1
|title=The Radical Right in Interwar Estonia |publisher=
|accessdate=20 February 2015 |isbn=9780312225988 |last1=Kasekamp
|first1=Andres
Я написал код в Java
, используя regular expression
для извлечения между {{cite web ....}}
Pattern Pattern3 = Pattern.compile("\\{cite book([^}]+)\\}", Pattern.DOTALL);
Matcher matcher3 = Pattern3.matcher(t);
Pattern Pattern4 = Pattern.compile("\\{cite web([^}]+)\\}", Pattern.DOTALL);
Matcher matcher4 = Pattern4.matcher (t);
Это дает мне все вещи между {{cite web .... }}
и {{cite book ...}}
, но я хочу извлечь все строки после =
и до |
как title=The Radical Right in Interwar Estonia
Я хочу вывод вот так:
WEB:
Title = Gouvernement du Canada - Government of Canada
URL = http://www.canada.lu
Access Date =20 February 2015
BOOK:
Title = The Radical Right in Interwar Estonia
URL = https://books.google.com/?id=U3L6H8eOIb0C&pg=PA117&dq=Estonia+and+Luxembourg#PPA118,M1
publisher = NULL
Спасибо
Мой файл , который я хочу извлечь из .