Извлечение значений записи из простого текста без xml - PullRequest
0 голосов
/ 19 января 2020
  1. У меня проблемы с написанием сценария php со следующими данными в текстовом файле. Я мог бы извлечь значения с помощью ключевых слов, аннотации, https, но не заканчивая запятой:

Пример:

name aaaaa, name bbbb, name ccccc, name dddd .....,
title............ ,   <- each title ends with a  comma
sub-title ........,   <- each sub-title ends with a  comma
56 ...............,   <- each volume  ends with a  comma
2020 ............ ,   <- each year ends with a  comma
230    ...........,   <- each nr ends with a  comma
ISSN 0012-82......,   <- each issn ends with a  
https://...........
(http:// .........)
Abstract:
Keywords:

                   <- Space

n-я запись



Мой сценарий:

<?php
$txt   =   file_get_contents("in.txt");
$array = explode("\n\n", $txt);
foreach($array as $key=>$value) {
    $id_pattern = '#'.($key+1).'. (.*?).,.\n#';
    preg_match($id_pattern, $value, $id);
   //........

    $https_pattern = '#https \: (.*?)\n\n#';
    preg_match($https_pattern, $value, $https);


    $abstract_pattern = '#Abstract\: (.*?)\n#';
    preg_match($abstract_pattern, $value, $abstract);


    $keywords_pattern = '#Keywords\: (.*?)#';
    preg_match($keywords_pattern, $value, $keywords);

    $id = $id[1];
    $https = $https[1];
    $abstract = $abstract[1];
    $keywords = $keywords[1];

}
...