PHP - найти слова массива в строках в массиве, возвращаемое значение в обоих случаях - PullRequest
0 голосов
/ 12 июня 2018

Проблема

У меня есть два массива.1 массив содержит слова, другой массив содержит строки.Я написал код, который найдет слово в строке.Если одно из слов найдено в строке.Я возвращаю слово.Но если в строке не найдено ни одного слова из массива, я также хотел бы вернуть одно значение.Я написал несколько кодов, и я всегда получаю одни и те же случаи.

Случаи:

  • Я не получил значения, когда не было совпадений
  • Я получил значение из результата до
  • Iполучил каждое совпадение значений и никакого совпадения назад

Вопрос

Я понял это где-то неправильно.Как я могу сохранить для каждой строки слово, если оно найдено, и если оно не найдено, значение установлено как пропущенное значение?

Код

Вход
$csv_specie = array("Mouse","Human");
$CDNA = 'Human interleukin 2 (IL2)a;Ampicillin resistance gene (amp)a;Mouse amp gene';
# Split string by ; symbol into an array
  $CDNA_new = preg_split("/\b;\b/", $CDNA);
Выход (Я хотел бы закончить чем-то вроде этого
foreach ($CDNA_new as $string){
    $specie = $result ## Human
    echo $specie."-"$sring.  "<br \>\n"; 
}

Результат в веб-браузере:

Человек-человеческий интерлейкин 2 (IL2) a

Ген устойчивости к NA-ампициллину (amp) a

Mouse-Mouse amp gen

Первая попытка

# Go through the string
  foreach($CDNA_new as $t){
# Go through the specie array
    foreach ($csv_specie as $c){ 
# Find specie in string
        if (strpos($t, $c) !== FALSE ){ 
            $match = $c;
            $specie = $c;
        }
    }
# If no match found set values to missing values
    if (isset($specie) !== TRUE){
        $match = "NA";
        $specie = "NA";
        }
    echo "----------------------".  "<br \>\n"; 
    echo '+'.$specie.  "<br \>\n"; 
    echo '+'.$match.  "<br \>\n"; 
    echo '+'.$t.  "<br \>\n";
    # Work further with the values to retrieve gene ID using eSearch

   } 

Вторая попытка

# use function to find match
function existor_not($str, $character) {
    if (strpos($str, $character) !== false) {
        return $character;
    }
    return $character = "0";
}
foreach ( $CDNA_new as $string ){

    foreach ( $csv_specie as $keyword ){

        $test = existor_not($string,$keyword);
    }
    echo "-".$test."|" . $string.  "<br \>\n"; 
    # Work further with the values to retrieve gene ID using eSearch
}

Третья попытка

foreach ( $CDNA_new as $string ){
  foreach ( $csv_specie as $keyword ){
    $result = stripos($string, $keyword);
    if ($result === false) {
        $specie = "NA";
    }
    else {
        $specie = $keyword;
    }
}
if ($specie !== "NA"){
echo "match found";
}else{
   $match = "NA";
   $specie = "NA";
}
    echo $specie. "<br \>\n"; 
    # Work further with the values to retrieve gene ID using eSearch
    }

Ответы [ 2 ]

0 голосов
/ 12 июня 2018

Вы можете использовать preg_grep для сопоставления без учета регистра внутри цикла спецификаций.
Затем я использую array_diff, чтобы удалить элементы из $ cdna, чтобы убедиться, что я не сопоставляю снова или не теряю времени.
Чтоостается в $ cdna после того, как в цикле есть элементы, которые не совпадают, я добавляю их к элементу "N / A".

$csv_specie = array("Mouse","Human");
$CDNA = 'Human interleukin 2 (IL2)a;Ampicillin resistance gene (amp)a;Mouse amp gene;Some other stuff unknown to man kind';


$csv_specie = array("Mouse","Human");
$CDNA = 'Human interleukin 2 (IL2)a;Ampicillin resistance gene (amp)a;Mouse amp gene;Some other stuff unknown to man kind;some other human stuff';

$cdna = explode(";", $CDNA);

Foreach($csv_specie as $specie){
    $matches[$specie] = preg_grep("/\b" . $specie . "\b/i", $cdna);
    Echo $specie . " - " . implode("\n" . $specie . " - " , $matches[$specie]) . "\n";

    // Remove matched items from $cdna
    // This makes $cdna smaller for each 
    // iteration and make it faster.
    $cdna = array_diff($cdna, $matches[$specie]);
}

// What is left in $cdna is not matched
$matches["N/A"] = $cdna;

Echo "\nN/A - " . implode("\nN/A - ", $matches["N/A"]);

Вывод:

Mouse - Mouse amp gene
Human - Human interleukin 2 (IL2)a
Human - some other human stuff

N/A - Ampicillin resistance gene (amp)a
N/A - Some other stuff unknown to man kind

https://3v4l.org/64Qmq

0 голосов
/ 12 июня 2018

При использовании вашей первой версии в качестве основы возникла пара проблем.Вы не сбрасывали поле, которое использовали для сохранения совпадения, поэтому в следующий раз в нем все равно было совпадение из предыдущего цикла.

Вы также использовали $qspecie и устанавливали $specie.

foreach($CDNA_new as $t){
    $match = null;    // Reset value for match
    # Go through the specie array
    foreach ($csv_specie as $c){
        # Find specie in string
        if (strpos($t, $c) !== FALSE ){
            $match = $c;
            break;       // Don't carry on if you found a match
        }
    }
    # If no match found set values to missing values
    if ($match == null){
        $match = "NA";
    }
    echo "----------------------".  "<br \>\n";
    echo '+'.$match.  "<br \>\n";
    echo '+'.$t.  "<br \>\n";
    # Work further with the values to retrieve gene ID using eSearch
}

Или вы можете рассчитывать на установку фиктивного значения, и тогда оно будет перезаписано только при обнаружении подлинного совпадения ...

foreach($CDNA_new as $t){
    $match = "NA";
    # Go through the specie array
    foreach ($csv_specie as $c){
        # Find specie in string
        if (strpos($t, $c) !== FALSE ){
            $match = $c;
            break;
        }
    }
    echo "----------------------".  "<br \>\n";
    echo '+'.$match.  "<br \>\n";
    echo '+'.$t.  "<br \>\n";
    # Work further with the values to retrieve gene ID using eSearch
} 
...