разделить строки в массив? - PullRequest
0 голосов
/ 09 марта 2012

Из данной строки, которая $ codes Я просто хочу, чтобы весь язык в языковой массив, весь код в массив кода и, наконец, весь массив в семейство, как я могу сделать это в php?Я пытался использовать DOM, но это невозможно, в любом случае будет признателен, спасибо заранее.

<code><?php
 $codes = '<pre>
 LANGUAGE      CODE     LANGUAGE FAMILY

AFAR            AA     HAMITIC
ABKHAZIAN       AB     IBERO-CAUCASIAN
AFRIKAANS       AF     GERMANIC
AMHARIC         AM     SEMITIC
ARABIC          AR     SEMITIC
ASSAMESE        AS     INDIAN
AYMARA          AY     AMERINDIAN
AZERBAIJANI     AZ     TURKIC/ALTAIC
BASHKIR         BA     TURKIC/ALTAIC
BYELORUSSIAN    BE     SLAVIC
BULGARIAN       BG     SLAVIC
BIHARI          BH     INDIAN
BISLAMA         BI     [not given]
BENGALI;BANGLA  BN     INDIAN
TIBETAN         BO     ASIAN
BRETON          BR     CELTIC
CATALAN         CA     ROMANCE
CORSICAN        CO     ROMANCE
CZECH           CS     SLAVIC
WELSH           CY     CELTIC
DANISH          DA     GERMANIC
GERMAN          DE     GERMANIC
BHUTANI         DZ     ASIAN
GREEK           EL     LATIN/GREEK
ENGLISH         EN     GERMANIC
ESPERANTO       EO     INTERNATIONAL AUX.
SPANISH         ES     ROMANCE
ESTONIAN        ET     FINNO-UGRIC
BASQUE          EU     BASQUE
PERSIAN (farsi) FA     IRANIAN
FINNISH         FI     FINNO-UGRIC
FIJI            FJ     OCEANIC/INDONESIAN
FAROESE         FO     GERMANIC
FRENCH          FR     ROMANCE
FRISIAN         FY     GERMANIC
IRISH           GA     CELTIC
SCOTS GAELIC    GD     CELTIC
GALICIAN        GL     ROMANCE
GUARANI         GN     AMERINDIAN
GUJARATI        GU     INDIAN
HAUSA           HA     NEGRO-AFRICAN
HEBREW          HE     SEMITIC [*Changed 1989 from original ISO 639:1988, IW] 
HINDI           HI     INDIAN
CROATIAN        HR     SLAVIC
HUNGARIAN       HU     FINNO-UGRIC
ARMENIAN        HY     INDO-EUROPEAN (OTHER)
INTERLINGUA     IA     INTERNATIONAL AUX.
INTERLINGUE     IE     INTERNATIONAL AUX.
INUPIAK         IK     ESKIMO
INDONESIAN      ID     OCEANIC/INDONESIAN [*Changed 1989 from original ISO 639:1988, IN] 
ICELANDIC       IS     GERMANIC
ITALIAN         IT     ROMANCE
INUKTITUT       IU     [        ]
JAPANESE        JA     ASIAN
JAVANESE        JV     OCEANIC/INDONESIAN
GEORGIAN        KA     IBERO-CAUCASIAN
KAZAKH          KK     TURKIC/ALTAIC
GREENLANDIC     KL     ESKIMO
CAMBODIAN       KM     ASIAN
KANNADA         KN     DRAVIDIAN
KOREAN          KO     ASIAN
KASHMIRI        KS     INDIAN
KURDISH         KU     IRANIAN
KIRGHIZ         KY     TURKIC/ALTAIC
LATIN           LA     LATIN/GREEK
LINGALA         LN     NEGRO-AFRICAN
LAOTHIAN        LO     ASIAN
LITHUANIAN      LT     BALTIC
LATVIAN;LETTISH LV     BALTIC
MALAGASY        MG     OCEANIC/INDONESIAN
MAORI           MI     OCEANIC/INDONESIAN
MACEDONIAN      MK     SLAVIC
MALAYALAM       ML     DRAVIDIAN
MONGOLIAN       MN     [not given]
MOLDAVIAN       MO     ROMANCE
MARATHI         MR     INDIAN
MALAY           MS     OCEANIC/INDONESIAN
MALTESE         MT     SEMITIC
BURMESE         MY     ASIAN
NAURU           NA     [not given]
NEPALI          NE     INDIAN
DUTCH           NL     GERMANIC
NORWEGIAN       NO     GERMANIC
OCCITAN         OC     ROMANCE
AFAN (OROMO)    OM     HAMITIC
ORIYA           OR     INDIAN
PUNJABI         PA     INDIAN
POLISH          PL     SLAVIC
PASHTO;PUSHTO   PS     IRANIAN
PORTUGUESE      PT     ROMANCE
QUECHUA         QU     AMERINDIAN
RHAETO-ROMANCE  RM     ROMANCE
KURUNDI         RN     NEGRO-AFRICAN
ROMANIAN        RO     ROMANCE
RUSSIAN         RU     SLAVIC
KINYARWANDA     RW     NEGRO-AFRICAN
SANSKRIT        SA     INDIAN
SINDHI          SD     INDIAN
SANGHO          SG     NEGRO-AFRICAN
SERBO-CROATIAN  SH     SLAVIC
SINGHALESE      SI     INDIAN
SLOVAK          SK     SLAVIC
SLOVENIAN       SL     SLAVIC
SAMOAN          SM     OCEANIC/INDONESIAN
SHONA           SN     NEGRO-AFRICAN
SOMALI          SO     HAMITIC
ALBANIAN        SQ     INDO-EUROPEAN (OTHER)
SERBIAN         SR     SLAVIC
SISWATI         SS     NEGRO-AFRICAN
SESOTHO         ST     NEGRO-AFRICAN
SUNDANESE       SU     OCEANIC/INDONESIAN
SWEDISH         SV     GERMANIC
SWAHILI         SW     NEGRO-AFRICAN
TAMIL           TA     DRAVIDIAN
TELUGU          TE     DRAVIDIAN
TAJIK           TG     IRANIAN
THAI            TH     ASIAN
TIGRINYA        TI     SEMITIC
TURKMEN         TK     TURKIC/ALTAIC
TAGALOG         TL     OCEANIC/INDONESIAN
SETSWANA        TN     NEGRO-AFRICAN
TONGA           TO     OCEANIC/INDONESIAN
TURKISH         TR     TURKIC/ALTAIC
TSONGA          TS     NEGRO-AFRICAN
TATAR           TT     TURKIC/ALTAIC
TWI             TW     NEGRO-AFRICAN
UIGUR           UG     [       ]
UKRAINIAN       UK     SLAVIC
URDU            UR     INDIAN
UZBEK           UZ     TURKIC/ALTAIC
VIETNAMESE      VI     ASIAN
VOLAPUK         VO     INTERNATIONAL AUX.
WOLOF           WO     NEGRO-AFRICAN
XHOSA           XH     NEGRO-AFRICAN
YIDDISH         YI     GERMANIC [*Changed 1989 from original ISO 639:1988, JI] 
YORUBA          YO     NEGRO-AFRICAN
ZHUANG          ZA     [       ]
CHINESE         ZH     ASIAN
ZULU            ZU     NEGRO-AFRICAN
';$ doc = новый DOMDocument ();$ Doc-> loadHTML ($ коды);$ xmlL = simplexml_import_dom ($ doc);$ pathL = $ xmlL-> xpath ('// pre');print_r ($ pathL);?>

Ответы [ 2 ]

1 голос
/ 09 марта 2012

список, очевидно, сгенерирован, так что вам лучше повременить с исправлением генератора, но если вы застряли с этим одним списком, ниже следует проанализировать его так, как вы хотите:

$langs_ar = array();
$codes_ar = array();
$families_ar = array();

foreach(preg_split('/[\r\n]+/', $codes) as $line)
{   
    if (preg_match('/^(\S+\s*\S+)\s+(\S{2})\s+(\S.*\S)\s*$/', $line, $matches))
    {   
        $langs_ar[] = $matches[1];
        $codes_ar[] = $matches[2];
        $families_ar[] = $matches[3];
    }                                                                                                                                             
}

Да, и вместо 3-х массивов я бы порекомендовал один массив для хранения хэшей для 3-х полей; или создайте свои собственные объекты с 3 свойствами lang, code и family.

Редактировать: гораздо более короткий способ сделать то же самое:

preg_match_all('/^(\S+\s*\S+)\s+(\S{2})\s+(\S.*\S)\s*$/m', $codes, $matches, PREG_SET_ORDER);
var_dump($matches);

$ match теперь является массивом «объектов» для всех ваших строк, где индексы:

  • 0 - полная строка
  • 1 - это язык
  • 2 - это код
  • 3 - это семья

просто повторяйте это, чтобы делать все, что вы хотите.

1 голос
/ 09 марта 2012

Я думаю, вы должны взглянуть на функцию разнесения в php.

С этим вы можете сначала разделить символ "\ n" (для разделения строк), и вы получите первый массив.Затем для каждой строки вы можете использовать \ t (предположим, у вас есть вкладки, разделяющие ваши данные), чтобы получить массив с 3 отдельными записями, а затем поместить каждый из этих массивов в нужный вам массив.

Что-то вроде:

$codes_array = array();
foreach($line as explode("\n",$codes) ){
    $codes_array[] = explode("\t",$line);
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...