У меня есть большой текстовый файл (3,5 МБ), структурированный примерно так:
sweep#1 expanse#1 0.375
loftiness#1 highness#2 0.375
lockstep#1 0.25
laziness#2 0.25
treponema#1 0.25
rhizopodan#1 rhizopod#1 0.25
plumy#3 feathery#3 feathered#1 -0.125
ruffled#2 frilly#1 frilled#1 -0.125
fringed#2 -0.125
inflamed#3 -0.125
inlaid#1 -0.125
За каждым словом следует #
, целое число, а затем его "оценка".Между словом и счетом есть разрывы табуляции.На данный момент текстовый файл загружается в виде строки, используя file_get_contents()
.
Из массива строк , составленного из отдельных строчных букв с символьными символами, I нужно посмотреть каждое значение, найти соответствующий ему счет и добавить его к итоговой сумме .
Я думаю, мне понадобится какая-то форма регулярного выражения, чтобы сначала найти слово, перейти к следующему \t
и затем добавляют целое число к промежуточной сумме.Какой лучший способ сделать это?