Question

У меня 800 записей, которые очень похожи, но им нужно кое-что сделать с ними.Формат такой:

<td class="description"><br> Describing text.<br> Might very well be 2 paragraphs<br> </td>

Мне нужно кое-что сделать с текстом внутри ячейки.Я пытался использовать preg_replace ('/(.+) /').Это заканчивается двумя проблемами.

Мне не удается извлечь то, что находится внутри скобок, но он также извлекает теги ячеек.
Он будет извлекать все до последнего </td> в документе.Я просто хочу, чтобы это пошло на первое вхождение </td>

Заранее спасибо

Daniel Brückner · Answer 1 · 14 июля 2010

D̨͙̯̹̼ỏ͇̥̱͚̲͖̣͢ǹ̶̥͉̳͈͈̏̉ͧ'ͧͬ͏̪̩͓̳̬̱ͅt͇̝̖ͦ̏̏̍̉͠ ͙̺̹͚͎̐̒ͥ͑̀ṷ͍̖͕̐ͫ̚s̤͖͇̲̪͊͋̉ͨͪ̚e͚̲͎͓̟͊̍ ̲̬̩͇̗̭̌̊̑̊͝r̷̦͔̞̜̬ͦe̔̓͒͊̌g̹̘̬̭ͨ̐̽̐̂u̼̹̔ͣ͑͐̓͋l͈̤̘͉̰̏͌̚a̵̤̞̥̋rͭ ̦̝͓̟̣̯̄́̎̀̔ͥe̢̟̥̹̊̅̌̅̋x̠̠̲͚̝͋ͪp̧̽̉ṟ͉̏͌̊̐ͅe͖͎̞͇̽͛̀s͓͈̒s̴͚̮̹ͧ̽i̐ͪ̈́̏̑o͇͓̎n͎̐̃ͨ͢s̜͉̼̹͇̐ͥ̏̈́̽̔͐ ̛̑ͧf̩̋ͨ͑ö̮̗̩́̏̀ͩ̆r̮͓͊̌ ̸̪͈̫̬̭̻̮͊ͧ͂ͬ̌H͎̤̟͙̞ͪ͐̃̿ͮͭͅT͚̉͑͛̉M̴̦͖͇͔͚̙ͭͭ̽L͗ͦ̋̓͑ ͍͈͙̞͍̻̉̆͆̃͘p͖̘̲̰͉͉̺̓̉̃͆͛ͦ́͛ͪͩ̋͟͜ ** 100 100 ͑̀̑̆̈̾ ̾͑ͬͬ͐̋̀ ̾͑ͬͬ͐̋̀ ̾͑ͬͬ͐̋̀ 100 Если вы все еще хотите попробовать ... используйте группы без захвата (?:), чтобы исключить теги, и ленивый квантификатор *?, чтобы соответствовать только первому закрывающему тегу.

(?:<td[^>]*>).*?(?:</td>)

Это требует режима "точка-все" и может по-прежнему не работать, если, например, атрибут description содержит закрывающую угловую скобку.

Donald Miner · Answer 2 · 14 июля 2010

Прежде всего,. + Все схватит ... он не просто начнется с <td>. Вы захотите добавить регулярное выражение, чтобы вытянуть начало таблицы col:

<td[^>]*?>

(примечание, [^>]* означает совпадение не-> символов, пока мы не найдем его.)

Кроме того, .+ и .* являются жадными , что означает, что он будет захватывать как можно больше. Чтобы изменить это поведение, добавьте ? после него, например: .+?. Это заставляет его удовлетворять столько, сколько ему нужно.

Итак, у вас будет

<td[^>]*)>(.*?)<\/td>

Это был урок по регулярным выражениям, но я действительно думаю, что вы не должны использовать регулярные выражения для этого. Regex может легко сломаться, когда вы начнете иметь вложенные таблицы или что-нибудь более сложное, чем простой HTML.

Wrikken · Answer 3 · 14 июля 2010

$d = new DOMDocument();
$d->loadHTML($htmlstring);
$x = new DOMXPath($d);
$tds = $x->query("//td[@class='description']//text()");
for($i = 1; $i <= $tds->length; $i++){
    $tds->item($i)->replaceData(0,mb_strlen($tds->item($i)->wholeText),strtoupper($tds->item($i)->wholeText));   
}
var_dump($d->saveHTML());

NikiC · Answer 4 · 14 июля 2010

Как сказали все остальные: RegExp плох, по крайней мере, здесь!

Итак, базовое регулярное выражение равно

#<td[^>]*>(.*?)</td>#s

(заметьте, я использовал s-модификатор, в противномRegExp не сработает.)

Теперь этот RegExp неверен, даже если он подходит для ваших целей.Чтобы быть более строгим, вы должны знать, что > допускается в атрибутах.Поэтому это регулярное выражение может сломать вещи.

#<td(\s+\w+="[^"]+")\s*>(.*?)</td>#s

Я думаю, что теперь это будет довольно безопасно, если вы имеете дело с XML.Но, конечно, это может сломаться в редких случаях, которые я сейчас не могу придумать.

Narcis Radu · Answer 5 · 14 июля 2010

Вы можете использовать:

preg_replace(
  '/<td (.*?)>(.*?)<\/td>/sm',
  '<td class="description"><strong>$2</strong></td>',
  $data
)

Если то, что вы пытаетесь сделать с текстом внутри, сложно, используйте функцию обратного вызова.

Fosco · Answer 6 · 14 июля 2010

Если вы уверены, что в ячейках таблицы нет HTML, может помочь следующий код без регулярных выражений:

// $entries contains all of the table cell entries.
$newentries = "";
$cells = split("</td>",$entries);
while (list(,$data) = each($cells)) {
    $newentries .= "<td class=\"description\">";
    $text = substr($data,strpos($data, ">") + 1);
    // perform modifications on $text
    // i.e. $text = "<B>" . $text . "</B>";
    $newentries .= $text;
    $newentries .= "</td>";
}

// $newentries now contains the modified cell entries.

Возможно, это не на 100% то, что вы ищете,но, возможно, это поможет.

Regex для автоматизации некоторых тегов HTML

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Regex для автоматизации некоторых тегов HTML

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов