Является ли Perl хорошим вариантом для интенсивной обработки текста? - PullRequest
3 голосов
/ 02 марта 2009

У меня есть это веб-приложение, которое должно выполнять несколько сложных задач по обработке текста: удаление определенных символов, анализ XML-файлов и другие. Некоторые из них содержат регулярные выражения.

Веб-приложение имеет некоторые реализации на Java и другие на PHP. Стоит ли использовать Perl или другой специфический язык обработки текста для таких задач, или действительно нет никакой разницы с использованием PHP?

Я даже думал об использовании Sed, Awk, может быть, даже некоторые скомпилированные C-скрипты для обработки текстов. Обрабатывается много текста ...

Ответы [ 6 ]

16 голосов
/ 02 марта 2009

Да, Perl - хороший вариант. Как язык, он определенно больше подходит для таких задач, чем Java или PHP. Если у вас есть знания Perl, я бы порекомендовал их для такого рода задач.

9 голосов
/ 02 марта 2009

Я тоже предлагаю вам использовать Perl, он предназначен для сжатия текста.

Однако, если вы собираетесь анализировать / обрабатывать XML, пожалуйста, не пытайтесь развернуть свое собственное решение, есть несколько высококачественных модулей, которые делают работу правильно. Для начала я рекомендую взглянуть на XML :: Twig

Кроме того, для регулярных выражений существуют десятки уже созданных в дистрибутиве Regexp :: Common . Скорее всего, вы найдете там то, что вам нужно, и это сэкономит ваше время.

6 голосов
/ 02 марта 2009

Perl - это язык для обработки текста. Это было разработано с учетом этого.

3 голосов
/ 02 марта 2009

Да, Perl был разработан с учетом обработки текста.

Он имеет множество полезных функций обработки текста, и это был первый язык, который я использовал (давно), который имел регулярные выражения.

http://en.wikipedia.org/wiki/Perl

3 голосов
/ 02 марта 2009

Обработка текста - это именно то, для чего был создан Perl. В конце концов это практическое извлечение и язык отчетов. С другой стороны, для веб-приложения я бы предпочел Python.

2 голосов
/ 02 марта 2009

Да. Обработка текста является сильной стороной PERL # 1. Поскольку вы будете интегрироваться в существующее приложение, вам нужно будет выполнить внешнюю программу, поэтому подумайте о том, как запустить ее безопасно и, возможно, в качестве фонового процесса (чтобы избежать задержек при запуске веб-приложения в реальном времени.)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...