Можно ли токенизировать текст в PL / PGSQL с помощью регулярных выражений? - PullRequest
1 голос
/ 23 сентября 2011

Я хочу токенизировать текст в моей базе данных с помощью RegEx и сохранить полученные токены в таблице.Сначала я хочу разделить слова на пробелы, а затем на каждый токен с помощью пунктуации.

Я делаю это в своем приложении, но выполнение его в базе данных может ускорить его.

можно ли это сделать?

1 Ответ

1 голос
/ 24 сентября 2011

Для таких задач существует ряд функций .
Чтобы получить 2-е слово текста:

SELECT split_part('split this up', ' ', 2);

Разделить весь текст и вернуть слово в строке:

SELECT regexp_split_to_table('split this up', E'\\s+');

(На самом деле последний пример разбивается на любые пробелы.)

...