MySQL FULLTEXT не работает - PullRequest
       11

MySQL FULLTEXT не работает

25 голосов
/ 14 июля 2009

Я пытаюсь добавить поддержку поиска для моего веб-приложения PHP, используя индексы FULLTEXT MySQL.

Я создал тестовую таблицу (используя тип MyISAM, с одним текстовым полем a) и ввел некоторые примеры данных. Теперь, если я прав, следующий запрос должен вернуть обе эти строки:

SELECT * FROM test WHERE MATCH(a) AGAINST('databases')

Однако он не возвращает ни одного. Я провел небольшое исследование и, насколько я могу судить, все делаю правильно: таблица - это таблица MyISAM, установлены индексы FULLTEXT. Я попытался запустить запрос из командной строки и из phpMyAdmin, но безуспешно. Я что-то упускаю из виду?


ОБНОВЛЕНИЕ: Хорошо, хотя решение Коди сработало в моем тестовом примере, оно не работает на моей реальной таблице:

CREATE TABLE IF NOT EXISTS `uploads` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` text NOT NULL,
  `size` int(11) NOT NULL,
  `type` text NOT NULL,
  `alias` text NOT NULL,
  `md5sum` text NOT NULL,
  `uploaded` datetime NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM  DEFAULT CHARSET=latin1 AUTO_INCREMENT=6 ;

И данные, которые я использую:

INSERT INTO `uploads` (`id`, `name`, `size`, `type`, `alias`, `md5sum`, `uploaded`) VALUES
(1, '04 Sickman.mp3', 5261182, 'audio/mp3', '1', 'df2eb6a360fbfa8e0c9893aadc2289de', '2009-07-14 16:08:02'),
(2, '07 Dirt.mp3', 5056435, 'audio/mp3', '2', 'edcb873a75c94b5d0368681e4bd9ca41', '2009-07-14 16:08:08'),
(3, 'header_bg2.png', 16765, 'image/png', '3', '5bc5cb5c45c7fa329dc881a8476a2af6', '2009-07-14 16:08:30'),
(4, 'page_top_right2.png', 5299, 'image/png', '4', '53ea39f826b7c7aeba11060c0d8f4e81', '2009-07-14 16:08:37'),
(5, 'todo.txt', 392, 'text/plain', '5', '7ee46db77d1b98b145c9a95444d8dc67', '2009-07-14 16:08:46');

Запрос, который я сейчас выполняю:

SELECT * FROM `uploads` WHERE MATCH(name) AGAINST ('header' IN BOOLEAN MODE)

Который должен возвращать строку 3, header_bg2.png. Вместо этого я получаю еще один пустой набор результатов. Мои параметры для логического поиска приведены ниже:

mysql> show variables like 'ft_%';
+--------------------------+----------------+
| Variable_name            | Value          |
+--------------------------+----------------+
| ft_boolean_syntax        | + -><()~*:""&| |
| ft_max_word_len          | 84             |
| ft_min_word_len          | 4              |
| ft_query_expansion_limit | 20             |
| ft_stopword_file         | (built-in)     |
+--------------------------+----------------+
5 rows in set (0.02 sec)

"заголовок" находится в пределах ограничений длины слова, и я сомневаюсь, что это стоп-слово (я не уверен, как получить список). Есть идеи?

Ответы [ 2 ]

49 голосов
/ 14 июля 2009

Добавить больше данных. По умолчанию MySQL игнорирует любое слово, которое находится в 50% или более строк в таблице, так как считает, что это будет слово «шум».

При очень небольшом количестве строк в таблице часто часто приходится превышать этот предел в 50% (т. Е. Если у вас есть две строки, каждое слово находится не менее чем в 50% строк!).

24 голосов
/ 14 июля 2009

Существует два режима полнотекстового поиска MySQL: режим естественного языка и логический режим. Ограничение режима естественного языка: «... слова, присутствующие в 50% или более строк, считаются общими и не совпадают. Полнотекстовый поиск - это поиск на естественном языке, если не указан модификатор». И естественный язык является режимом по умолчанию. Это задокументировано в полнотекстовых документах:

http://dev.mysql.com/doc/refman/5.0/en/fulltext-search.html

Если вы переключите свой запрос на использование логического режима:

SELECT * FROM test WHERE MATCH(a) AGAINST('databases' IN BOOLEAN MODE)

Затем возвращаются две строки.

Логический режим имеет свои собственные ограничения, одним из которых является то, что он не возвращает свои строки в порядке релевантности. В целом, он предлагает больше возможностей и гибкости, чем режим естественного языка, так что вы, вероятно, в конечном итоге будете его использовать.

Если ваше приложение будет в значительной степени полагаться на полнотекстовый поиск, вы можете рассмотреть возможность использования более полнофункциональных пакетов, таких как Lucene / Solr или Sphinx

...