У меня есть сайт, который позволяет пользователям отправлять фотографии дикой природы.После загрузки они могут идентифицировать вид на фотографии, например, «Белый медведь».
Это заставляет меня получать информацию из Википедии об этом виде, используя этот поисковый термин:
$query = "http://en.wikipedia.org/w/api.php?action=query&rvprop=content&format=json&titles=" . $query;
$pages = file_get_contents($query);
Такой запрос возвращает одно из следующего:
- Массив pageids, который я могу затем запросить для содержимого этой страницы
- Ничего, потому что просто нет никакого совпадения
- РЕДАКТИРУЕМЫЙ результат, который позволяет мне разрешить страницу с правильнымимя
Проблема, с которой я столкнулся, связана с корпусом.Например, поисковый запрос «Молочный аист» ничего не возвращает, даже редирект.«Молочный аист» работает.Прописывание каждого слова в запросе также не является решением, так как могло бы случиться так, что некоторые страницы в нижнем регистре, тогда как запрос в верхнем регистре не работает.Нет последовательности.
Я ищу способ сделать это более надежным.Не должно быть, чтобы запрос не выполнялся из-за неправильного ввода в регистр, что невозможно даже предсказать на стороне пользователя.
Кто-нибудь знает решение для этого?Кроме того, чтобы попробовать все возможные комбинации оболочек?
Примечание: Некоторые могут предложить вместо этого использовать dbpedia, но это не решение для моих общих потребностей.