Нелатинские символы в URL - лучше кодировать их или заменить их латинскими "аналогами"? - PullRequest
1 голос
/ 29 апреля 2010

Мы реализуем блог для сайта, который поддерживает шесть различных языков, и пять из них имеют нелатинские символы в алфавите. Мы не уверены, должны ли они быть закодированы (это то, что мы делаем в данный момент)

Литературные рассказы: Co je dovoleno? становится l% c3% a9t% c3% a1n% c3% ad-s-potravinami-co-je-dovoleno и браузер отображает его как Летани-с-потравинами-ко-дже-доволено .

или, если мы должны заменить их латинскими "аналогами" (похожие буквы)

Литовские потравинами: Co je dovoleno? становится letani-s-potravinami-co-je-dovoleno .

Я не могу найти однозначного ответа о том, что лучше с точки зрения SEO? Поисковая оптимизация очень важна для нас. Какой подход вы бы предложили?

Ответы [ 6 ]

4 голосов
/ 29 апреля 2010

В большинстве случаев поисковые системы хорошо справляются с латинскими аналогами, хотя иногда результаты, т. Е. "létání" и "letani", немного отличаются.

Таким образом, с точки зрения SEO, почти никакого вреда не будет - как только ваш сайт будет иметь хороший контент, хорошую разметку и все прочее, ваш сайт не будет страдать от наличия латинских URL.

Вы не всегда знаете, какую комбинацию системного браузера и плагинов используют пользователи, поэтому сделайте их как можно проще - все веб-сайты используют стандартные латинские URL-адреса, потому что нелатинские символы могут задушить что угодно от сервера через браузер до любого плагина это может нарушить пользовательский опыт.

И я не могу этого подчеркнуть; Пользователи до SEO!

1 голос
/ 29 апреля 2010

"что лучше с точки зрения SEO"

Кто ваша аудитория? Американцы, которые считают все эти лишние буквы ошибкой?

Или люди, которые читают (и ищут) буквы "не ASCII", потому что эти буквы не ASCII являются частью их языка?

SEO - плохая вещь, чтобы преследовать. Полный, правильный, последовательный и удобный - это то, что вам нужно построить в первую очередь.

0 голосов
/ 30 апреля 2010

Другая проблема заключается в том, что существуют кодовые точки Unicode, глифы которых выглядят очень похоже в большинстве шрифтов, что абсолютно идеально подходит для фишеров. Придерживайтесь ASCII, и глифы заметно различаются, когда символы.

0 голосов
/ 30 апреля 2010

В соответствии со спецификацией URI, RFC 3986, разрешены только 7-битные символы ASCII, и символы из числа упомянутых в спецификации в качестве управляющих символов должны быть должным образом экранированы. Если вы хотите представлять другие символы или управляющие символы URI, вам следует использовать IRI, RFC 3987. Однако помните, что HTTP не совместим с IRI.

В случае сомнений RTFM.

0 голосов
/ 29 апреля 2010

Павел, прежде всего, вы должны решить, собираетесь ли вы оптимизировать для глобального Google (google.com) или польского.

0 голосов
/ 29 апреля 2010

хорошо, я предлагаю вам заменить их латинскими аналогами, потому что это удобно для пользователя, и ваш сайт будет доступен на каждом компьютере (так как клавиатура переключается с компьютера на другой, но все они имеют латинские буквы), но для перспективы SEO я не думаю, что это будет проблемой.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...