Python Unicode% HH-выход - PullRequest
       1

Python Unicode% HH-выход

1 голос
/ 01 июня 2011

All

Я работаю над приложением, в котором есть смесь стандартных символов латинского алфавита 1 и других языков. Я хотел бы преобразовать все в один и тот же «формат», чтобы переводчик Bing мог это понять. Есть две статьи, которые я посмотрел.

  1. https://dev.laptop.org/ticket/2327 Я действительно хочу сделать обратное и преобразовать это http://ar.wikipedia.org/wiki/حاسوب в это http://ar.wikipedia.org/wiki/%D8%AD%D8%A7%D8%B3%D9%88%D8%A8

  2. Подобная статья, но не совсем то, что я искал. Как заключить в кавычки строку в кодировке Юникод в python?

Мой метод довольно прост ...

    for w in wiki:
        q = (w[0])
        u = unicode(q, 'utf=8', errors='ignore')
        h = ''
        for c in u:
            h += do something amazing

        doTranslate(h)

Может ли кто-нибудь помочь пролить свет на то, что мне здесь не хватает?

1 Ответ

2 голосов
/ 01 июня 2011

urllib может помочь. По крайней мере, этот фрагмент работает:

#! /usr/bin/env python
# -*- coding: utf-8 -*-

import urllib

w = 'ar.wikipedia.org/wiki/حاسوب'
print urllib.quote (w)

Выход

ar.wikipedia.org/wiki/%D8%AD%D8%A7%D8%B3%D9%88%D8%A8

В зависимости от того, какую кодировку имеют ваши входные строки, вам может потребоваться вызвать кодирование ('utf-8') перед передачей его в quote ()

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...