Преобразование списка кортежей, содержащих данные utf8, в текст деванагари - PullRequest
0 голосов
/ 01 мая 2019

У меня есть список кортежей, который содержит текст Unicode. Я пытаюсь отобразить / преобразовать его в Деванагари.

g=[]
g=[(u'\u0915\u0947\u0932\u094d\u092f\u094b ', u'\u0938\u0917\u0933\u094d\u092f\u093e\u0902\u0924 \u091a\u0921 \u096a\u096b \u0927\u093e\u0902\u0935\u0921\u094d\u092f\u094b '), (u'\u0936\u093f\u0916\u0930 \u0927\u0935\u0928\u093e\u0928 ', u'\u0938\u0917\u0933\u094d\u092f\u093e\u0902\u0924 \u091a\u0921 \u096a\u096b \u0927\u093e\u0902\u0935\u0921\u094d\u092f\u094b ')]
[(u'\u0938\u0928\u0930\u093e\u092f\u091d\u0930\u094d\u0938 \u0939\u0948\u0926\u0930\u093e\u092c\u093e\u0926 \u092e\u0941\u0902\u092c\u092f \u0907\u0902\u0921\u093f\u092f\u0928\u094d\u0938\u093e\u0915 ', u'\u092a\u0902\u0917\u0921\u093e\u0928 \u090f\u0915\u0947 \u0935\u093f\u0915\u0947\u091f\u0940\u0902\u0928\u0940 '), (u'\u092a\u0902\u0917\u0921\u093e\u0928 \u090f\u0915\u0947 \u0935\u093f\u0915\u0947\u091f\u0940\u0902\u0928\u0940 ', u'\u0939\u093e\u0930\u092f\u0932\u094b ')]
[(u'\u0939\u0948\u0926\u0930\u093e\u092c\u093e\u0926\u093e \u092c\u093f\u0932\u0940 \u0938\u094d\u091f\u0947\u0928\u0932\u0947\u0915 \u0938\u0902\u0926\u0940\u092a \u0936\u0930\u094d\u092e\u093e \u0938\u093f\u0927\u094d\u0926\u093e\u0930\u094d\u0925 \u0915\u094b\u0932 ', u'\u0939\u093e\u0923\u0947\u0902 \u092a\u094d\u0930\u0924\u094d\u092f\u0947\u0915\u0940 \u0926\u094b\u0928 \u0935\u093f\u0915\u0947\u091f\u0940 '), (u'\u0918\u0947\u0924\u0932\u094d\u092f\u094b ', u'\u0939\u093e\u0923\u0947\u0902 \u092a\u094d\u0930\u0924\u094d\u092f\u0947\u0915\u0940 \u0926\u094b\u0928 \u0935\u093f\u0915\u0947\u091f\u0940 ')]
[(u'\u0918\u0947\u0924\u0932\u0940 ', u'\u0924\u0940\u0928 \u0935\u093f\u0915\u0947\u091f '), (u'\u0918\u0947\u0924\u0932\u0940 ', u'\u090f\u0915 \u0935\u093f\u0915\u0947\u091f '), (u'\u090f\u0915 \u0935\u093f\u0915\u0947\u091f ', u'\u0936\u0930\u094d\u092e\u093e\u0928 '), (u'\u0924\u0940\u0928 \u0935\u093f\u0915\u0947\u091f ', u'\u092e\u092f\u0902\u0915\u093e\u0928 ')]
[(u'\u0938\u0928\u0930\u093e\u092f\u091d\u0930\u094d\u0938\u093e\u0928 ', u'\u0968\u0966 \u0913\u0935\u094d\u0939\u0930\u0940\u0902\u0928\u0940 \u096f \u0935\u093f\u0915\u0947\u091f\u0940 \u091c\u0948\u0924 '), (u'\u0935\u0917\u0921\u093e\u0935\u0928 \u091c\u094b\u0921\u0932\u0947\u0902 ', u'\u0968\u0966 \u0913\u0935\u094d\u0939\u0930\u0940\u0902\u0928\u0940 \u096f \u0935\u093f\u0915\u0947\u091f\u0940 \u091c\u0948\u0924 ')]
[(u'\u092a\u0930\u094d\u091c\u0933\u094d\u0933\u094b ', u'\u091c\u0948\u0924\u093e\u0902\u0924 '), (u'\u091c\u0948\u0924\u093e\u0902\u0924 ', u'\u0938\u0928\u0930\u093e\u092f\u091d\u0930\u094d\u0938\u093e\u091a\u094d\u092f\u093e \u0926\u0940\u092a\u0930 \u0939\u0941\u0921\u093e ')]
[(u'\u090f\u0915\u0947 \u0935\u093f\u0915\u0947\u091f\u0940\u0928 \u091c\u0948\u0924 ', u'\u0938\u0928\u0930\u093e\u092f\u091d\u0930\u094d\u0938\u093e\u0915 ')]
ls=[]
for x in g[0]:

    ls.append(x)
    print (x)

Это то, что я получаю. ВЫХОД: एके विकेटीन जैत सनरायझर्साक

1 Ответ

0 голосов
/ 01 мая 2019

Имея список кортежей строк, вы можете использовать выражение генератора, чтобы "сгладить" коллекцию в список строк, а затем вызвать str.join в списке, чтобы создать одну строку.

>>> g =[(u'\u0915\u0947\u0932\u094d\u092f\u094b ', u'\u0938\u0917\u0933\u094d\u092f\u093e\u0902\u0924 \u091a\u0921 \u096a\u096b \u0927\u093e\u0902\u0935\u0921\u094d\u092f\u094b '), (u'\u0936\u093f\u0916\u0930 \u0927\u0935\u0928\u093e\u0928 ', u'\u0938\u0917\u0933\u094d\u092f\u093e\u0902\u0924 \u091a\u0921 \u096a\u096b \u0927\u093e\u0902\u0935\u0921\u094d\u092f\u094b ')]
>>> print ''.join(item for tuple_ in g for item in tuple_)

केल्यो सगळ्यांत चड ४५ धांवड्यो शिखर धवनान सगळ्यांत चड ४५
...