Использование æ, ø и å в Python - PullRequest
0 голосов
/ 07 мая 2018

Я хочу открыть файл, который содержит буквы датского æ, ø и å. Когда я открыл файл, я хотел бы упорядочить слова и буквы в строке, в которую я сохранил вывод файла.

К сожалению, когда я пытаюсь увидеть, являются ли какие-либо из этих букв частью строки, вывод получается как нет. Вот моя программа:

wordlist = open("_newWordList.txt", "r")
print("Opened newwordlist")

for lineNo, content in enumerate(wordlist):

    s_line = content.split(";")

    print(str(lineNo)+": Checking the content: "+str(s_line)+" on line number: "+str(lineNo))

    ok = s_line[1]

    if ok[:4] == "adj.":
        adj = adj + s_line[0]

    elif ok[:10] == "ubøj. adj.":
            adj = adj + s_line[0]

    elif ok[:4] == "adv.":
        adv = adv + s_line[0]

    elif ok[:5] == "fork.":
        fork = fork + s_line[0]

    elif ok[:8] == "præfiks.":
        præfiks = præfiks + s_line[0]

    elif ok[:5] == "præp.":
        praep = praep + s_line[0]

    elif ok[:5] == "pron.":
        pron = pron + s_line[0]

    elif ok[:5] == "prop.":
        prop = prop + s_line[0]

    elif ok[:3] == "sb.":
        sb = sb + s_line[0]

    elif ok[:7] == "sb. pl.":
        sb = sb + s_line[0]

    elif ok[:9] == "udråbsord":
        uro = uro + s_line[0]

    elif ok[:3] == "vb.":
        vb = vb + s_line[0]

    else:
        print(" ")
        print("Error; didn't read any wordclass in the word: "+str(lineNo+1)+" : "+str(content))
        print("The wordclass is: "+ok)
        totalErrors += 1

Буквы появляются как странные, нечитаемые символы.

...