Я хочу извлечь все каналы Twitter только на определенном языке.(для извлечения твитов на сингальском языке) Как я могу сделать это, используя python?
regex полезно. Коды использования сингальского языка U+0D80 ~ U+0DFF в utf-8.Сначала попробуйте извлечь твиты, содержащие символы сингальского языка, с помощью регулярных выражений.
regex
U+0D80
U+0DFF
utf-8