Какая официальная кодировка для потокового API Twitter? Мое лучшее предположение - UTF-8, основанный на том, что я видел, но я хотел бы избежать предположений.
Единственная часть сайта Twitter, которую я видел, где они даже намекают на то, что они используют в качестве официальной кодировки, находится здесь:
Twitter не хочет наказывать пользователя за то, что мы используем UTF-8 или за то, что рассматриваемый клиент API использовал более длинное представление
https://dev.twitter.com/docs/counting-characters
У кого-нибудь есть более "официальный" ответ? Я пишу токенайзер конечного автомата для потокового API, который делает определенные предположения. Последнее, что я хочу - это встретить что-то вроде UTF-16.
Спасибо! : D