В прошлом я использовал корпус Google LM 1B для тестирования письменного языка, например, других периодических изданий. Тем не менее, я сейчас использую текст из чата, который является диалоговым. Я хотел бы измерить предсказуемость, но не был уверен, что модель LM 1B даст мне неточные вероятности, потому что она в основном обучалась на новостной ленте.