Старые твиты недоступны публично - даже тем, кто их написал.
Возможно, вам следует обратиться в Twitter. Библиотека Конгресса США, очевидно, тоже архивирует эти данные.
Возможно, вы сможете получить доступ к любому из них, если это законная исследовательская деятельность (на базе университета).
Добавление : было несколько корпусов, созданных из Twitter, но они были удалены из распространения по запросу Twitter. Потоковый API позволяет довольно легко создать собственный корпус за несколько часов / дней довольно приличного размера, но я не знаю ни одного, доступного для распространения. В зависимости от вашего приложения, Международная конференция по социальным сетям и блогам имеет (терабайты) данные, доступные для исследования, но я не знаю, есть ли что-нибудь из твиттера.