Я хочу провести анализ текста в программе, которую я пишу. Я ищу альтернативные источники текста в необработанном виде, аналогичном тому, который представлен в дампах Википедии (download.wikimedia.com).
Я бы предпочел не сталкиваться с проблемой сканирования веб-сайтов, попытки анализа html, извлечения текста и т. Д.