В основном меня интересуют символы английского языка и знаки препинания.
Мне это нужно для тестовых данных, чтобы я мог эмулировать, как API обрабатывает разные символы.
Могу ли я сгенерировать его, используя Python или PHP?
Большинство английских символов просто ascii, но здесь - полный список символов utf-8.
Здесь - другой список, отсортированный по наборам символов.
Здесь есть полезная интерактивная таблица здесь с разбивкой по языку / использованию
Возможно, вы захотите проверить строковый модуль для Python, у которого есть несколько полезных структур данных с данными в них:
http://docs.python.org/library/string.html#