Вы можете попробовать удалить X самых распространенных английских слов, но у вас всегда будут проблемы с таким наивным подходом, как этот.
Это потому, что обычные английские слова могут иметь особое значение в области компьютерных наук (или в других областях). Недавний подкаст SO ( # 32 ) упоминает эту самую проблему.