Пропустить определенные слова при чтении текста из файла, используя Matlab - PullRequest
0 голосов
/ 29 декабря 2011

Я создал программу Matlab для поиска биграмм и их частот в текстовом файле. Для этого я создал массив ячеек строк, используя функцию textread:

unigrams = textread ('file.txt', '% s');

Но я также хотел бы опустить несколько слов, таких как «to», «the», «is», «or» и т. Д., А также специальные символы «#», «$», «&» и «%» из мой сотовый массив. Есть ли способ исключить эти слова при чтении слов из необработанного файла.

Спасибо.

1 Ответ

1 голос
/ 29 декабря 2011

Вы можете использовать setdiff после чтения текста, чтобы удалить ненужные слова:

unigrams = {'I' 'like' 'this' 'or' 'that' 'Here' 'are' 'some' 'symbols' '#' '$' '&'}
setdiff(unigrams, {'the', 'is' 'or' '#' '$' '&'}, 'stable')

unigrams = 
  Columns 1 through 8
    'I'   'like'   'this'   'or'   'that'   'Here'   'are'   'some'
  Columns 9 through 12
    'symbols'   '#'   '$'   '&'
ans = 
    'I'   'like'   'this'   'that'   'Here'   'are'   'some'   'symbols'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...