Я создал программу Matlab для поиска биграмм и их частот в текстовом файле. Для этого я создал массив ячеек строк, используя функцию textread:
unigrams = textread ('file.txt', '% s');
Но я также хотел бы опустить несколько слов, таких как «to», «the», «is», «or» и т. Д., А также специальные символы «#», «$», «&» и «%» из мой сотовый массив. Есть ли способ исключить эти слова при чтении слов из необработанного файла.
Спасибо.