Мне бы хотелось узнать, какие из них наиболее часто встречаются в данном тексте или группе текстов (взятых из базы данных) в рубине.
Кто-нибудь знает, каковы лучшие практики?
Вы можете начать с статистической обработки естественного языка . Кроме того, вы можете использовать одну или несколько библиотек, упомянутых на странице AI Ruby Plugins .