Парсинг простого текста из текста RTF в рубине - PullRequest
0 голосов
/ 02 октября 2018

У меня есть текст RTF, как показано ниже,

{\rtf1\ansi\deff0 {\fonttbl {\f0 Courier;}}
{\colortbl;\red0\green0\blue0;\red255\green0\blue0;}
This line is the default color\line
\cf2
\tab This line is red and has a tab before it\line
\cf1
\page This line is the default color and the first line on page 2
}

Я хочу проанализировать простой текст из текста RTF.Есть ли в ruby ​​плагины или какие-либо другие решения для анализа простого текста из текста rtf?

1 Ответ

0 голосов
/ 02 октября 2018

Вы можете использовать это Ruby-rtf Gem

require 'ruby-rtf'

data = File.read('./rich.rtf')
parser = RubyRTF::Parser.new
parsed_text = parser.parse(data).sections.map do |val|
  val[:text]
end.join(' ')
...