Gem Docx очень прост в использовании
require 'docx'
puts Docx::Document.open('test.docx')
или
d = Docx::Document.open('test.docx')
d.each_paragraph do |p|
puts p
end
вы можете найти его на https://github.com/chrahunt/docx и установить на gem install docx
docx, однако, не поддерживает файлы .doc (Word 2007 и более ранние версии), тогда вы можете использовать WIN32OLE следующим образом:
require 'win32ole'
begin
word = WIN32OLE.connect('Word.Application')
doc = word.ActiveDocument
rescue
word = WIN32OLE.new('word.application')
path_open = 'C:\Users\...\test.doc' #yes: backslashes in windows
doc = word.Documents.Open(path_open)
end
word.visible = true
doc.Sentences.each { |x| puts x.text }