Извлечь текст из SWF - PullRequest
0 голосов
/ 12 мая 2009

В настоящее время мы используем print2flash (http://print2flash.com)) для преобразования документов, отправленных пользователем (документы Word, RTF, PowerPoint и т. Д.), В документы на основе Flash, которые можно просматривать в Интернете (как документ и документ).

Мы хотели бы проиндексировать текст внутри этих файлов для полнотекстовой индексации. Существуют ли какие-либо инструменты или библиотеки, которые мы можем использовать для этого?

Мы разрабатываем в ASP.NET / C # и пытались работать со сторонними инструментами, такими как SWFTools (http://www.swftools.org), но результаты были противоречивыми и неудовлетворительными.

PS: Мы хотели бы выполнить индексацию после того, как исходный документ был преобразован во флэш-память, потому что это дает нам меньше форматов файлов для работы.

1 Ответ

1 голос
/ 25 августа 2010

Ваша лучшая ставка - сторонняя библиотека для разбора Flash. Флэш имеет очень плотный формат и разбирать его больно. Сказав это, формат хорошо понят. Вы можете найти официальную спецификацию здесь: http://www.adobe.com/devnet/swf/

...