OCR lib для математических формул - PullRequest
41 голосов
/ 26 августа 2010

Мне нужна открытая библиотека OCR, которая может сканировать сложные печатные математические формулы (например, некоторые формулы, которые были сгенерированы с помощью LaTeX). Я хочу получить некоторые LaTeX-подобные данные (или просто некоторые AST-подобные данные).

Уже есть что-то подобное? Или современная техника распознавания текста способна анализировать текст, ориентированный на строки?

(Обратите внимание, что я также разместил этот вопрос на Metaoptimize , потому что некоторые люди там могут иметь дополнительные знания.)

Эта проблема была также описана OpenAI как im2latex .

Ответы [ 9 ]

16 голосов
/ 01 мая 2015

SESHAT - это система с открытым исходным кодом, написанная на C ++ для распознавания рукописных математических выражений.SESHAT был разработан в рамках докторской диссертации в исследовательском центре PRHLT в Политехническом университете Валенсии.

Онлайн-демонстрация: http://cat.prhlt.upv.es/mer/

Источник: https://github.com/falvaro/seshat

Seshat - это система с открытым исходным кодом для распознавания рукописных математических выражений.Учитывая образец, представленный в виде последовательности штрихов, анализатор может преобразовать его в LaTeX или другие форматы, такие как InkML или MathML.

6 голосов
/ 20 апреля 2011

InftyReader - единственный, о котором я знаю. Это НЕ свободное программное обеспечение (кажется, деньги идут в некоммерческую организацию, IIRC).

http://www.sciaccess.net/en/InftyReader/

Я не знаю, почему PDF не может содержать метаданные в LaTeX? Как в: вставьте в него уравнение LaTeX! Это так сложно? (Я ничего не знаю о синтаксисе PDF, но думаю, что это возможно).

Синтаксис LaTeX - ОДИН ИСПЫТАННЫЙ И ИСТИННЫЙ СТАНДАРТ для математической нотации. Кажется удивительно глупым, что люди, которые производили MathML и другие вещи, не принимают это во внимание. InftyReader генерирует синтаксис MathML или LaTeX.

Если я хочу HTML (чистый), я использую TTH для чтения синтаксиса LaTeX. Просто работает.

ABBYY FineReader (отличная программа для распознавания текста) утверждает, что вы можете обучать программное обеспечение для математики, но это невероятно умственно (у кого есть время?)

А в Юникоде много математических символов. То, что сегодняшние читатели OCR не могут их обмануть, показывает плачевное состояние программного обеспечения и дефицит мозга в этой деятельности.

Что касается «одного символа за раз», у TeX, очевидно, есть правила относительно того, где он будет размещать символы. Они не могут писать программы, которые знают эти правила ?! TeX даже общественное достояние! Они могут просто «использовать это» в своих коммерческих продуктах.

5 голосов
/ 29 августа 2013

Проверьте " Web Equation ."Он может конвертировать рукописные уравнения в LaTeX, MathML или SymbolTree.Я не уверен, что движок с открытым исходным кодом.

5 голосов
/ 29 августа 2010

Согласно ответам на Metaoptimize и обсуждению в списке рассылки Tesseract , похоже, еще нет открытого / бесплатного решения, которое могло бы это сделать.

Единственное решение, которое, по-видимому, способно это сделать (но я не могу проверить, поскольку оно только для Windows и не является бесплатным), это, как упоминали некоторые другие люди, InftyProject .

2 голосов
/ 27 августа 2010

Infty работает довольно хорошо.Моя бывшая компания интегрировала его в приложение, которое вслух считывает уравнения для слепых и получает хорошие отзывы от пользователей.

http://www.inftyproject.org/en/download.html

2 голосов
/ 26 августа 2010

Учитывая, что современные технологии читают по одному символу за раз (см. http://detexify.kirelabs.org/classify.html), Я сомневаюсь, что для полных математических уравнений есть OCR.

1 голос
/ 13 декабря 2016

Поскольку выходные данные математического распознавания текста для сложных формул, вероятно, будут содержать ошибки - даже у людей с этим проблемы - вам придется корректировать результаты, по крайней мере, если они имеют значение.Затем (человеческий) корректор должен будет исправить результаты, а это значит, что вам нужен редактор математических формул.Учитывая усилия, которые требуются людям, возможно, ограниченный набор сложных формул, вам может быть легче назначить задачу людям.

В качестве исследовательской задачи читать математику с помощью OCR весело - вам нужен формализмдля двумерных грамматик плюс распознаватель символов.
В дополнение к ссылкам, уже упомянутым здесь, почему бы не Google для этого?Есть работа, которая была сделана в Калтехе, Рочестере, У. Ватерлоо и Калифорнийском университете в Беркли.Сколько из этого готово использовать из коробки?Незнайка.

0 голосов
/ 25 ноября 2012

есть отличное короткое видео: http://www.youtube.com/watch?v=LAJm3J36tLQ объяснение того, как вы можете научить вашего Fine Reader распознавать математические формулы. Если вы уже используете Fine Reader, лучше придерживаться одного инструмента. Конечно, это не бесплатная посуда: (

0 голосов
/ 29 августа 2010

Вы знаете, в Win7 есть приложение только для этого: Панель ввода математики . Это даже обрабатывает рукописный ввод (это фактически сделано для этого). Попробуйте, если у вас Win7, это бесплатно!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...