Как получить текст в png файле с помощью Java - PullRequest
2 голосов
/ 20 декабря 2010

Я хочу проверить, присутствует ли конкретная строка на изображении. Это возможно? pngj может это сделать?

Мой файл будет содержать график и некоторые легенды. Я хочу проверить, если легенды верны.

Ответы [ 4 ]

4 голосов
/ 20 декабря 2010

Нет, вы не можете сделать это с pngj. Текст, который виден на изображении PNG, не сохраняется как текст. Вам потребуется программное обеспечение OCR , если вы хотите идентифицировать текст.

Однако было бы намного лучше, если бы вы могли получить данные в другом формате, который легче анализировать на компьютере.

1 голос
/ 20 декабря 2010

Вы можете попробовать Asprise OCR out.Это хороший OCR API, доступный в Java.

1 голос
/ 20 декабря 2010

Да, это возможно.Тем не менее, вы должны найти хорошую библиотеку OCR.И затем, предполагая, что ваша библиотека OCR вернула правильные результаты, вам нужно как-то проверить, правильно ли размещены ваши легенды.

0 голосов
/ 29 июня 2016

Здесь я использую scala, чтобы выдать свое решение.Если вы являетесь Java-разработчиком, вам будет довольно легко преобразовать код Scala в ваш Java-код.

Step1: в build.sbt добавить еще одну строку

libraryDependencies += "com.asprise.ocr" % "java-ocr-api" % "[15,)"

Step2: import library

import com.asprise.ocr.Ocr

Step2: код scala. Обратите внимание: здесь указан тип File .Если у вас есть только fileName / filePath, вам нужно использовать new File () для его преобразования.

try {
      // Image
      Ocr.setUp()
      val ocr = new Ocr
      ocr.startEngine("eng", Ocr.SPEED_FASTEST)
      val files = List(<your_file>)
      val outputString = ocr.recognize(files.toArray, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PLAINTEXT)
      ocr.stopEngine()
      Some(outputString)
} catch {
      case e: Exception => None // todo: to support multiple file types
}

Я также пишу в блоге, чтобы дать более подробную информацию о , как извлечь текст / контент из другого файла (pdf, html, изображение и т. Д.)

Если вы хотите узнать больше об этом java-ocr-api, вы можете прочитать его официальный сайт здесь .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...