Как извлечь указанный c текст из изображения, используя UITextField в Swift? - PullRequest
0 голосов
/ 25 февраля 2020

Я использую платформу Vision и хочу иметь возможность использовать UITextField, чтобы найти конкретное c слово в изображении. Например, допустим, я ввожу слово «черный» в текстовое поле, и я хочу, чтобы оно обнаружило это на изображении, которое я имею. Как бы я это сделал? Я использую Vision Framework, и я выяснил, как обнаружить тексты, но застрял в той части, где я могу обнаружить вводимое пользователем слово в текстовом поле.

        func startTextDetection() {

       let textRequest = VNDetectTextRectanglesRequest(completionHandler: self.detectTextHandler)
       let request = VNRecognizeTextRequest(completionHandler: self.detectTextHandler)

        request.recognitionLevel = .fast
        textRequest.reportCharacterBoxes = true
        self.requests = [textRequest]

    }

    func detectTextHandler(request: VNRequest, error: Error?) {
        guard let observations = request.results else {
            print("no result")
            return
        }

        let result = observations.map({$0 as? VNTextObservation})

        DispatchQueue.main.async() {
            self.previewView.layer.sublayers?.removeSubrange(1...)
            for region in result {
                guard let rg = region else {
                    continue
                }

                self.highlightWord(box: rg)
                if let boxes = region?.characterBoxes {
                    for characterBox in boxes {
                        self.highlightLetters(box: characterBox)
                }
            }
        }
    }
}

     //when user presses search will search for text in pic. 
func textFieldShouldReturn(_ searchTextField: UITextField) -> Bool {
    searchTextField.resignFirstResponder()
    startTextDetection()

    return true
}

1 Ответ

1 голос
/ 25 февраля 2020

Вы должны смотреть последний WWD C на платформе Vision. В основном, начиная с iOS 13, VNRecognizeTextRequest возвращает текст, а также ограничительную рамку текста на изображении. Код может быть примерно таким:

func startTextDetection() {
    let request = VNRecognizeTextRequest(completionHandler: self.detectTextHandler)
    request.recognitionLevel = .fast
    self.requests = [request]
}

private func detectTextHandler(request: VNRequest, error: Error?) {
    guard let observations = request.results as? [VNRecognizedTextObservation] else {
        fatalError("Received invalid observations")
    }
    for lineObservation in observations {
        guard let textLine = lineObservation.topCandidates(1).first else {
            continue
        }

        let words = textLine.string.split{ $0.isWhitespace }.map{ String($0)}
        for word in words {
            if let wordRange = textLine.string.range(of: word) {
                if let rect = try? textLine.boundingBox(for: wordRange)?.boundingBox {
                     // here you can check if word == textField.text
                     // rect is in image coordinate space, normalized with origin in the bottom left corner
                }
            }
        }
   }
}


...