непрерывное распознавание речи iOS? - PullRequest
0 голосов
/ 13 февраля 2019

В одном из моих приложений я использую речевую платформу для преобразования голоса пользователя в текст.

По сути, я хочу, чтобы мое приложение было свободным от рук с некоторыми командами. Оно может работать.

Таким образом, существует ограничение Apple, которое имеет только 1000 запросов в час, а SFSpeechRecognitionTask длится всего около 1 минуты.

Я хочу, чтобы SFSpeechRecognitionTask должен был оживить и поддерживать распознавание голоса.Итак, как лучше всего сделать код?Не слишком ли большой заряд батареи? Если я буду перезагружать SFSpeechRecognitionTask каждые 1 минуту?

Я сделал код, подобный приведенному ниже, чтобы начать обнаруживать голос, и он остановится через 1 минуту.

Пожалуйста, помогите мне, если будет способ достичь этого.

func startRecording() {

        if recognitionTask != nil {
            recognitionTask?.cancel()
            recognitionTask = nil
        }

        let audioSession = AVAudioSession.sharedInstance()
        do {
            try audioSession.setCategory(AVAudioSessionCategoryRecord)
            try audioSession.setMode(AVAudioSessionModeMeasurement)
            try audioSession.setActive(true, with: .notifyOthersOnDeactivation)
        } catch {
            print("audioSession properties weren't set because of an error.")
        }

        recognitionRequest = SFSpeechAudioBufferRecognitionRequest()

        guard let inputNode = audioEngine.inputNode else {
            fatalError("Audio engine has no input node")
        }

        guard let recognitionRequest = recognitionRequest else {
            fatalError("Unable to create an SFSpeechAudioBufferRecognitionRequest object")
        }

        recognitionRequest.shouldReportPartialResults = true

        recognitionTask = speechRecognizer?.recognitionTask(with: recognitionRequest, resultHandler: { (result, error) in

            var isFinal = false

            if result != nil {

                if self.speechTimer != nil
                {
                    if (self.speechTimer?.isValid)!
                    {
                        self.speechTimer?.invalidate()
                    }
                    self.speechTimer = nil;
                }
                print(result?.bestTranscription.formattedString as Any)

                self.speechTimer = Timer.scheduledTimer(withTimeInterval: 2.0, repeats: false, block: { (timer) in
                    print("Recognition task restart")
                })

                isFinal = (result?.isFinal)!
                if isFinal {
                    print("Final String: \(result?.bestTranscription.formattedString ?? "No string")")
                }
            }
        })

        let recordingFormat = inputNode.outputFormat(forBus: 0)
        inputNode.installTap(onBus: 0, bufferSize: 1024, format: recordingFormat) { (buffer, when) in
            self.recognitionRequest?.append(buffer)
        }

        audioEngine.prepare()

        do {
            try audioEngine.start()
        } catch {
            print("audioEngine couldn't start because of an error.")
        }
    }
...