Я не могу распознать корейский язык с помощью демонстрации Google Speech-to-Text go SDK, но китайский в порядке - PullRequest
0 голосов
/ 18 апреля 2019

Я использую пример Go [live caption_from_file] из лучшего примера для определения частоты голоса местного корейца.Я установил «Код языка» на «ko-KR» и не могу распознать код, возвращающий io.EOF в stream.Recv (), без каких-либо возвратов содержимого или сообщений об ошибках.Но если я использую локальное китайское аудио wav и задаю код языка «cmn-Hans-CN», не будет проблем с возвратом правильного распознанного текста.В чем проблема и как ее исправить?

, если len (flag.Args ()) <1 {log.Fatal («Пожалуйста, передайте путь к вашему локальному аудиофайлу в качестве аргумента командной строки»)} audioFile: = flag.Arg (0) langEn: = flag.Arg (1) </p>

    ctx := context.Background()

    client, err := speech.NewClient(ctx)
    if err != nil {
            log.Fatal(err)
    }
    stream, err := client.StreamingRecognize(ctx)
    if err != nil {
            log.Fatal(err)
    }
    // Send the initial configuration message.
    if err := stream.Send(&speechpb.StreamingRecognizeRequest{
            StreamingRequest: &speechpb.StreamingRecognizeRequest_StreamingConfig{
                    StreamingConfig: &speechpb.StreamingRecognitionConfig{
                            Config: &speechpb.RecognitionConfig{
                                    Encoding:        speechpb.RecognitionConfig_LINEAR16,
                                    SampleRateHertz: 16000,
                                    LanguageCode:    langEn,
                            },
                    },
            },
    }); err != nil {
            log.Fatal(err)
    }

    f, err := os.Open(audioFile)
    if err != nil {
            log.Fatal(err)
    }
    defer f.Close()

    go func() {
            buf := make([]byte, 1024)
            for {
                    n, err := f.Read(buf)
                    if n > 0 {
                            if err := stream.Send(&speechpb.StreamingRecognizeRequest{
                                    StreamingRequest: &speechpb.StreamingRecognizeRequest_AudioContent{
                                            AudioContent: buf[:n],
                                    },
                            }); err != nil {
                                    log.Printf("Could not send audio: %v", err)
                            }
                    }
                    if err == io.EOF {
                            // Nothing else to pipe, close the stream.
                            if err := stream.CloseSend(); err != nil {
                                    log.Fatalf("Could not close stream: %v", err)
                            }
                            return
                    }
                    if err != nil {
                            log.Printf("Could not read from %s: %v", audioFile, err)
                            continue
                    }
            }
    }()

    for {
            resp, err := stream.Recv()
            //if err == io.EOF {
            //      break
            //}
            if err != nil {
                    log.Fatalf("Cannot stream results: %v", err)
            }
            if err := resp.Error; err != nil {
                    log.Fatalf("Could not recognize: %v", err)
            }
            for _, result := range resp.Results {
                    fmt.Printf("Result: %+v\n", result)
                    for _, alt := range result.Alternatives {
                            fmt.Printf("\"%v\" (confidence=%3f)\n",  alt.Transcript, alt.Confidence)

                  }
        }
    }
...