SFSpeechRecognizer 可以识别几个命令词而不是整个短语?

问题描述 投票:0回答:2

我从 Apple 的示例应用程序中设置了 SFSpeechRecognizer https://developer.apple.com/library/content/samplecode/SpeakToMe/Introduction/Intro.html

我想知道是否可以让识别器识别与其他先前识别的单词没有关联的单个单词。

例如,当说出“Scroll”时,识别器现在会尝试形成一个句子,然后找到有意义的单词的最佳转录,因此当说出“Stop”时,它会将其更改为“Down”之类的内容这在前一个词的上下文中更有意义。

但这不是我想要的,因为我希望我的应用程序将单个单词作为在监听时调用函数的命令来监听。

有什么方法可以实现该框架,使其持续监听单词并仅捕获说出的单个单词?

ios swift speech-to-text sfspeechrecognizer
2个回答
6
投票

是的。您可以通过设置

recognitionRequest.shouldReportPartialResults = YES
来扫描部分结果上的传入单词,然后多次调用结果回调。

然后,您可以随时处理结果,在获得最终结果之前扫描关键字/关键短语(即忽略

result.isFinal
)。当您找到您要查找的关键字/关键短语时,只需取消识别即可。

我已经在语音电子邮件中使用这种方法成功实现了语音命令作为修改后的 Cordova 插件(来源此处)。

示例:

- (void) recordAndRecognizeWithLang:(NSString *) lang
{
        NSLocale *locale = [[NSLocale alloc] initWithLocaleIdentifier:lang];
        self.sfSpeechRecognizer = [[SFSpeechRecognizer alloc] initWithLocale:locale];
        if (!self.sfSpeechRecognizer) {
                [self sendErrorWithMessage:@"The language is not supported" andCode:7];
        } else {

                // Cancel the previous task if it's running.
                if ( self.recognitionTask ) {
                        [self.recognitionTask cancel];
                        self.recognitionTask = nil;
                }

                [self initAudioSession];

                self.recognitionRequest = [[SFSpeechAudioBufferRecognitionRequest alloc] init];
                self.recognitionRequest.shouldReportPartialResults = [[self.command argumentAtIndex:1] boolValue];

                self.recognitionTask = [self.sfSpeechRecognizer recognitionTaskWithRequest:self.recognitionRequest resultHandler:^(SFSpeechRecognitionResult *result, NSError *error) {

                        if (error) {
                                NSLog(@"error");
                                [self stopAndRelease];
                                [self sendErrorWithMessage:error.localizedFailureReason andCode:error.code];
                        }

                        if (result) {
                                NSMutableArray * alternatives = [[NSMutableArray alloc] init];
                                int maxAlternatives = [[self.command argumentAtIndex:2] intValue];
                                for ( SFTranscription *transcription in result.transcriptions ) {
                                        if (alternatives.count < maxAlternatives) {
                                                float confMed = 0;
                                                for ( SFTranscriptionSegment *transcriptionSegment in transcription.segments ) {
                                                        NSLog(@"transcriptionSegment.confidence %f", transcriptionSegment.confidence);
                                                        confMed +=transcriptionSegment.confidence;
                                                }
                                                NSMutableDictionary * resultDict = [[NSMutableDictionary alloc]init];
                                                [resultDict setValue:transcription.formattedString forKey:@"transcript"];
                                                [resultDict setValue:[NSNumber numberWithBool:result.isFinal] forKey:@"final"];
                                                [resultDict setValue:[NSNumber numberWithFloat:confMed/transcription.segments.count]forKey:@"confidence"];
                                                [alternatives addObject:resultDict];
                                        }
                                }
                                [self sendResults:@[alternatives]];
                                if ( result.isFinal ) {
                                        [self stopAndRelease];
                                }
                        }
                }];

                AVAudioFormat *recordingFormat = [self.audioEngine.inputNode outputFormatForBus:0];

                [self.audioEngine.inputNode installTapOnBus:0 bufferSize:1024 format:recordingFormat block:^(AVAudioPCMBuffer * _Nonnull buffer, AVAudioTime * _Nonnull when) {
                        [self.recognitionRequest appendAudioPCMBuffer:buffer];
                }],

                [self.audioEngine prepare];
                [self.audioEngine startAndReturnError:nil];
        }
}

0
投票

如果我在录制的同时在同一个应用程序中播放另一个音频,您可以忽略手机扬声器的音频吗?

© www.soinside.com 2019 - 2024. All rights reserved.