我创建了一个程序,使用谷歌语音识别来收听我们的声音,然后执行为该短语编写的程序。 这是部分代码:
import speech_recognition as sr
import os
def takeCommand():
#It takes microphone input from the user and returns string output
r = sr.Recognizer()
with sr.Microphone() as source:
print("Listening...")
r.pause_threshold = 1
audio = r.listen(source)
try:
print("Recognizing...")
query = r.recognize_google(audio, language='en-in')
print("User said: ",query)
except Exception as e:
# print(e)
print("Say that again please...")
os.startfile('JARVIS.py')
os._exit()
return "None"
return query
if __name__ == "__main__":
while True:
query = takeCommand().lower()
command_history()
# Logic for executing tasks based on query
if 'chrome' in query:
os.startfile("C:/............./chrome.exe")
elif 'photoshop' in query:
os.startfile("C:/............../photoshop.exe")
它工作正常,但如果我想从语音中识别多个命令怎么办? 例如,如果我说,“打开 chrome 和 photoshop”,那么它只会打开 chrome,因为它排在前面,然后程序就会结束。 但是我想从语音中提取每一个命令,那么,怎么做呢?
任何帮助都会被认为是很好的,对不起我的英语不好
您的程序以 chrome 结束,因为您正在使用 if-elif。尝试如果...如果
你实际上不能只用一堆
if-elif-else
语句来制作这样的人工智能。对于您想要完成的任务,您应该选择自然语言处理之类的东西。像 spacy
这样的 Python 模块,你能帮忙吗?首先,您应该提取用户所说的内容(您做得很好),然后将其提供给自然语言处理算法,该算法可以为您提供语音的intent,然后您应该继续执行。
实际上,我一直在开发解决这个问题的方法:CommandsGPT。 我将一条指令作为输入(例如,“阅读我的剪贴板,写一篇关于其中内容的科学文章。如果我喜欢,将其保存为一个名称与文章相关的文件。”,并生成一个图表将要执行的命令(您可以使用自然语言定义自己的命令并对功能进行编码!)。使用起来非常简单直观。
您可以通过
pip install commandsgpt
安装它
这是我的回购协议:https://github.com/AlexisAndradeDev/CommandsGPT