通义AI语音小助手

我要开发同款
白天黑夜Q2024年04月28日
164阅读
开发技术深度学习、https、python
授权协议MPL许可

作品详情

语音录制与识别:使用PyAudio库录制用户语音,以WAV格式保存至speech.wav文件。随后通过百度语音识别API(AipSpeech)将语音转为文本,支持多种语言(普通话、英文、粤语、四川话)。用户通过输入数字选择识别语言。

AI对话生成:利用dashscope库调用Qwen Turbo模型,根据用户语音识别结果生成AI助手的文本回复。回复内容通过call_with_messages函数获取,该函数处理Dashscope API响应,确保输出小助手的回答。

语音播报:使用百度语音合成API(baidu_text_to_speech函数)将用户语音识别结果和AI助手的回答分别转化为语音。生成的音频文件以MP3格式存储并使用pygame.mixer播放。播放完毕后,临时音频文件立即被删除。

循环交互:程序以循环方式运行,用户输入y时继续下一轮交互。每轮交互包括用户语音录制、识别、AI对话生成及双端语音播报。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论