1.语音助手提供给使用者语音识别和语音合成的服务。语言识别方面,采用了基于CNN+CTC的声学模型与基于N-gram的语音模型的组合,能够接收用户的输入的音频文件,生成语言识别结果;语言合成方面,采用了GPT-SoVITS模型,能够接受用户的文本输入以及音色选择,生成对应的音频文件。2.前端使用vue来编写,后端使用flask来进行连接。
评论