Ecoute 实时转录工具开源项目

我要开发同款
匿名用户2023年05月24日
21阅读
开发技术Python
所属分类程序开发、常用工具包
授权协议MIT

作品详情

Ecoute是一种实时转录工具,可在文本框中为用户的麦克风输入(You)和用户的扬声器输出(Speaker)提供实时转录。它还使用OpenAI的GPT-3.5生成建议的响应,供用户根据对话的实时转录说出。

Ecoute旨在通过提供实时转录和生成上下文相关的响应来帮助用户进行对话。通过利用OpenAI的GPT-3.5的强大功能,Ecoute旨在使通信更加高效和愉快。

要求:

Python3.x一个OpenAIAPIkeyWindowsOS(未在其他操作系统上测试)FFmpeg虽然Ecoute提供实时转录和响应建议,但其功能还存在几个已知限制:

默认麦克风和扬声器: Ecoute当前配置为仅收听系统中设置的默认麦克风和扬声器。它不会检测来自其他设备或系统的声音。如果你想使用不同的麦克风或扬声器,需要在系统设置中将其设置为默认设备。Whisper模型:使用WhisperASR模型的“tiny”版本,因为它的资源消耗低且响应时间快。但是,此模型在转录某些类型的语音(包括口音或不常用词)时可能不如较大的模型准确。语言:Ecoute中使用的Whisper模型设置为英语。因此,它可能无法准确转录非英语语言或方言。项目团队正在积极努力为程序的未来版本添加多语言支持。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论