Voice - 语音识别与发送语音
Z、微信机器人(最近封杀厉害,暂停使用) / ※ 微信机器人开源项目说明 / ※ Chatgpt-On-Wechat相关说明 / ※ COW插件篇
因cow是基于itchat的web协议制作,发送语音是.mp3文件,而非语音条
1、音频处理工具 - ffmpeg
点击地址,进行安装
2、讯飞APIkey申请
对比来对比去,觉得讯飞的最合适。
免费一年,而且量很大,足够用。
在讯飞上申请一个API Key。
https://www.xfyun.cn/services/rtasr
进入控制台
创建应用
这里这3个就是要用到的Key。
3、配置Cow
打开根目录的config.json,这里是总开关,复制时请移除所有汉字。
# config.json文件内容示例
{
"model": "gpt-3.5-turbo", # 模型名称, 支持 gpt-3.5-turbo, gpt-4, gpt-4-turbo, wenxin, xunfei, glm-4, claude-3-haiku, moonshot
"open_ai_api_key": "YOUR API KEY", # 如果使用openAI模型则填入上面创建的 OpenAI API KEY
"proxy": "", # 代理客户端的ip和端口,国内环境开启代理的需要填写该项,如 "127.0.0.1:7890"
"single_chat_prefix": ["bot", "@bot"], # 私聊时文本需要包含该前缀才能触发机器人回复
"single_chat_reply_prefix": "[bot] ", # 私聊时自动回复的前缀,用于区分真人
"group_chat_prefix": ["@bot"], # 群聊时包含该前缀则会触发机器人回复
"group_name_white_list": ["ChatGPT测试群", "ChatGPT测试群2"], # 开启自动回复的群名称列表
"group_chat_in_one_session": ["ChatGPT测试群"], # 支持会话上下文共享的群名称
"image_create_prefix": ["画", "看", "找"], # 开启图片回复的前缀
"conversation_max_tokens": 1000, # 支持上下文记忆的最多字符数
"voice_to_text": "xunfei", # 语音转文字模型
"text_to_voice": "xunfei", # 文字转语音模型
"speech_recognition": false, # 是否开启语音识别
"group_speech_recognition": false, # 是否开启群组语音识别
"voice_reply_voice": false, # 是否使用语音回复语音
"character_desc": "你是基于大语言模型的AI智能助手,旨在回答并解决人们的任何问题,并且可以使用多种语言与人交流。", # 人格描述
# 订阅消息,公众号和企业微信channel中请填写,当被订阅时会自动回复,可使用特殊占位符。目前支持的占位符有{trigger_prefix},在程序中它会自动替换成bot的触发词。
"subscribe_msg": "感谢您的关注!\n这里是ChatGPT,可以自由对话。\n支持语音对话。\n支持图片输出,画字开头的消息将按要求创作图片。\n支持角色扮演和文字冒险等丰富插件。\n输入{trigger_prefix}#help 查看详细指令。",
"use_linkai": false, # 是否使用LinkAI接口,默认关闭,开启后可国内访问,使用知识库和MJ
"linkai_api_key": "", # LinkAI Api Key
"linkai_app_code": "" # LinkAI 应用或工作流code
}
按需配置,开启是true,关闭是false
因发送语音不能是语音条,所以我只开了语音识别。
配置讯飞的key,进入/chatgpt-on-wechat/voice/xunfei下的config.json,把对应的key配置进来即可。
配置完成,重新扫码登录。