Minimax的AI对话机器人问答产品海螺问问上线了,产品的语音对话能力、模型能力以及体验打磨都非常的不错。

Minimax的AI对话机器人问答产品海螺问问上线了,产品的语音对话能力、模型能力以及体验打磨都非常的不错。 体验好的一方面是海螺问问有非常自然的语音模型接入,支持语音回答问题。 还支持跟软件进行类似 ChatGPT 的实时的 AI 语音对话,但是没有 ChatGPT 那股外国腔,比如视频第一段的演示。 语音能力的另外一个杀手锏是,可以在海螺问问里面训练自己的语音模型,而且这个过程非常简单,只需要阅读屏幕上显示的一段话就可以。比如20 秒以后的视频配音就是我自己的模型。 然后就是模型能力,海螺问问接入的是 Minimax 的 Moe 模型,所以在很多特殊任务的处理上会比同规模的其他不是 Moe架构的模型要强很多。 它也支持图像的多模态识别,比如我这里在出租车的时候拍了一张照片让它识别内容,它识别出了座位下面的报纸和前面的车座,同时还进行了一定的推理,判断出这个车可能是用来拉人的不是自用的。 最后是海螺问问的整个UI细节和交互逻辑都是经过精细打磨过的,比如输入框为了支持长内容输入是可以展开的,而且支持按住Command 加上回车换行,从Web到移动端非常一致且有温度的UI界面样式。 另外海螺问问现在也是免费的,尤其是语音能力的加持让他的使用场景变得更多了,如果你不方便使用或者嫌 ChatGPT 慢的话,可以试试跟海螺问问聊聊。 这里使用:

相关推荐

封面图片

软件海螺问问功能:AI助手

软件海螺问问 软件功能:AI助手 支持平台:#iOS #Android #Web 软件简介:一款AI聊天工具。训练好的功能有小说写作、内容续写、模拟面试、朋友圈文案、编程小助手、翻译为英文等。 国内生成式AI层出不穷,而且基本上都是免费的。不愿意花钱充值ChatGPT的可以使用国内的这些AI助手。 软件下载:点击下载 频道 群聊 投稿

封面图片

ChatGPT新功能上线,包含图片对话与语音对话

ChatGPT新功能上线,包含图片对话与语音对话 ① 图片对话:支持上传图片并对图片内容进行对话,不支持对图片中的人物进行分析对话。官方说可以拍照发送并解决数学问题,未去测试,学生们可以去试试。 ② 语音对话:支持语音发送信息,ChatGPT也会通过语音进行回复,回复的语音非常像真人。用来练习外语口语再好不过了。

封面图片

中国发布首个支持30种方言混说语音大模型

中国发布首个支持30种方言混说语音大模型 中国运营商发布首个支持30种方言混说语音大模型。 综合中新社和《证券时报》报道,中国电信人工智能研究星期六(5月25日)在第七届数字中国建设峰会上,发布业内首个支持30种方言自由混说的语音识别大模型星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境。 该大模型可识别理解粤语、上海话、四川话、温州话等30多种方言,是中国支持最多方言的语音识别大模型。 星辰语音大模型也是业内首个开源的基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率降低数十倍。 目前,星辰语音大模型已在福建、江西、广西、北京、内蒙等地的中国电信万号智能客服试点应用。接入星辰大模型以后,智能客服秒懂30种方言,实现日均处理约200万通电话。 2024年5月26日 10:01 PM

封面图片

#AI 国产 AI 大模型都集中在这段时间完成了备案,可以看到很多「全面开放」「正式上线」的消息。

#AI 国产 AI 大模型都集中在这段时间完成了备案,可以看到很多「全面开放」「正式上线」的消息。 不过整个体验下来,还是讯飞的星火大模型最能打,连一些用来识别 ChatGPT 4 的问题也能回答的很到位。 支持图片对话,识别能力很不错,也支持一些插件,比如文档问答、PPT 生成、简历生成等,在助手中心,还收录了海量的提示词模版,相当实用。 目前免费无限制,注册即可使用,感兴趣的小伙伴可以去体验一下。 https://xinghuo.xfyun.cn 频道 @WidgetChannel

封面图片

:通过具有自托管 Whisper 模型的 WebSocket 进行近实时语音转录

:通过具有自托管 Whisper 模型的 WebSocket 进行近实时语音转录 VoiceStreamAI 是一种基于 Python 3 的服务器和 JavaScript 客户端解决方案,可使用 WebSocket 实现近实时音频流和转录。该系统采用 Huggingface 的语音活动检测 (VAD) 和 OpenAI 的 Whisper 模型来实现准确的语音识别和处理。 特征 通过 WebSocket 进行实时音频流。 使用 Huggingface 的 VAD 进行语音活动检测。 使用 OpenAI 的 Whisper 模型进行语音转录。 可定制的音频块处理。 支持多语言转录。

封面图片

一款基于MiniMax公司自研的万亿参数MoE大模型打造的AI智能助手,作为你的智能伙伴,海螺可以帮助你进行智能搜索、文件速读、

一款基于MiniMax公司自研的万亿参数MoE大模型打造的AI智能助手,作为你的智能伙伴,海螺可以帮助你进行智能搜索、文件速读、语音通话、文案创作、拍照答疑等多项任务,它还支持声音克隆,AI视频生成以及AI音乐生成等功能,旨在成为用户日常工作和生活中不可或缺的好帮手. #AI #海螺

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人