飞书 ×(GPT-3.5 + DALL·E + Whisper)= 飞一般的工作体验 语音对话、角色扮演、多话题讨论、图片创作

飞书 ×(GPT-3.5 + DALL·E + Whisper)= 飞一般的工作体验 语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出 | 项目特点 基于 OpenAI-gpt-3.5-turbo 接口 通过 lark,将 ChatGPT 接入飞书 支持Serverless 云函数、本地环境、Docker、二进制安装包多种渠道部署 基于goCache内存键值对缓存 机器人功能 语音交流:私人直接与机器人畅所欲言 多话题对话:支持私人和群聊多话题讨论,高效连贯 文本成图:支持文本成图和以图搜图 角色扮演:支持场景模式,增添讨论乐趣和创意 上下文保留:回复对话框即可继续同一话题讨论 ⏰ 自动结束:超时自动结束对话,支持清除讨论历史 富文本卡片:支持富文本卡片回复,信息更丰富多彩 交互式反馈:即时获取机器人处理结果 场景预设:内置丰富场景预设,方便用户管理场景 历史回档:轻松回档历史对话,继续话题讨论 管理员模式:内置管理员模式,使用更安全可靠 多token负载均衡:优化生产级别的高频调用场景 ↩ 支持反向代理:为不同地区的用户提供更快、更稳定的访问体验 与飞书文档互动:成为企业员工的超级助手 话题内容秒转PPT:让你的汇报从此变得更加简单 表格分析:轻松导入飞书表格,提升数据分析效率

相关推荐

封面图片

:GPT-4 + Pinecone + LangChain + MongoDB实现的文档聊天机器人,可多文件、多话题和多窗口

:GPT-4 + Pinecone + LangChain + MongoDB实现的文档聊天机器人,可多文件、多话题和多窗口聊天,聊天历史由MongoDB保存 特点: 创建多个话题来聊天 Google OAuth 登录并在与您的电子邮件关联的 MongoDB 中存储聊天记录 将任意数量的文件上传到每个主题 为每个主题创建任意数量的聊天(聊天窗口) 上传文件,将它们转换为嵌入,将嵌入存储在命名空间中并上传到 Pinecone,并从浏览器中删除 Pinecone 命名空间 使用 MongoDB上传并自动检索所有聊天记录 支持.pdf,.docx和.txt

封面图片

谷歌新Bard逆袭GPT-4冲上LLM排行榜第二 Jeff Dean高呼我们回来了

谷歌新Bard逆袭GPT-4冲上LLM排行榜第二 Jeff Dean高呼我们回来了 基于此,Bard相较于3月份的首次亮相,不仅在表现上有了显著的提升,而且还具备了更多的能力。可以看到,在最新的Gemini Pro-scale加持下,Bard直接蹿升到了排行榜第二名的位置。一口气把之前的两款GPT-4模型斩于马下,甚至和排名第一的GPT-4 Turbo的差距也非常小。虽然Jeff Dean并没有具体阐述“scale”的含义,但从名称上推测,很可能是一个比初代Gemini Pro规模更大的版本。而根据前段时间外媒曝出的内部邮件,搭载Gemini Ultra的Bard Advanced已经全面开放给Google员工试用。也就是说,距离Google最强模型的上线,已经不远了。随着Google对Gemini Pro更新后不断大幅上涨的表现,也让所有人对完全体Gemini Ultra的能力有了更多的期待。不过,新推出的Bard目前只接受了约3,000次评价,而GPT-4的评价次数已高达30,000次。因此,这个结果后续很可能还会发生变动。但不管怎样,这对于Google来说是一项令人瞩目的成就,也让人对即将发布的、预期将超过Gemini Pro-Scale性能的最强AI模型Gemini Ultra充满期待。GoogleBard超越GPT-4跃居第二简单介绍一下,这个由UC伯克利主导,CMU,UCSD等顶级高校共同参与创建的聊天机器人竞技场“Chatbot Arena”,是学术圈内一个很权威的大模型对话能力排行榜。榜单通过类似Moba游戏中的“排位赛”机制,让各家大模型通过PvP的方式来排出性能高低。期间,用户会与模型(不知道具体型号)进行互动,并选择他们更喜欢的回答。而这些投票将会决定模型在排行榜上的名次。这种方式能够有效地避免很多PvE基准测试中可能出现的,通过“刷题”来提高成绩的问题,被业界认为是一个比较客观的大模型能力排行榜。为了便于区分,LMSYS Org指出,目前Gemini Pro市面上总共有3个版本:- Gemini Pro API:用户可以通过Google云的Vertex AI API进行访问- Gemini Pro(dev)API:开发者API可以通过Google AI Studio进行访问- Bard(1月4日更新的Gemini Pro):是目前唯一可以访问到1月24日更新的Gemini Pro的方式同时,GoogleBard项目的高级总监Sadovsky也透露,排行榜上的Bard和Gemini Pro(API)是两个在微调层面不同的模型,而且Bard可以检索互联网上的信息。在ChatBot Arena中,1月24号更新的Bard由于支持检索互联网,相比于之前放出的Gemini Pro(API)对于实时信息问题的回复提升巨大。从Google的这波更新可以看出,Gemini Pro的潜力似乎远远没有被完全释放,希望Google能再接再厉,对OpenAI一家独大的格局形成挑战。以下是1月14号更新的Bard在ChatBot Arena中的成绩的明细:模型A相对于模型B在所有非平局对决中获胜的比例不同模型组合间对决的次数统计(排除平局情况)通过1000轮随机抽样对Elo评分进行的自举法(Bootstrap)估计在假设等概率抽样和不存在平局的情况下,相对于所有其他模型的平均胜率Elo评分系统Elo等级分制度(Elo rating system)是一种计算玩家相对技能水平的方法,广泛应用在竞技游戏和各类运动当中。其中,Elo评分越高,那么就说明这个玩家越厉害。比如英雄联盟、Dota 2以及吃鸡等等,系统给玩家进行排名的就是这个机制。举个例子,当你在英雄联盟里面打了很多场排位赛后,就会出现一个隐藏分。这个隐藏分不仅决定了你的段位,也决定了你打排位时碰到的对手基本也是类似水平的。而且,这个Elo评分的数值是绝对的。也就是说,当未来加入新的聊天机器人时,我们依然可以直接通过Elo的评分来判断哪个聊天机器人更厉害。具体来说,如果玩家A的评分为Ra,玩家B的评分为Rb,玩家A获胜概率的精确公式(使用以10为底的logistic曲线)为:然后,玩家的评分会在每场对战后线性更新。假设玩家A(评分为Ra)预计获得Ea分,但实际获得Sa分。更新该玩家评分的公式为:网友热议对此,网友提问:现在能够访问的Bard就是这个排名第二的Bard了吗?Google官方回复,是的,而且现在访问的Bard比排行榜的上的Bard还能支持更多的像地图扩展等应用。不过还是有网友吐槽,即使在PvP排行榜上Bard已经取得了很好的成绩,但是对于理解用户需求和解决实际问题的能力,Bard和GPT-4依然还有很大差距。也有网友认为,用能联网的Bard和离线的GPT-4打有失公平。甚至,就这样还没打过……而最有意思的,还要数网友在排行榜中发现的“华点”了:号称是GPT-4最大竞品的Claude居然越更新越弱了。对此,之前有分析认为,Anthropic一直在大力发展的与人类对齐,会严重影响模型的性能。GPT-4 Turbo超长上下文A/B测试有趣的是,这个连Jeff Dean都亲自下场的“刷榜”,正巧就在OpenAI连发5款新模型的第二天。根据OpenAI的介绍,新版GPT-4 Turbogpt-4-0125-preview,不仅大幅改善了模型“偷懒”的情况,而且还极大地提升了代码生成的能力。不过,正如大家对Bard的怀疑,GPT-4这次到底有没有变强也有待验证。对此,AI公司Smol的创始人Shawn Wang,就在超过100k单词的超长上下文中,对比测试了新旧GPT4-Turbo的总结能力。Wang表示,两次测试使用的是完全相同提示词,以及基本相同的语料库。虽然没有严格严格,但每个模型都进行了超过300次的API调用,因此对于总结任务而言,这一结果还是具有一定参考价值的。结果显示,2024年1月的GPT4-Turbo花费了19分钟来生成20,265个单词,相比之下,2023年11月的用16分钟生成了18,884个单词。也就是说,新模型的生成速度大约慢了 18%,且生成文本的长度平均偏长约7%。质量方面:- 2024年1月的模型在主题选择上略有改善,但仍存在问题- 2023年11月的模型会产生更多错误信息- 2024年1月的模型在总结中添加小标题的能力略有提升- 2024年1月的模型出现了一次严重的格式错误,而这在之前是极为罕见的- 2023年11月的模型文本详情更加丰富总体而言,新版GPT4-Turbo在总结这一应用场景上有所退步。左侧:2023年11月;右侧:2024年1月(左右滑动查看全部)OpenAI最后的“开源遗作”两周年不得不说,AI领域的发展过于迅猛,甚至让人对时间的流速都产生了错觉。今天,英伟达高级科学家Jim Fan发推纪念了InstructGPT发布二周年。在这里,OpenAI定义了一套标准流程:预训练 -> 监督式微调 -> RLHF。直到今天,这依然是大家遵循的基本策略(尽管有些许变化,比如DPO)。它不仅仅是大语言模型从学术探索(GPT-3)到转化为具有实际影响力的产品(ChatGPT)的关键转折点,而且也是最后一篇OpenAI详细说明他们如何训练前沿模型的论文。论文地址: InstructGPT在2022年的NeurIPS会议上首次亮相,但它并不是RLHF的发明者。实际上,相关博客将读者引向了OpenAI团队在2017年完成的原始RLHF研究。这项研究最初的目的是解决模拟机器人领域中难以明确定义的任务通过一名人类标注者提供的900个二选一偏好,RLHF让一个简单的“跳跃”机器人在模拟环境中学会了后空翻。论文地址: 模型提供了三种规模:1.3B、6B、175B。与旧的、需要复杂提示设计的GPT-3-175B相比,标注者明显更喜欢Instruct-1.3B。微软最知名的“小模型”Phi-1也是1.3B。- InstructGPT展示了如何精彩地呈现研究成果。三个步骤的图表清晰易懂,并且成为AI领域最标志性的图像之一。引言部分直接了当,用粗体突出了8个核心观点。对局限性和偏见的讨论实事求是、坦诚直接。 ... PC版: 手机版:

封面图片

Gemini Ultra每月19.9刀,前两月免费 网友实测:GPT-4不香了

Gemini Ultra每月19.9刀,前两月免费 网友实测:GPT-4不香了 新服务订阅价格为每月19.99美金 ,和ChatGPT Plus、Perplexity Pro等主流生成式AI应用每月20美金的价格差不多。不过为了显示诚意,Google会提供前两个月免费试用。Google最高阶多模态大模型,Gemini Ultra新时代开启据Google CEO 桑达尔·皮查伊称,Ultra 1.0是首个在 MMLU(大规模多任务语言理解)上超越人类专家的模型,使用了包括数学、物理、历史、法律、医学和伦理学在内的57个学科组合来测试知识和解决问题的能力。因此,Gemini Advanced在编码、逻辑推理、遵循微妙指令和协作创意项目等高度复杂的任务上将更加强大。不仅可以与用户进行更长、更详细的对话,还能更好地理解提示上下文。比如:Gemini Advanced可以成为个人导师,为你创建逐步说明、个性化测验或根据学习风格量身定制回答;解决更复杂的编码场景,并协助评估不同的编程思路;成为数字创作者的创意伙伴,生成新鲜内容,分析最新趋势,制定商业计划书。值得一提的是,Gemini Ultra内由Imagen 2生成的所有图像都应用了数字水印(虽然你看不到它)。随着新功能不断添加,用户将体验到更强的多模态能力、更多交互式编程功能以及更深入的数据分析。目前Gemini Advanced仅支持英语,可以在超过150个国家和地区使用,将逐步扩展到更多语言。Android和IOS手机端登场,Gmail、文档、表格可使用Gemini Advanced作为全新Google One AI高级计划的一部分,还会给用户提供2TB存储空间。此外,AI高级订阅者很快就能够在Gmail、Docs、Slides、Sheets等之前被集合为Duet AI的应用中指调用Gemini Ultra。为了实现手机端轻松访问,Google此次推出全新Gemini应用程序。你可以拍摄一张车胎的照片请求说明,为晚宴邀请函生成自定义图像,或者要求撰写一条复杂短信。Google称之为“构建真正的AI助手的重要第一步,一个具有对话性、多模态的新型实用助理。”Android手机用户可以下载Gemini应用程序,或按照平时激活Google助手的方式比如直接说“嘿,Google”来将它唤醒。Gemini 能为你刚拍摄的照片生成描述,回答阅读中文章的相关问题。许多Google助手的语音功能也将通过Gemini App可用,包括设置定时器、打电话和控制智能家居设备等。虽然iOS应用还在路上,但Google表示在接下来的几周里即会上架App Store。将Gemini 能力扩展至更多产品Gemini也将全面应用于个人和企业每天使用的产品,包括 Workspace 和Google云服务。Workspace:皮查伊表示,目前已经有超过100万人正在使用像 “Help me write ”这样的功能,通过 Duet AI 提高生产力和创造力。从今天起,Duet AI 将改为 Gemini for Workspace,并且很快, Google One AI 高级计划订阅者就能在 Gmail、Docs、Sheets、Slides 和 Meet 等Google办公全套件中使用 Gemini Ultra。Google云:对于云客户来说,Gemini 将帮助提高企业生产力,协助开发人员更高效编写代码,并保护组织免受网络攻击。开发者一直是每一次重大技术变革的基础,在 Gemini 生态系统中也扮演着同样重要的角色。现在已经有数十万技术人员和企业正在使用 Gemini 大模型进行开发。Google将在下周分享更多关于开发者和云客户未来权益的详细信息。皮查伊还透露,Google已经在积极训练下一代 Gemini 模型了。网友迫不及待,Gemini Ultra新鲜开测去年12月6日Google发布Gemini Pro时,对标的是GPT-3.5。由于取消了原定的线下亮相,Gemini系列被媒体渲染得阴影重重。于是没隔几天,中杯大杯忽然集体登场,还以一个震慑三观的“鸭子”视频demo引发热烈讨论和网络打假。当时Google曾预告说在32项LLM广泛使用的基准测试中,Gemini Ultra有30项都超越了 ChatGPT代表的业界最先进水平。究竟Ultra版本实力如何,现在终于可以上手一探究竟了。用写LinkedIn Post来测试内容生成。结论是Gemini Ultra凭借更多标题选项、更快响应速度和“没有愚蠢的emoji表情”击败GPT-4成为绝对胜者。网友 Alphabetting拿出一道逻辑推理题:Tabitha喜欢饼干但不喜欢蛋糕,喜欢羊肉但不喜欢羔羊肉,喜欢秋葵但不喜欢南瓜。它询问按照相同规则,Tabitha会喜欢樱桃还是梨。Gemini Ultra给出的建议是:“Tabitha喜欢发音两个音节的食物,不喜欢一个音节的食物。”它列出谜题中每种食物的音节数,由于“cherries”有两个音节,因此答案是樱桃。GPT-4认为Tabitha的偏好可能与单词最后一个字母有关。她喜欢的食物结尾是辅音,而她不喜欢的食物结尾是原因。这样的话,樱桃和梨都符合条件有些棘手,但一定要选一个的话,那就樱桃吧。他表示Gemini Ultra成功解决了被GPT-4搞到稀碎的逻辑测试。用户Brett Winton测试两者的文生图功能,提示词是“生成一个画家试图在火箭外部画静物的图像,让它幽默一些,一幅插画“。左边是GPT-4,右边是Gemini Ultra。AI模型的想象力见仁见智,不过Gemini图像里的画家比起绘画更像在吃东西,手部细节也有点问题。评论里都觉得GPT-4更好些。他又紧接着对比了Gemini Ultra、 Claude和GPT-3.5对于8年级数学题计算能力。题面是:Garcia正策划一个比萨派对,她需要确保30名学生每人至少得到3片,每个比萨有8片。为增加多样性, Garcia决定订购一半奶酪比萨和一半香肠比萨。然而有5名学生是素食者,只会吃奶酪比萨。请回答:1.Garcia需要订购多少个比萨,以确保每个学生至少3片?2.每种类型比萨各多少个?3.如果每个比萨12美元,总订单费用是多少?在之前的测试中, Gemini Pro把这道题搞砸了。此次Ultra答对了总数12个比萨和费用144美元。但第2题的正确答案应该是两种比萨各6个,Ultra没通过。Brett Winton表示,Gemini Ultra和Claude一样,数学计算都不如GPT-3.5准确。编码能力上,网友Mervin Praison在Gemini Ultra用Python成功创建了一个贪吃蛇游戏。更多更深入的用例,大家可以抓住两个月的免费试用福利,亲自上手玩一玩。OpenAI开辟AI代理新战场,Google 不甘落后Google副总裁兼Gemini体验和Google助手部门总经理Sissie Hsiao表示,“对Google来说,Gemini不仅仅是模型。它实际上是我们思考最先进技术,以及我们在其基础上构建的整个生态系统的转变,从影响数十亿用户的产品,到开发者和企业用来创新的API平台。”就在昨天,The Information发表题为《OpenAI正将AI竞争焦点转移到能操作设备和自动化任务的软件上》的报道。文中爆料,OpenAI正在开发一种代理软件,能有效接管手机和电脑,替用户执行复杂任务操作。你可以命令ChatGPT执行从文档到表格的数据转移,自动填写费用报告并输入到会计软件中,或者在特定预算下创建行程或预订机票等基于网络的任务。随着越来越多全新大模型的推出,OpenAI也深知今年可能不再拥有市场上最强大LLM的可能性。所以加紧开辟新战场早做准备。据知情人士称,这类请求将触发代理点击、光标移动、文本输入等其它人类动作。可能会将将ChatGPT变成Sam Altman私下称为“超智能个人工作助理”的工具,也将与微软Copilot和GoogleGemini for Workspace 展开更直接竞争。去年ChatGPT已经给OpenAI带来16亿美元收入,微软也靠生成式AI显著拉升了最新季度财报业绩。而AI业务却还没有给Google带来明朗的现金流。如今付费版本Gemini Advanced和Ultra 1.0的推出会带来怎样的市场回馈,那些已经花钱订阅GPT的用户们会不会转投Gemini,人工智能整合进Google生态的全新究极样貌是什么?这些都让人期待。今年,注定继续是高潮迭起的AI拉锯战。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人