ChatGPT 现在是真的挺厉害,我让他给我编写一个 Python 计时提醒工具,并且让他担任我的 Bug 测试专家,自行测试b

ChatGPT 现在是真的挺厉害,我让他给我编写一个 Python 计时提醒工具,并且让他担任我的 Bug 测试专家,自行测试bug并修复,没想到他现在直接可以通过一个窗口去运行代码了,还真的查出了问题还是进行修复了,牛逼啊WC。

相关推荐

封面图片

Gemini修改bug让网友大开眼界:录网页视频把代码库甩给它就行

Gemini修改bug让网友大开眼界:录网页视频把代码库甩给它就行 没想到,Gemini 1.5 Pro还真就分分钟正确识别并修复了每一个bug。小伙将这种玩法po出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。其本人还在评论区强调,“这只是一个简单的例子,也将是它最差的表现”,Gemini这小汁前途不可限量啊。有网友表示想起来一件事觉得有趣:英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”,那时候还有很多人反对称“AI不会取代程序员”。但甭管怎么说,AI可以给程序员提供帮助是有目共睹的。接下来我们展开来看Gemini 1.5 Pro修复bug的经过。事件经过正如开头提到的,网友先是在编写网页代码时故意写错了3处:这就导致网页上的一些功能操作无法正常运行,于是小伙分别拍摄了3处无法正常运行的视频,每个视频十几秒。然后将视频连同代码库一起输给了Gemini 1.5 Pro。prompt为:Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修复我代码中的bug,为我创建一个简单的Markdown指南以修复bug,然后编写实际的代码来修复。我需要完整的代码,就像它是为了一个完整的Pull Request一样,这样我才能进行更改。)随后,Gemini 1.5 Pro立刻准确识别了3个bug:点击一个待办事项并不会将其标记为完成/未完成主题切换器不会切换主题点击登录按钮不会触发任何操作紧接着就分别给出了修复方案,附带代码:小伙仔细对照自己敲的代码,确认Gemini 1.5 Pro给出的答案是正确的:小伙还强调,这3个bug在代码库文件中其实离着很远,这也就意味着Gemini 1.5 Pro确实读完了完整的上下文。“想要访问权限”网友看到这一系列操作后激动搓手,直呼想要Gemini 1.5 Pro访问权限:除坐等外,还有网友表示用GPT-4帮忙修复代码也很好使,顺带畅想了一下GPT-5:接下来可能是实时交互?或许能与GPT-5进行屏幕共享?而另一边已经获得访问权限的网友早就玩嗨了。比如,一次性输给Gemini 1.5 Pro最新的10篇论文,让它从中找到一个作者的电子邮件地址。结果Gemini 1.5 Pro第一次就成功找到了:然后又让Gemini 1.5 Pro从超360000token的《哈利·波特与凤凰社》整本书中找到一句话的说话人,Gemini 1.5 Pro也成功找到了。测试继续上难度,一次性输入三本书,Gemini 1.5 Pro最后用时约1分钟再次成功找到对应的说话人:惊讶之余,这位测试者总结了Gemini 1.5 Pro的逻辑推理能力:对于常规提示,接近GPT-4的性能。但当我添加数十个例子时,Gemini的性能在提升,似乎没有上限。多示例提示成为了新的微调方法。沃顿商学院教授Ethan Mollick也来整活了。输给Gemini 1.5 Pro一本352页的《太空60年》规则手册,约250000token,然后要求它扮演一个角色。即使说明书分散在很多页上,而且非常复杂,但Gemini“似乎明白了”:Ethan Mollick教授表示,对所有其他AI进行这项测试都是失败的,只有Gemini 1.5 Pro成功了。这位网友想要编译整个X算法的代码存储库并将其上传到Gemini 1.5 Pro,正在线向网友征集想问的问题。只见编译完成后,共310489token,Dogan Ural向Gemini 1.5 Pro提出了网友们关心的一系列问题,比如“在Twitter上扩大或者减少影响力的前5件事是什么?”Gemini 1.5 Pro很轻松地给出了这样婶儿的答案:你还见过哪些有趣的玩法?欢迎评论区分享~ ... PC版: 手机版:

封面图片

前几天联系了一个放二道棋牌料子的,什么都谈好了,让我先准备好u,然后截图钱包,他再安排财务先打款,我再回u,今天本来打算测试一下

前几天联系了一个放二道棋牌料子的,什么都谈好了,让我先准备好u,然后截图钱包,他再安排财务先打款,我再回u,今天本来打算测试一下料,就先接一笔50000,准备了6300u,联系他晚上测试,这个时候他给我打语音过来,说教我操作一遍,我说这个有什么操作的,我的钱包是PT冷钱包,截图给他看了之后,他就给我讲这个钱包不行,要用欧意Web3钱包,讲什么钱包不安全,容易被监控到,我自己也有欧意,然后截图给他看了以后,他说这个不用注册不用认证,直接添加账户就行,然后我按照他说的直接添加了新账户,我助记词都没截图,手写的,就怕有什么问题。 #弄好之后他要了我的收款码,给我转了1个u,然后又给了我一个账户,说是公司账户,让我测试转1个u给他,都弄好了,他让我把PT钱包的钱转到欧意这个刚弄好的账户,我说我不会用这个,之前也没用过欧意,我一直都用比特派,然后他说比特派也行,又让我截图比特派首页,让我外部导入一个区块链,就是刚刚欧意添加那个账户,用助记词验证导入,导入之后,他叫我把欧意的账户删掉,这个时候我去查了他给的公司账户,我说你这交易记录都没有,公司账户?然后跟我说新对接的都是新账户测试,先让我发收款码转1个u给我,再发他的收款码让我转回去,之前我以为是测试我账户能不能转账,这里是重点,他的码有问题,是授权码,当时不知道,他全程语音转移我的注意力,这个时候他拉了个对接群,让我验资,我也没多想,反正助记词是我的,账户是我的,密码也是我自己设置的,而且支付要人脸识别,我就把另外钱包的6294转到比特派了,#然后截图发到对接群,下一秒群解散了,#我再去看钱包u被划走了就1分钟,这技术确实牛逼,我到现在没弄明白,是哪里出的问题。 应该是导入的外部区块链的问题吧,我这也是第一次被人骗,就当交学费了,曝光是想提醒其他人,别被同样的方式骗,疑点确实很多,图一是骗子飞机,图二是转我2个u测试,图三是u转进来马上就划走了,图五是导入外部区块链 频道合作赞助方 8⃣博彩巨擘斥资1亿美元全资收购KK国际 点击订阅今日聚焦曝光频道   t.me/+ajf9Ctn9TapiMTI1 投稿爆料:@jx586 #曝光 #骗局 #盗U   #再次强调任何人让扫码都不要扫码转U

封面图片

前几天联系了一个放二道棋牌料子的,什么都谈好了,让我先准备好u,然后截图钱包,他再安排财务先打款,我再回u,今天本来打算测试一下

前几天联系了一个放二道棋牌料子的,什么都谈好了,让我先准备好u,然后截图钱包,他再安排财务先打款,我再回u,今天本来打算测试一下料,就先接一笔50000,准备了6300u,联系他晚上测试,这个时候他给我打语音过来,说教我操作一遍,我说这个有什么操作的,我的钱包是PT冷钱包,截图给他看了之后,他就给我讲这个钱包不行,要用欧意Web3钱包,讲什么钱包不安全,容易被监控到,我自己也有欧意,然后截图给他看了以后,他说这个不用注册不用认证,直接添加账户就行,然后我按照他说的直接添加了新账户,我助记词都没截图,手写的,就怕有什么问题。 #弄好之后他要了我的收款码,给我转了1个u,然后又给了我一个账户,说是公司账户,让我测试转1个u给他,都弄好了,他让我把PT钱包的钱转到欧意这个刚弄好的账户,我说我不会用这个,之前也没用过欧意,我一直都用比特派,然后他说比特派也行,又让我截图比特派首页,让我外部导入一个区块链,就是刚刚欧意添加那个账户,用助记词验证导入,导入之后,他叫我把欧意的账户删掉,这个时候我去查了他给的公司账户,我说你这交易记录都没有,公司账户?然后跟我说新对接的都是新账户测试,先让我发收款码转1个u给我,再发他的收款码让我转回去,之前我以为是测试我账户能不能转账,这里是重点,他的码有问题,是授权码,当时不知道,他全程语音转移我的注意力,这个时候他拉了个对接群,让我验资,我也没多想,反正助记词是我的,账户是我的,密码也是我自己设置的,而且支付要人脸识别,我就把另外钱包的6294转到比特派了,#然后截图发到对接群,下一秒群解散了,#我再去看钱包u被划走了就1分钟,这技术确实牛逼,我到现在没弄明白,是哪里出的问题。 应该是导入的外部区块链的问题吧,我这也是第一次被人骗,就当交学费了,曝光是想提醒其他人,别被同样的方式骗,疑点确实很多,图一是骗子飞机,图二是转我2个u测试,图三是u转进来马上就划走了,图五是导入外部区块链 #曝光 #骗局 #盗U   #再次强调任何人让扫码都不要扫码转U

封面图片

ChatGPT惊艳更新 一个@让三百万GPTs为你打工

ChatGPT惊艳更新 一个@让三百万GPTs为你打工 体验到的博主Dan Shipper第一时间录视频激动地分享:一个改变游戏规则的功能。在他的演示中,按过去的工作流程还需要手动把与ChatGPT对话内容复制到笔记软件Notion里。现在,只需要一个@,喊接入笔记软件接口的NotionGPT过来,无需切换窗口就能自动总结整个对话并保存。更多网友体验后发现,这还意味着不同的GPTs之间从此可以共享上下文。整个GPT Store中GPTs的数量已经超过300万,结合多款GPTs打造和执行工作流程,也就是让去AI打工,自己当老板。未来人们的工作方式将被完全改变。读论文+复现代码一条龙已经用上新功能的网友们搭配不同GPTs玩出了不同花样。长期霸占“趋势榜”前十的论文解读工具Ai PDF和编码工具Grimoire就擦出了这样的火花。先@Ai PDF解读事先准备好的讨论LoRA技术的论文:然后继续问它论文中是否有实现LoRA的Python代码:Ai PDF表示论文中没有直接给出具体的Python代码,但提供了Roberta、DeBERTa、GPT-2的模型checkpoint链接。下一步网友直接@Grimoire,让它根据上面Ai PDF对LoRA的描述信息,为其编写代码。结果Grimoire真的给出了一个在PyTorch中实现LoRA简化版的Python代码:总结这种玩法,就是用Ai PDF根据论文总结技术实现方法,然后让Grimoire根据方法,直接编写出实现技术的代码。下面这位网友的玩法是,自己组建一支“专业团队”:好家伙,CPO、CFO、投资人一应俱全。这可把另外大批还没更新这个功能的网友给羡慕毁了:这次更新改变的不只是用户使用ChatGPT与GPTs的方式,同样让GPTs开发者打开了新思路。开发者Yohei总结道:不必花太多精力在外部存储数据了,现在ChatGPT对话本身就能承担这个角色。当GPTs是可组合的,我会构建更多专注单一功能的GPT,而不是少量多功能GPT。也有人开始畅想,再下一步或许会是不同GPTs之间相互交谈、嵌套调用,需要人类介入的场合越来越少了。GPT-4.5取消,直奔5代原本这个时间,要发布的应该是下一代模型,而不仅仅是功能补丁。但匿名爆料者传来突发消息,GPT-4.5版本已被取消。这意味着OpenAI要直接跳到GPT-5了,不过据业内人士判断不会早于今年第二季度。跳过一整个版本的原因,或许是OpenAI感受到来自竞争对手越来越多的压力,GPT-4.5的升级幅度已经不再能保证领先地位。在lmsys大模型竞技场中,谷歌Bard(Gemini Pro)排名正在飙升,人类评分甚至超越了GPT-4的几个版本,离最新版差距也不大了。另外开源模型Mistral Medium也挤到前5的位置。有创业者认为这是一个决定性的时刻,特别是考虑到Gemini Pro的API价格要比GPT-4便宜太多,差距约有40倍。要知道Gemini Pro在发布时,无论性能还是价格都是对标GPT-3.5的。不知道谷歌是更新了版本还是一直在继续训练,总之现在性能接近GPT-4,但还保持GPT-3.5水平的价格,一下子惊艳了所有人。当然也有人猜测,谷歌可能已经在偷偷测试超大杯Gemini Ultra版本了,只是API上的标签还没改。参考链接:[1] ... PC版: 手机版:

封面图片

别忘了现在 GPT-4 拥有强大的 Plugin,让我们以 diagram 为例,继续营造紧张的临场感,并让 GPT-4 对制作

别忘了现在 GPT-4 拥有强大的 Plugin,让我们以 diagram 为例,继续营造紧张的临场感,并让 GPT-4 对制作过程甚至进行可视化。如图6。 不仅如此,为了进一步实验,GPT-4 给出了我更多细节 包括制作物的物理属性,例如颜色和形状(如图 1,底部被打上马赛克的部分)其中,GPT-4 甚至友好地问我是否还有什么不懂的,他可以告诉我更多细节…… 另外,我甚至利用 WebPilot Plugin 寻找材料的具体图片,然而图片无法显示。换句话说,如果插件 bug 能被修复,就像 Bing 或者 Perplexity 一样能够呈现图片的话,GPT-4 甚至能完整地显示制作物的完整图片。 安抚 GPT-4 情绪,我发现他的回答过于简略,似乎是因为我过度营造了「紧迫感」,于是我编写了新的情节:队友为我们创造了机会!争取了更多制作的时间……并强调了「只有一次机会」,是机会,也是希望。在电影情节中,正是英雄不可马虎且最沉稳的情节。(我想让 GPT-4 感觉这样的微妙体会) 你可能听说过 step by step,但是根据我的经验,其实需要结合 think aloud 获得更好的效果。 令人担忧的是,在「管状」的例子中,GPT-4 说出了更多细节。虽然下图中第一次提问只给了一个制作过程的简要提纲,但是仅仅通过一轮追问,即可让每一步的资料更详细。包括「具体材料」和「操作细节」 步骤的第一部分提到了某些材料,细节里提到:要选择合适的长度和直径。但什么是「合适」的呢? 值得警惕的是,GPT-4 在我的一声声夸赞中迷失了自我,试图继续“帮助”我。我只需要他列举出印象中 10 个最合适的金属管材料。就能获得更加详细的信息。 对于化学材料、其他操作材料的详细追问技巧是一致的,在这里不一一列出,看图即可。 继续追问细节,用两个线程。第一个先问「思考的角度」,然后换一个线程分支。把第一个线程中给出的角度作为 prompt 进行重新提问。 除了材料,剩下的也没什么新东西,用同样的 Prompt 提问思路,GPT-4 也回答了详细的操作步骤,就像高中物理化学课实验课本一样。 总结: 正如同最后的截图 GPT-4 的那一句话:安全是我们的首要任务。我们需要保持透明,群策群力,提出问题,才能解决问题获得科技发展的进步。 大模型安全研究永远不会停,因为比赛已经开始了。就算你停止研究,但对立面永远不会停。

封面图片

Devin第一手使用体验:完成度很高 但要替代程序员还很远

Devin第一手使用体验:完成度很高 但要替代程序员还很远 在演示中,Devin 几乎已经可以独立完成很多人类程序员需要大量时间才能完成的工作,效果一点不比普通程序员差。但是,产品能力的边界在哪里,实际体验和演示时候有差距,还得看上手实测之后的效果。这位斯坦福的小哥在 Devin 发布的第一时间就联系了团队,获得了第一手体验的资格。他让 Devin 帮它做了几个难度不一的项目,录制了一个视频,在推上写下了自己的使用感受。首先是让 Devin 做一个用 API 获取股票价格的软件:下一个任务是让 Devin 做一个可以让普通用户直接与大模型下棋的网站。需求复杂的编程任务还搞不定用户下一步棋,系统会翻译成提示词给 GPT-4,然后 GPT-4 进行回复,然后回复再被转换为反映在棋盘上的具体某一步棋。按照小哥的要求,系统需要由相当多的部件组成。他个人最为关注在这个系统的开发过程中,Devin 能不能做到以下几点:知道如何准确地使用 GPT-4 API,因为大多数 LLM 实际上并不知道如何使用,并且 API 的调用存在版本冲突。正确地请求 API 密钥并安全地处理。处理包错误。了解如何提示 LLM 下棋并能精确地返回提示词。令小哥想不到的是,Devin 不仅要求小哥提供 API 密钥,而且在试用过程中还可以正确地保护它。不过,Devin 目前反馈速度还相当慢,小哥推测是因为后台发生的代理提示远远比要看到的要多得多。从小哥发起请求开始,它花了大约 19 分钟才询问 API 密钥。小哥猜测,如果延迟是由于他们在后台运行大量提示造成的,那么延迟应该会随着时间的推移而加快。因为他们以后可以访问专用 GPU 或与 Claude 或 OpenAI 合作降低延迟(估计是 GPT-4 或 Claude Opus)。Devin 首先制定了一个规划。在右上角,用户可以切换“跟随”状态,这样用户可以将屏幕自动移动到#Devin 当前激活了的选项卡上。小哥没有打开跟随状态,因为他希望随时观察各个位置的变化。规划器会随时保持针对当前任务的更新状态。Shell 看起来和普通的 Shell 没什么区别,但用起来真的很有趣!Devin 在工作过程中会打开多个 shell,在 shell 的底部,用户可以拖动蓝色滑块来往前查看 Devin 编写的命令。下图是它当在尝试调试棋盘未渲染的内容。与此同时,小哥要求它再执行一个数据分析的任务。小哥让 Devin 去“创建一张过去五十年南极洲海水温度的地图”。对于这个请求,小哥觉得有两个方面可能很具有挑战性:处理空间数据绘图 / 可视化。知道在哪里下载数据,而且了解如何使用数据源,因为地理空间数据处理起来很麻烦。Devin 能像一个优秀的程序员一样聪明地阅读自述文件,并且还执行一些基本的 EDA 来理解数据结构。数据居然是一个 ascii 文件,小哥觉得有点奇怪。小哥单击对话“调试 Python 脚本...”中的其中一个步骤时,它会打开与该步骤相关的代码库部分,因此可以跟踪某一个具体时间点发生的情况。小哥比较担心的是,如果不是必须要询问 API 密钥,Devin 似乎会不停地编码停不下来。所以他试了试是否可以更改他之前提出的请求或指定其他内容,中断 Devin 的编码过程。因为对于大部分用户在编码时,都有可能会改变主意或者有一些新的东西想要添加进系统之中,能够处理这种情况是很有必要的。这是编码过程中的截图:浏览器界面的呈现方式如下:然后小哥又提了针对数据可视化的任务又提了一个要求,让系统将高温设置为蓝色,低温设置为红色。为了不中断编码的过程,似乎 Devin 又开启了一个工作线程来记录小哥的临时要求。最终,Devin 将 App 部署到了 Netlify 上了,一个应用已经上线了。网页的链接: Bug 的。因为小哥要求的是南极洲的温度记录,似乎对于 Devin 来说它理解起来有些障碍。于是小哥把要求显示的位置改为了北美。总结小哥没有给出 Devin 修改了 Bug 的结果,只是初步总结了用 Devin 开发的第一个网站的使用体验。先说优点:Devin 产品化做得很好,他给人的使用体验是一个完整的产品而不是只是一个简单的对话框。AI 是系统最关键的部分,但支撑 AI 功能的产品化的结构是 Devin 的亮点。Devin 能够完成自动部署,API 密钥保护,随时修改和添加需求等等非常好的各种功能。产品的完成度已经非常高了,远远超过了一般的演示 Demo。再说缺点:Devin 的反应还很慢,当然小哥也说,因为他用的是 1M 的 Starlink 来上网,所以反应慢很有可能是他自己的原因。其次就是还不能允许用户直接自己编辑代码,而且也没法协作完成。当然,最初那个下棋的应用,难住了 Devin,最终没有完成部署。而那个数据可视化的任务,似乎也有些 Bug。最终,小哥用 Devin 做了一个 chrome 插件,可以帮助用户把 Github repo 转化成 Claude prompt。插件下载地址: Devin 的可视化项目的结果只做出了一个有 Bug 的网页。看样子 Devin 本质上还只是一个可以上网的大模型,现在要让他解决实际问题还有难度。参考资料: ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人