一些关于 Devin 的想法

一些关于Devin的想法很多投资人&行业内朋友都来询问怎么看待Devin这个产品,发布的第一时间就有关注,并且自己也在buildingdevelopertools,所以来写一些简单的comments,可能过段时间就打脸。1.我更倾向于把CognitionLabs这家公司看做是一家类似于DeepMind的研究型公司,而不是商业型公司,这两种公司的目标和愿景是不一样的;2.Devin发布的演示视频很惊艳,能够处理一些基本的GitHubIssue,甚至能解决Upwork上实际的问题,但是对于更复杂的场景能够解决得多好现在还是未知的(目前还没有拿到测试资本),SWE-bench13%的指标还是不能直接用在生产环境上(无干预情况下);3.软件开发是一个复杂的系统性工程,实际的coding其实只占其中的很少一部分,理解需求、生成代码、Debugging、优化、部署等等涉及到非常多的环节;4.Devin演示的一个亮点是,它所展示的决策树很长(按照blog中提到能有上千个决策节点),这个要求底层模型有非常强的reasoning能力和longcontextwindow,目前看起来Devin应该并没有train自己的模型(或者说只是在reasoning的某些环节使用了finetune的模型),核心的reasoning能力可能还是基于GPT-4;5.Devin的演示中遇到了很多出现error需要debug的情况,这个相当于是在决策树中需要回退到某个节点,选择其他路径中的某一条,如何判断哪条路径后续是正确的?Devin在演示的过程中有一个keyError,解决的办法是添加一个trycatch来捕获这个error,这条决策路径不一定是对的,比如说如果前置的代码里面已经有这个keyError了,那么后面再捕获这个error就没有意义。如果是人来进行决策,就会对可能的清况有一个更详尽的分析(或者说直觉);6.抛开各种营销号吸引眼球的标题,现在来说Devin代替开发者还太早,不过自动驾驶Day1也不是能直接上路驾驶的,L5级别的自动化软件开发一定是终局;7.Devin在用户交互上提供了一些新的探索,不再是调用外部的工具,而是自己维护了一套系统内的shell,codeeditor,browser,这样的好处是可以自定义一套DSL来操作这些工具。但是如果考虑到现阶段没有办法实现完全的无干预coding的话,这套方案是和现在的整个developmentworkflow脱离的。------一些私货:1.Devv最开始的愿景就是RedefinedevelopmenttoolsandachieveL5levelofautomatedsoftwaredevelopment.为什么没有选择直接做一个automatedcodingagent,就是因为当前的技术还不满足构建一个能够在生产环境使用的codingagent,作为一家商业公司,这个路是很难直接走通的。Devv的方法是先选择能够落地的、开发者日常最高频和刚需的信息检索这个场景去切入;2.DevvAgent当前的目标也不是做一个完全automated的agent,而是在更好地辅助开发者去解决开发流程中遇到的问题,本质上还是在copilot。Jiayuanfromdevv.ai

相关推荐

封面图片

TR069 的一些实验和想法

TR069的一些实验和想法有一些群友说,同一个ISP同省内的TR069是一个大内网,不限速,可以自己整出来玩。你需要FTTH接入,光猫可以进超管界面,TR069可用(有一些省份的一些ISP是会给你改掉光猫的超管密码不让你自己瞎玩,有一些会自动重置你的设置,那就没得玩了……据我知道的话,广东电信,上海联通应该都是可以玩的)。自己进光猫的超管页面,想办法把TR069整到某个LAN上(不同地区,不同光猫的方法各异,自己研究下……简单地说就是新建一个连接,选bridge,业务类型other,按TR069填好VLAN,绑到某个LAN口上),插上网线,按理说电脑就能收到一个内网的IP地址(我在广州的电信,两个地方,一个收到一个10开头的私网IP,另一个收到一个11开头的地址,但也是私网的)。测试的时候你可以先只接这个TR069网(你两个网卡的话还要手动写一下路由表),先ping一下光猫的TR069的IP,在光猫超管页面里面的测试也可以ping一下电脑拿到的TR069的IP(记得先关掉防火墙),都能通的话配置应该就OK了,你可以找一个同城的小伙伴来测试一下。

封面图片

关于 iPad Pro 的一些想法

关于iPadPro的一些想法绝大多数人真的不需要一台iPadPro尤其是M1版本的——但如果你现在想买一台iPadAir,那不如买一台2020的iPadPro(假如你能找到新的话)。没有多彩机身,但性能、扬声器、尤其是120Hz的屏幕都要更好,iPadAir的优势在于——指纹识别。(Apple你快点把AppleWatch解锁iPad给我加上去!)

封面图片

关于信用的转移和继承,做一些思想实验。

关于信用的转移和继承,做一些思想实验。假设A是个信用很不错的技术人才,接了一家信用口碑极差的B公司的offer,后来以B公司某项目负责人的官方身份发布一些产品和业务信息,请问,你该相信他还是不该相信他,是A提升了B的信用还是B拉低了A的信用。后来B公司董事会开会,延请了一位行业内口碑极佳的职业经理人C当新任CEO,那么现在,你认为该相信B公司,还是不该相信。再进一步,知名巨头D收购B公司大量股份并成功掌握控股权,改组董事会。D的信用口碑一向良好,现在D公开承诺会解决B公司的信用问题,并会对信用问题的有关负责人实行零容忍政策,但拒绝为过去出现的信用问题道歉和赔偿。请问你该不该相信D,该不该相信B的未来信用。以上没有标准答案,只是一个思想实验。或者说一个最简单的,一个劣迹斑斑的人推销一个产品,现在一个名誉很好的人站台给他背书,请问你该相信谁,是前者拉低了后者的信用,还是后者提升了前者的信用。没有标准答案,只是思想实验。

封面图片

关于早些时候转发的这条,再做一些补充。

关于早些时候转发的这条,再做一些补充。21年美国刚开打疫苗的时候就有相关的——唔这么说吧——“都市传说”,最初是被医学界一些专家否认的,认为是“女人们小题大做”。然而随着越来越多女性向自己的妇科医生反映这个情况,也有一些医生表示,这样的说法在医学上可能是说得通的。可能的解释之一便是,女性的免疫系统被疫苗激活后,可能是会引起子宫内膜的免疫细胞的变化。我刚刚用中英文在G上搜相关关键词,搜到的研究文献有好几篇,还有一些关于文献的科普报道。且这不单单是一个种类的疫苗的影响,几乎所有种类的疫苗接种者都有报告。一些新闻链接放在评论里。当然,绝大多数人会在一到两个周期后恢复正常,且对生育能力没有影响。但需要强调的一点是,就医过程中女性对身体状况的自述,经常是被忽视的。这就是一个很好的例子。【网评】我平时很准,去年夏天接种第三针,当月就没有来,到下一个周期时偏差了几天,然后便顺延偏差,直到去年底才又恢复正常。

封面图片

这是构成Sora基础之一的Diffusion Transformer论文作者关于Sora的一些猜测和技术解释。#ai视频#Sor

这是构成Sora基础之一的DiffusionTransformer论文作者关于Sora的一些猜测和技术解释。这个老哥可能是除了这篇论文的另一个作者(现在在OpenAI工作)之外最懂DiffusionTransformer的人了,非常值得关注。有趣的是这篇论文曾经在2023年的计算机视觉会议(CVR2023)上因“缺少创新性”而遭到拒绝,短短一年时间就变成了Sora这怪物模型的理论基础。-------------正文开始-------------以下是我对Sora技术报告的解读,其中包含了一些可能并不准确的猜测。首先,我非常感谢团队分享了极为有价值的见解和设计决策——Sora确实令人惊叹,它将彻底改变视频生成领域。我们目前所了解到的情况如下:架构:Sora基于我们的扩散变换器(DiffusionTransformer,简称DiT)模型构建,该模型已发表在2023年国际计算机视觉会议(ICCV2023)上。简单来说,它是一个结合了变换器(Transformer)主干的扩散模型:DiT=[变分自编码器(VAE)编码器+视觉变换器(ViT)+去噪扩散概率模型(DDPM)+VAE解码器]。根据报告,这个模型似乎没有太多额外的复杂设计。“视频压缩网络”:这看起来就像是一个在原始视频数据上训练的变分自编码器(VAE)。在实现良好的时间一致性方面,标记化(Tokenization)可能扮演着关键角色。顺便提一下,VAE本质上是一个卷积网络,所以从技术上说,DiT实际上是一个混合模型。;)当Bill和我参与DiT项目时,我们并未专注于创新(详见我之前的推特),而是将重点放在了两个方面:简洁性和可扩展性。这些优先事项带来的不仅仅是概念上的优势。简洁性代表着灵活性。关于标准的视觉变换器(ViT),人们常忽视的一个亮点是,它让模型在处理输入数据时变得更加灵活。例如,在遮蔽自编码器(MAE)中,ViT帮助我们只处理可见的区块,忽略被遮蔽的部分。同样,Sora可以通过在适当大小的网格中排列随机初始化的区块来控制生成视频的尺寸。而UNet并不直接提供这种灵活性。猜测:Sora可能还使用了Google的Patchn’Pack(NaViT)技术,使DiT能够适应不同的分辨率、持续时间和长宽比。

封面图片

Eric Rescorla 关于 Web5 的一些见解。

EricRescorla关于Web5的一些见解。Eric是目前Firefox的CTO,主要在网络、安全、隐私领域有着非常深刻的洞见。推荐大家阅读一下。https://educatedguesswork.org/posts/web5-first-impressions/缘起今天下午去找几位大佬谈笑风生,大佬们对目前很火的Web3提出了深刻的批判,总结成一句话就是:Web3是在用错误的手段解决错误的问题。激进一点的说,Web3ISSHIT。我并不熟悉这块,所以我姑且把下午谈话的内容稍微总结一下,拿出来给大家抛砖引玉。Web3有个经典的说法就是什么分布式账本balabala,大佬们举了个略微……刺激的例子。你有裸照,你丢到中心化服务器上,那显然是会被大家看光的。你有裸照,你和其他人的裸照,存一份(共识),每个人都有,但这还是会被看光。用户需要的,其实是裸照放自己手里,你不知道我这个是不是裸照,你只有我想给你看的时候你才知道它是裸照,但你看完走了以后,你就什么都不知道了。因此,相对的,JackDorsey提出的Web5可能是一个更理想的解决方案。(Web5)=(Web2)(Web3)你问我为啥它不叫Web^26,我也不知道。注意,Web3不要和Web3.0混淆,Web3指的是去中心化网络的那一套,Web3.0指的是内容跨站、智能化,是不同的东西.Web1.0/2.0/3.0是针对内容的形式而言的,分别对应用户单向只读(门户网站)、用户社交(搜索引擎和用户生产内容)以及执行网(也就是所谓的万物互联)。Web3目前几乎所有的应用,就是发币,炒币,repeat(欸我押韵了)。但它并没有解决如何把现有的服务,给它搞成一个保护好大家隐私,但继续能用的问题。Web2/3/5则是对应网络的形态而言的,分别对应目前的互联网(Web2),去中心化(Web3),以及结合了23的Web5(去中心化身份)要做到Web5就是要解决:1.怎么搞匿名化身份2.怎么搞安全存储3.怎么搞这个信息授权其中第二项比较有趣,有一些人认为,现在设备算力这么高,存储这么便宜(1400RMB可以搞16TB,百度云5TB一年都要350,自建云其实并没有那么贵)。也有认为未来应该会有这种可信存储服务实现,类似于我们现在有的云盘,它是分布式的,但是它又只负责存储,它并不知道你存了啥。但这一切都是非常早期的东西,还有很多工作要做。解决了这些,就要解决谁来掏钱的问题。如果用户BYOS(BringYourOwnStorage)自带存储,那显然是存储用户出,或者提供某种形态的订阅服务。我们提出的观点是,用户现在产生的数据自己存完全是可行的,现在设备带宽这么大(5G!WiFi6!),性能这么好,完全可以做很多端侧的运算和服务。为啥要把数据给云端呢?app开发者提供的将不再是免费的服务,而是“付费的算法模型”,也就是从现在的免费,然后拿用户数据盈利转变为Freemium模式,如果用户愿意把自己的数据拿去训练更加准确的模型/算法,那商业实体自然应该为使用这种资源付费,而这些使用过程,不应该被具体到人,也就是所谓的匿名性。Web5是一个愿景,同时它也是一个远景。要想做到各种数据都能一起收拢给自己处理不能说非常困难吧,我看比登天费劲点。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人