GPT 是如何工作的:200 行 Python 代码实现一个极简 GPT(2023)| blog

GPT是如何工作的:200行Python代码实现一个极简GPT(2023)本文是arthurchiao整理和翻译自2023年AndrejKarpathy的twitter和一篇文章:GPTasafinite-statemarkovchain。本文实际上是基于PyTorch,并不是完全只用基础Python包实现一个GPT。主要目的是为了能让大家对GPT这样一个复杂系统的(不那么底层的)内部工作机制有个直观理解。

相关推荐

封面图片

让你的代码更优雅的几个Python技巧 | blog | #技巧

让你的代码更优雅的几个Python技巧#技巧本文将通过适合初学者的示例演示9个Python技巧,以帮助你在日常工作中编写更多Python程序1.使用product()函数避免嵌套的Python循环2.海象运算符:赋值表达式的可爱技巧3.三元条件运算符:在一行中编写一个简单的if-else结构4.使用Lambda函数定义简单函数5.列表推导:以pythonic方式获取列表6.利用Python中的高阶函数7.联合运算符:合并字典的最简单方法8.F字符串:pythonic字符串格式化技术9.使用星号解压缩可迭代对象和解构赋值

封面图片

基本实现了一个月学会Swift和Go并做出一个iOS APP的目标!GPT帮大忙!作为一个产品(本科金融、硕士设计)、写代码完

基本实现了一个月学会Swift和Go并做出一个iOSAPP的目标!GPT帮大忙!作为一个产品(本科金融、硕士设计)、写代码完全是自学,如果没有GPT,相信需要多花十倍的时间!思路是在实际的项目中去学习,因此给自己提需求,基本按照『找githubl类似项目->GPT帮忙解读并改写->遇到问题结合GPT和搜索引擎解决』的步骤,一点点完成给自己设定的目标。这一个月实践了用Swift编写登录注册页面、K线图、黑白皮肤设置、用户资料展示等iOS客户端功能、用Go编写后端实现GPT炒股聊天机器人、用pocketBase和python实现了后端用户管理和数据服务、部署后端到OracleCloud....当然离完成还有一段距离,有很多小问题需要修复,但最难的部分已经都啃了下来,轻舟已过万重山......反思了这段时间的学习,AI短期只能让人更卷,所以停下来思考一下还是有必要的,或许还是要往增强自己优势出发,而不是拉长战线......

封面图片

GPT Migrate,一个基于 GPT-4 的大胆尝试,让 AI 重写整个项目代码

GPTMigrate,一个基于GPT-4的大胆尝试,让AI重写整个项目代码使用可以将原有的Python项目,用JavaScript重写为新项目,AI会自动帮你生成新的目录结构、文件命名、项目依赖包。https://github.com/0xpayne/gpt-migrate来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

【Dune Analytics宣布开源Python库“Harmonizer”并将集成GPT4】

【DuneAnalytics宣布开源Python库“Harmonizer”并将集成GPT4】2023年04月21日11点11分4月21日消息,链上数据分析平台DuneAnalytics官推宣布开源Python库“Harmonizer”,Harmonizer主要将来自Postgres&Spark的查询转换为DuneSQL,并且大量利用了SQLGlot(一个处理SQL语言的Python库),Dune使用SQLGlot将查询解析成一个AbstractSyntaxTree,然后翻译成DuneSQL,通过自定义规则传递查询以将其匹配到新平台。DuneAnalytics还表示目前正致力于集成GPT4,以使Harmonizer更加强大。

封面图片

2023年值得关注的顶级Python库 | blog | #Python

2023年值得关注的顶级Python库#Python1.:一个简化大型语言模型(LLM)调用和嵌入调用的开源库,支持OpenAI格式,提供统一的输入输出格式,便于在不同模型间切换。2.:一个简化Python应用部署的工具,允许开发者创建自安装包,支持跨操作系统,并且具有自更新功能。3.:一个低代码Python库,专为数据科学家设计,用于构建交互式WebUI,无需掌握Web堆栈工具,支持机器学习产品的可视化。4.:专为AppleSilicon设计的机器学习数组框架,提供NumPy风格的API,支持自动微分、向量化和计算图优化。5.:一个全面的文本预处理工具包,能够处理多种格式的文档,如PDF、HTML和Word文档,提供清洗、格式化和信息提取功能。6.和:一个开源MLOps框架,用于创建可移植的生产就绪机器学习管道,以及AutoMLOps服务,用于生成、配置和部署集成CI/CD的MLOps管线。7.:OpenAI的Whisper模型的增强版本,提供更准确的时间戳和多说话人检测,以及更快的处理速度和更低的内存占用。8.:一个框架,允许开发者使用多个agent进行对话协作,以解决任务,类似于软件工程团队的协作。9.:一个用于指定结构和类型、验证和纠正大型语言模型输出的库,确保模型输出符合预期。10.:一个用于处理时间序列数据的库,支持多变量时间序列、事件日志和跨源事件流。这些库不仅展示了Python在AI领域的强大能力,也为开发者提供了更多样化的工具,以应对各种挑战。

封面图片

Vector Search in 200 Lines of Rust:用200行Rust代码写一个向量搜索数据库

:用200行Rust代码写一个向量搜索数据库由于人工智能/机器学习的快速发展,向量数据库随处可见。虽然它们可以支持复杂的人工智能/机器学习应用,但向量搜索本身在概念上并不那么困难。这篇文章描述了Vector数据库的工作原理,并用不到200行Rust代码构建一个简单的VectorSearch库。所有代码都可以在这个Githubrepo中找到。在这里使用的方法基于流行的库annoy中使用的称为“局部敏感散列”的一系列算法。本文的目的不是介绍一种新奇的算法/库,而是描述矢量搜索如何使用真实的代码片段进行工作。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人