做了一个爬虫(Selenium) GPTs 助手（1.0 版本）

做了一个爬虫(Selenium) GPTs 助手（1.0 版本）有时候科研人需要爬取一些网站的数据，但可能没有花太多时间系统深入学习过爬虫技术（处于一种似懂非懂的状态），这个时候如果你直接问 GPT-4，他其实很难很快给到你一个满意的回复。首先 GPT-4 不一定会主动用 selenium 框架，面对一些反爬又很烦；其次，就算你让他使用，中间也需要大量的沟通防止 GPT-4 不要跑题（例如改着改着就不用 selenium 框架了）；再者，也有人可能并不知道如何解决 ChromeDriver 的版本匹配问题，而 GPT-4 似乎很难清晰地提出这个问题的解决方案。所以我干脆就写好了 Documents 和 Prompts 方便你直接跳过很多和 GPT-4 不必要的沟通……从而迅速根据你的需求定制爬虫代码。再加上现在 GPT-4 这上下文长度起来后，不会超出限制就很好。我把她命名为 Cyber Scraper: Seraphina。在这里可以联系她：使用的方法大致就是只要你会审查元素，然后把它们 copy 给 Seraphina，让她清楚地知道你的目标元素是啥就行。如果她没明白的话你还可以保存一下当前页面 html 文件（mac 是 cmd shift s）然后上传上去，配合着你 copy 的 element 代码，这样大致上没问题了。相比之下，直接问 GPT-4 需要花费更多的时间达成共识。她也是我制作的另一个 GPTs：「Carpe Diem 教授」的朋友：那么 Seraphina 和 Carpe Diem 教授是如何认识的呢？让我们一起看看 Carpe Diem 教授是怎么说的吧

在Telegram中查看

相关推荐

ChatGPT惊艳更新一个@让三百万GPTs为你打工

ChatGPT惊艳更新一个@让三百万GPTs为你打工体验到的博主Dan Shipper第一时间录视频激动地分享：一个改变游戏规则的功能。在他的演示中，按过去的工作流程还需要手动把与ChatGPT对话内容复制到笔记软件Notion里。现在，只需要一个@，喊接入笔记软件接口的NotionGPT过来，无需切换窗口就能自动总结整个对话并保存。更多网友体验后发现，这还意味着不同的GPTs之间从此可以共享上下文。整个GPT Store中GPTs的数量已经超过300万，结合多款GPTs打造和执行工作流程，也就是让去AI打工，自己当老板。未来人们的工作方式将被完全改变。读论文+复现代码一条龙已经用上新功能的网友们搭配不同GPTs玩出了不同花样。长期霸占“趋势榜”前十的论文解读工具Ai PDF和编码工具Grimoire就擦出了这样的火花。先@Ai PDF解读事先准备好的讨论LoRA技术的论文：然后继续问它论文中是否有实现LoRA的Python代码：Ai PDF表示论文中没有直接给出具体的Python代码，但提供了Roberta、DeBERTa、GPT-2的模型checkpoint链接。下一步网友直接@Grimoire，让它根据上面Ai PDF对LoRA的描述信息，为其编写代码。结果Grimoire真的给出了一个在PyTorch中实现LoRA简化版的Python代码：总结这种玩法，就是用Ai PDF根据论文总结技术实现方法，然后让Grimoire根据方法，直接编写出实现技术的代码。下面这位网友的玩法是，自己组建一支“专业团队”：好家伙，CPO、CFO、投资人一应俱全。这可把另外大批还没更新这个功能的网友给羡慕毁了：这次更新改变的不只是用户使用ChatGPT与GPTs的方式，同样让GPTs开发者打开了新思路。开发者Yohei总结道：不必花太多精力在外部存储数据了，现在ChatGPT对话本身就能承担这个角色。当GPTs是可组合的，我会构建更多专注单一功能的GPT，而不是少量多功能GPT。也有人开始畅想，再下一步或许会是不同GPTs之间相互交谈、嵌套调用，需要人类介入的场合越来越少了。GPT-4.5取消，直奔5代原本这个时间，要发布的应该是下一代模型，而不仅仅是功能补丁。但匿名爆料者传来突发消息，GPT-4.5版本已被取消。这意味着OpenAI要直接跳到GPT-5了，不过据业内人士判断不会早于今年第二季度。跳过一整个版本的原因，或许是OpenAI感受到来自竞争对手越来越多的压力，GPT-4.5的升级幅度已经不再能保证领先地位。在lmsys大模型竞技场中，谷歌Bard（Gemini Pro）排名正在飙升，人类评分甚至超越了GPT-4的几个版本，离最新版差距也不大了。另外开源模型Mistral Medium也挤到前5的位置。有创业者认为这是一个决定性的时刻，特别是考虑到Gemini Pro的API价格要比GPT-4便宜太多，差距约有40倍。要知道Gemini Pro在发布时，无论性能还是价格都是对标GPT-3.5的。不知道谷歌是更新了版本还是一直在继续训练，总之现在性能接近GPT-4，但还保持GPT-3.5水平的价格，一下子惊艳了所有人。当然也有人猜测，谷歌可能已经在偷偷测试超大杯Gemini Ultra版本了，只是API上的标签还没改。参考链接：[1] ... PC版：手机版：

OpenAI 官方 16 个 GPTs 提示词分析。

OpenAI 官方 16 个 GPTs 提示词分析。花了点时间读完了官方默认的 16 个 GPTs，从写作助手、数学老师到菜谱助手等等，这些 GPTs 充分地展现了 GPT-4/4V 的能力。从提示词写法上来说，可以归类为三种。 1. 根据我的推测，是用 GPT Builder 创建的。提示词比较简单。主要就是指定名字、主要用途、注意事项、语言风格。没有详细的例子或者规则。你如果读过 GPT Builder 自动生成的 Instruction，只要一读这个提示词，就能感觉出来。参考图一。这其中包括以下 4 个 GPTs： - Math Mentor - The Negotiator - Sous Chef - Creative Writing Coach 2. 手动写的，但是用的非常简单通用的结构。手动指定目标 (goal) 和语言风格 (style)，最多增加一些具体的样例。参考图二。这其中包括以下 2 个 GPTs： - genz 4 meme - ChatGPT Classic (啥也没定义) 3. 看上去很复杂，但实际上相似度 80%。可以先瞅一眼图三。看上去很唬人。但实际上我们只需要关注 # 号开头的部分。从图三可以看到，里面包含了几个 # 号开头的段落： # Tools ## python ## browser ## myfiles_browser 我们知道，GPT-4/4V 有最基本的 4 个能力，分别是： - Data Analysis 可以生成并执行代码 (python) - 浏览器可以查询互联网 (browser) - DALL.E 图片生成和处理 (dalle) - 上传文件量化作为知识库 (myfiles_browser)。 ## 开头的提示词段落，就是在分别定义这个 GPT 里用到这些功能的时候的流程和注意事项。上面已经包含了 3 个，剩下一个就是 ## dalle，在图四可以看到。忽略 ## dalle 段落，你会发现，图四中，## myfiles_browser 和 ## python 跟图三是一样的。而剩下的其他 GPTs 几乎都是这样的结构，只是复制过去的功能不一样，有些只需要 ##browser，有些需要的功能多一点。所以我说，它们相似度 80%. 10 个 GPTs 用到的功能如下：

建 GPTs 的时候，如果你的数据是一个开放的网站，那就不要用爬虫把网站爬一遍了，直接用 Web Browsing + 搜索语法

建 GPTs 的时候，如果你的数据是一个开放的网站，那就不要用爬虫把网站爬一遍了，直接用 Web Browsing + 搜索语法就行了。比如，如果你想建立一个和虎嗅网对话的机器人，那就直接在 Prompt 里这么写： 1. 当得到一个问题时，首先在搜索相关问题（使用“site:"）。 2. 使用在上述步骤中获得的上下文作为参考来生成流畅的答案。如果答案不清楚，请适当推理。 3. 你永远不会引用以外的任何网站。同一段 prompt 里可以加入多个网站把语法写好就行，比如"site: or site:"就是同时对话虎嗅和钛媒体两个网站。这个方法依赖 Bing 国际版对网站的收录，如果你发现 Bing 对网站收录不佳，可以关掉官方的 Web Browsing 换用 Webpilot，后者会首选 Google。在 GPTs 里启用 Webpilot 的方法，详见它们的官方博客：

最近我做了一个打标助手GPTs，感觉特别实用，推荐给大家！

最近我做了一个打标助手GPTs，感觉特别实用，推荐给大家！主要功能：上传任意一张或多张图片，打标助手就会自动识别图像内容，并返回给你适用于 AI 模型训练标注的图像描述。使用链接：支持一次性上传 10 张图片进行标注（图一）识别效果上，精准度明显优于 Clip 和 Blip2 这两个打标常用的AI模型（图二）风格兼容上，几乎没有限制（图三）还可以结合Dalle3，根据返回的描述生成同类图（图四） What’s Next! 因为 ChatGPT 中一次最多只能上传10张图片，且返回的标注需要手动复制，效率有限。于是@晨然的好奇屋和我决定把这个GPTs工具化，做一个真正可以批量打标，并批量下载标注的平台。这两天就会发布，大家期待一下吧！( ´▽` )ﾉ

GPTs的出现再次点燃了大家对聊天机器人和Agent的创作热情，几天时间就涌现出了成千上万个GPTs，其中也不乏有趣且实用的存在

GPTs的出现再次点燃了大家对聊天机器人和Agent的创作热情，几天时间就涌现出了成千上万个GPTs，其中也不乏有趣且实用的存在，下面给大家推荐几种发现和学习GPTs的网站和资料主要分为聚合网页、在线表格收集和脚本爬取文档三种，大家可以按需选择： GPTs聚合网页： GPTs Hunt（国人作品较多，质量也高）(图二) GPTs Hunter（最早的聚合网页）(图三) GPTs Today All GPTs chatgpt_system_prompt（记录了所有官方Prompt） Awesome AI GPTs（GPTs、prompt、解读都有）(图四) gpt-store GPTs24 在线表格收集： “通往AGI之路”（必看，收录了很多大神作品）(图五) “AI 严选”（必看+1，同样收录许多实用作品） GPTs数据库-EmbraceAGI（大佬维护的表格） GPTs导航&资料库（全网最全？）脚本爬取文档

作为一个站长，你是不是对爬虫不胜其烦？爬虫天天来爬，速度又快，频率又高，服务器的大量资源被白白浪费。

作为一个站长，你是不是对爬虫不胜其烦？爬虫天天来爬，速度又快，频率又高，服务器的大量资源被白白浪费。我们今天一起来报复一下爬虫，直接把爬虫的服务器给干死机。订阅第一时间获得内容更新标签: #爬虫 #建站 #Blog 频道: @GodlyNews1 投稿: @GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人