做了一个 爬虫(Selenium) GPTs 助手(1.0 版本)

做了一个 爬虫(Selenium) GPTs 助手(1.0 版本) 有时候科研人需要爬取一些网站的数据,但可能没有花太多时间系统深入学习过爬虫技术(处于一种似懂非懂的状态),这个时候如果你直接问 GPT-4,他其实很难很快给到你一个满意的回复。 首先 GPT-4 不一定会主动用 selenium 框架,面对一些反爬又很烦;其次,就算你让他使用,中间也需要大量的沟通防止 GPT-4 不要跑题(例如改着改着就不用 selenium 框架了);再者,也有人可能并不知道如何解决 ChromeDriver 的版本匹配问题,而 GPT-4 似乎很难清晰地提出这个问题的解决方案。所以我干脆就写好了 Documents 和 Prompts 方便你直接跳过很多和 GPT-4 不必要的沟通……从而迅速根据你的需求定制爬虫代码。再加上现在 GPT-4 这上下文长度起来后,不会超出限制就很好。 我把她命名为 Cyber Scraper: Seraphina。在这里可以联系她: 使用的方法大致就是只要你会审查元素,然后把它们 copy 给 Seraphina,让她清楚地知道你的目标元素是啥就行。如果她没明白的话你还可以保存一下当前页面 html 文件(mac 是 cmd shift s)然后上传上去,配合着你 copy 的 element 代码,这样大致上没问题了。相比之下,直接问 GPT-4 需要花费更多的时间达成共识。 她也是我制作的另一个 GPTs:「Carpe Diem 教授」的朋友: 那么 Seraphina 和 Carpe Diem 教授是如何认识的呢?让我们一起看看 Carpe Diem 教授是怎么说的吧

相关推荐

封面图片

ChatGPT惊艳更新 一个@让三百万GPTs为你打工

ChatGPT惊艳更新 一个@让三百万GPTs为你打工 体验到的博主Dan Shipper第一时间录视频激动地分享:一个改变游戏规则的功能。在他的演示中,按过去的工作流程还需要手动把与ChatGPT对话内容复制到笔记软件Notion里。现在,只需要一个@,喊接入笔记软件接口的NotionGPT过来,无需切换窗口就能自动总结整个对话并保存。更多网友体验后发现,这还意味着不同的GPTs之间从此可以共享上下文。整个GPT Store中GPTs的数量已经超过300万,结合多款GPTs打造和执行工作流程,也就是让去AI打工,自己当老板。未来人们的工作方式将被完全改变。读论文+复现代码一条龙已经用上新功能的网友们搭配不同GPTs玩出了不同花样。长期霸占“趋势榜”前十的论文解读工具Ai PDF和编码工具Grimoire就擦出了这样的火花。先@Ai PDF解读事先准备好的讨论LoRA技术的论文:然后继续问它论文中是否有实现LoRA的Python代码:Ai PDF表示论文中没有直接给出具体的Python代码,但提供了Roberta、DeBERTa、GPT-2的模型checkpoint链接。下一步网友直接@Grimoire,让它根据上面Ai PDF对LoRA的描述信息,为其编写代码。结果Grimoire真的给出了一个在PyTorch中实现LoRA简化版的Python代码:总结这种玩法,就是用Ai PDF根据论文总结技术实现方法,然后让Grimoire根据方法,直接编写出实现技术的代码。下面这位网友的玩法是,自己组建一支“专业团队”:好家伙,CPO、CFO、投资人一应俱全。这可把另外大批还没更新这个功能的网友给羡慕毁了:这次更新改变的不只是用户使用ChatGPT与GPTs的方式,同样让GPTs开发者打开了新思路。开发者Yohei总结道:不必花太多精力在外部存储数据了,现在ChatGPT对话本身就能承担这个角色。当GPTs是可组合的,我会构建更多专注单一功能的GPT,而不是少量多功能GPT。也有人开始畅想,再下一步或许会是不同GPTs之间相互交谈、嵌套调用,需要人类介入的场合越来越少了。GPT-4.5取消,直奔5代原本这个时间,要发布的应该是下一代模型,而不仅仅是功能补丁。但匿名爆料者传来突发消息,GPT-4.5版本已被取消。这意味着OpenAI要直接跳到GPT-5了,不过据业内人士判断不会早于今年第二季度。跳过一整个版本的原因,或许是OpenAI感受到来自竞争对手越来越多的压力,GPT-4.5的升级幅度已经不再能保证领先地位。在lmsys大模型竞技场中,谷歌Bard(Gemini Pro)排名正在飙升,人类评分甚至超越了GPT-4的几个版本,离最新版差距也不大了。另外开源模型Mistral Medium也挤到前5的位置。有创业者认为这是一个决定性的时刻,特别是考虑到Gemini Pro的API价格要比GPT-4便宜太多,差距约有40倍。要知道Gemini Pro在发布时,无论性能还是价格都是对标GPT-3.5的。不知道谷歌是更新了版本还是一直在继续训练,总之现在性能接近GPT-4,但还保持GPT-3.5水平的价格,一下子惊艳了所有人。当然也有人猜测,谷歌可能已经在偷偷测试超大杯Gemini Ultra版本了,只是API上的标签还没改。参考链接:[1] ... PC版: 手机版:

封面图片

OpenAI 官方 16 个 GPTs 提示词分析。

OpenAI 官方 16 个 GPTs 提示词分析。 花了点时间读完了官方默认的 16 个 GPTs,从写作助手、数学老师到菜谱助手等等,这些 GPTs 充分地展现了 GPT-4/4V 的能力。 从提示词写法上来说,可以归类为三种。 1. 根据我的推测,是用 GPT Builder 创建的。提示词比较简单。主要就是指定名字、主要用途、注意事项、语言风格。没有详细的例子或者规则。 你如果读过 GPT Builder 自动生成的 Instruction,只要一读这个提示词,就能感觉出来。参考图一。 这其中包括以下 4 个 GPTs: - Math Mentor - The Negotiator - Sous Chef - Creative Writing Coach 2. 手动写的,但是用的非常简单通用的结构。手动指定目标 (goal) 和语言风格 (style),最多增加一些具体的样例。参考图二。 这其中包括以下 2 个 GPTs: - genz 4 meme - ChatGPT Classic (啥也没定义) 3. 看上去很复杂,但实际上相似度 80%。可以先瞅一眼图三。 看上去很唬人。但实际上我们只需要关注 # 号开头的部分。从图三可以看到,里面包含了几个 # 号开头的段落: # Tools ## python ## browser ## myfiles_browser 我们知道,GPT-4/4V 有最基本的 4 个能力,分别是: - Data Analysis 可以生成并执行代码 (python) - 浏览器可以查询互联网 (browser) - DALL.E 图片生成和处理 (dalle) - 上传文件量化作为知识库 (myfiles_browser)。 ## 开头的提示词段落,就是在分别定义这个 GPT 里用到这些功能的时候的流程和注意事项。 上面已经包含了 3 个,剩下一个就是 ## dalle,在图四可以看到。 忽略 ## dalle 段落,你会发现,图四中,## myfiles_browser 和 ## python 跟图三是一样的。 而剩下的其他 GPTs 几乎都是这样的结构,只是复制过去的功能不一样,有些只需要 ##browser,有些需要的功能多一点。 所以我说,它们相似度 80%. 10 个 GPTs 用到的功能如下:

封面图片

最近我做了一个打标助手GPTs,感觉特别实用,推荐给大家!

最近我做了一个打标助手GPTs,感觉特别实用,推荐给大家! 主要功能:上传任意一张或多张图片,打标助手就会自动识别图像内容,并返回给你适用于 AI 模型训练标注的图像描述。 使用链接: 支持一次性上传 10 张图片进行标注(图一) 识别效果上,精准度明显优于 Clip 和 Blip2 这两个打标常用的AI模型(图二) 风格兼容上,几乎没有限制(图三) 还可以结合Dalle3,根据返回的描述生成同类图(图四) What’s Next! 因为 ChatGPT 中一次最多只能上传10张图片,且返回的标注需要手动复制,效率有限。 于是@晨然的好奇屋 和我决定把这个GPTs工具化,做一个真正可以批量打标,并批量下载标注的平台。 这两天就会发布,大家期待一下吧!( ´▽` )ノ

封面图片

建 GPTs 的时候,如果你的数据是一个开放的网站,那就不要用爬虫把网站爬一遍了,直接用 Web Browsing + 搜索语法

建 GPTs 的时候,如果你的数据是一个开放的网站,那就不要用爬虫把网站爬一遍了,直接用 Web Browsing + 搜索语法就行了。 比如,如果你想建立一个和虎嗅网对话的机器人,那就直接在 Prompt 里这么写: 1. 当得到一个问题时,首先在搜索相关问题(使用“site:")。 2. 使用在上述步骤中获得的上下文作为参考来生成流畅的答案。 如果答案不清楚,请适当推理。 3. 你永远不会引用以外的任何网站。 同一段 prompt 里可以加入多个网站把语法写好就行,比如"site: or site:"就是同时对话虎嗅和钛媒体两个网站。 这个方法依赖 Bing 国际版对网站的收录,如果你发现 Bing 对网站收录不佳,可以关掉官方的 Web Browsing 换用 Webpilot,后者会首选 Google。 在 GPTs 里启用 Webpilot 的方法,详见它们的官方博客:

封面图片

ℹ经过一个月,OpenAI 终于重新开放 ChatGPT Plus 订阅#

ℹ经过一个月,OpenAI 终于重新开放 ChatGPT Plus 订阅# 上个月中时,OpenAI 突然宣布暂停停止接受新的 ChatGPT Plus 订阅用户,相信让不少想尝试 GPTs 机器人、GPT-4 的...

封面图片

终于来了!Open AI 将于下周开放 GPTs 商店。

终于来了!Open AI 将于下周开放 GPTs 商店。 如果你的GPTs 想要上架的话需要满足下面三个条件: 1)查看 Open ai的 使用政策和GPT 品牌指南,以确保你的GPTs 合规。 2)验证你的构建者配置文件(设置 > 构建者配置文件 > 启用你的姓名或经过验证的网站)。 3)将你的 GPTs 发布为“公开”(选择“任何有链接的人”的 GPTs将不会显示在商店中) - 有自己比较火的 GPTs 的可以准备一下了,没有的现在搞也来得及。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人