成了,成了,我的爬虫成了。不需要插件,不需要下载Python,102 部电视剧的评分,2 分钟就爬完了。

成了,成了,我的爬虫成了。不需要插件,不需要下载Python,102 部电视剧的评分,2 分钟就爬完了。 代码是 ChatGPT 给的,提示词是“我有 100 部电视剧,想在 colab 上,使用Python爬虫,在豆瓣上爬他们的评分,请问具体可以怎么操作呢?”的大白话。 返工过 2 版。 第一版因为豆瓣有反爬虫机制,每部电视剧都显示“未找到评分”,报错给ChatGPT后,它自己添加额外的请求头(headers); 第二版是我自己的原因,我想看到每一步的反馈,方便不满意及早调整。它说可以使用Python的print函数或其他日志记录方法,来输出当前正在处理的电视剧名称和已完成的数量,然后有改了段代码。 之前,也试过用 ChatGPT 的联网功能和联网插件去爬,但联网功能的爬虫太老实,看到反爬虫机制就作罢了;webpilot 等联网插件则太不老实,爬出来的结果乱七八糟,早就不是豆瓣上的真实数据了。 更早的时候,也有想过用chrome浏览器上的Web Scraper 插件爬。不过,每一部剧都需要重新搜一遍,印象中Web Scraper 不太能胜任。以往我都是搜完某个关键词之后,用Web Scraper把网站上的所有结果全部爬一遍。 我爱ChatGPT和colab,对我这种非技术人员实在太友好了。没学过 Python 没关系,没学过爬虫没关系,只要敢问,ChatGPT 真的敢教,colab 也真的能实现。#AI工作流

相关推荐

封面图片

Python超强爬虫 8天速成爬取各种网站数据实战案例(完整版)

Python超强爬虫 8天速成爬取各种网站数据实战案例(完整版) 描述:本套课程分为两部分。第一部分为基础+进阶篇,其中会深入浅出且从0到1的讲解爬虫在各个维度的使用技能。让大家可以快速实现爬虫入门。其次,入门后,会传授大家相关异步爬虫的技能,可以使得大家可以快速的提升爬取数据的效率,其中包含,线程池,生产者消费者模式,多任务异步协程和scrapy框架。 第二部分为爬虫逆向专题课程 链接: 大小:未知 标签:#学习 #知识 来自:雷锋 版权: 频道:@shareAliyun 群组:@aliyundriveShare 投稿:@aliyun_share_bot

封面图片

#投稿 匿名投稿#Python crawlTelegraph

#投稿 匿名投稿 #Python crawlTelegraph 【简介】:一个批量爬取Telegraph中图片的程序 【起因】: 因为看到一个COSER挺漂亮的,所以想下载她的资源。但是呢,找是找到了,只不过是放在Telegraph中的。这如果是一张一张下吧,效率特别低。要是用浏览器插件吧,我又不太乐意。 所以就自己动手用Python写了一个爬虫。 【查看详情】:

封面图片

ChatGPT推出插件和浏览版+相关评论

ChatGPT推出插件和浏览版+相关评论 ChatGPT 现在有了“插件商店”可以下载第三方插件来扩展其实际应用。演示了找餐馆,提供菜谱,算卡路里,网购食材。而ChatGPT浏览版弥补了数据落后(只到2021年)且不能联网的问题。现在可以通过搜索给出与时俱进的答案,并列出引用来源,用户可以查看来源辨别真伪。 :OpenAI 设计的插件系统是我这辈子见过的最疯狂的系统。如果你要给它写插件,你并不是去写这个插件的程序,你是写一个关于插件的描述,用你的自然语言,然后 GPT 来帮你生成这个插件。 :十年前,当一个人跃跃欲试要给新发布的 iPhone 写 APP 的时候,ta必须自己是个非常老练的程序员才行。今天,当你跃跃欲试要给新发布的 GPT 平台写插件,你只要用自然语言描述你希望实现的效果就行了。OpenAI 的网站上有一个展示了如何在几分钟之内完全用自然语言跟 GPT 交互写一个让 AI 帮你记住私人 todo list 的插件。换句话说,这就是(至少作为胶水语言层级的)自然语言编程。 如果这条路能走通,如果这成为行业标准,那么……Python 终于没有存在的意义了? 来源 ,, 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人