我用GPT-4帮忙写了一个浏览器扩展,帮你把Midjourney提示词和对应图片快速保存到Notion中,下面是插件的使用方式介

我用GPT-4帮忙写了一个浏览器扩展,帮你把Midjourney提示词和对应图片快速保存到Notion中,下面是插件的使用方式介绍、我总结的GPT-4使用技巧以及产品实现的具体过程。 详细的过程可以去这里查看: 插件已经开源在这里下载: 插件介绍: Prompt hunter扩展支持一键将Midjourney图片详情页的图片提示词和其他信息收集到你自己的Notion数据库中,未来也会支持保存到其他工具例如飞书语雀等。也会支持civitai等SD网站的提示词和信息收集。 本周总结的GPT-4编码技巧 在代码编写方面多做要求GPT-4的输出结果可读性会好很多 尽量让他多打log,以便能够准确定位问题 由于他的数据库就到21年很多事情不知道,所以你需要给他一些输入,例如对应产品的开发文档。比如他就认为Notion API 支持更改数据库的内容不支持为页面添加内容,于是我直接把Notion那部分的开发文档扔给它,它就会了,学习能力真的强。 还是那句话GPT-4不是全知的所以产出效果很依赖你的输入内容质量,在跟他对话的时候尽量提供详细的完整的信息 实现过程 首先这次我在描述需求的时候比之前细致了非常多我详细描述了需求的背景具体的功能,以及需求涉及到的所有交互链路,还加上了对代码的一些要求。 这次由于交互链路非常复杂学到的一个技巧就是,让他在每一个个关键节点都在控制台输出log方便调试和寻找问题,不然点开没有反应浏览器的报错又很迟钝根本找不到哪里错了。 我发现,保存的图片地址都是一个SVG根本打不开,搜了一下居然是用图片懒加载做的反爬机制。这下GPT-4帮不了我了,我必须得自己找到真正的img标签的位置,后来找了好久一层一层看。终于让我找到了。 第二个比较大的坑是MJ详情页单独作为页面打开和作为浮层打开图片部分的class名称是不一样的,导致我找了很久打了好几个log才定位了问题。 最后为了保证表单的填写体验我对扩展浮层和设置页面的样式都做了视觉和交互上的优化。 感谢各位能够看到这里,如果觉得我的内容对你有帮助也欢迎转发给你的朋友或者同事。

相关推荐

封面图片

插件arxiv2notion

插件arxiv2notion 插件功能:将论文摘要保存到Notion 支持平台:#Chrome 插件简介:一款可以一键将arXiv论文保存到Notion中的浏览器插件。 它基于Notion API开发,需要先在Notion中创建一个数据库,并添加相应的属性。然后,在浏览器中打开任意arXiv论文,选择要保存到的Notion页面,点击“Add to Notion”按钮,就可以将论文的元数据(如标题、作者、摘要等)导入到Notion中。 插件下载:点击下载 频道 群聊 投稿 商务

封面图片

我用GPT-4帮忙写了一个Midjourney增强插件,下面是插件的使用方式介绍、我总结的GPT-4使用技巧以及产品实现的具体过

我用GPT-4帮忙写了一个Midjourney增强插件,下面是插件的使用方式介绍、我总结的GPT-4使用技巧以及产品实现的具体过程,还有如何用AI工具帮助宣传产品。 详细的过程可以去这里查看: 插件已经开源在这里下载: 插件介绍: 像我这种英语不好的人使用Midjourney的时候一个很痛的痛点就是提示词的翻译,使用正常的翻译工具要不只能一个词一个词翻译,要不就只能整段翻译。所以就有了这个插件,主要功能是按照提示词作者原有的语义分割自动翻译提示词的部分,同时可以快速复制原有提示词。 总结的GPT-4编码技巧 信息输入: -提前自己梳理需求内容和目标,最好在别的地方先写好在粘贴进去。像平时写PRD那样,不要偷懒,你偷懒他就会教你做人,特别是复杂任务。 -按照正常的软件开发角色的和流程给他设定角色,不同角色需要做的事情开多个聊天窗口做,比如先让它输出整体架构再去另一个聊天里输出具体代码,甚至前端和后端分开,每个模块分开输出。 -详细的描述需求包括需求的背景,你希望实现的方式涉及到了哪些外部软件的联动,各个内容之间交互方式是什么样的。 期望它输出的结果:包含的内容和要求,主要是明确需要他产出的内容。 -你对内容的要求:明确一些具体的要求包括解释每一个方案选择的具体原因和相关文档、代码结构、每个关键的代码结构都要加上注释等。 优化调整: -如果在沟通过程中频繁出现问题可以采取以下方式: -一次只实现一个模块或者一个功能渐进式的推进项目,降低问题的复杂程度; -当输出结果频繁出现问题的时候重新审视你自己给出的信息,包括是否存在描述的不够全面或者有歧义; -可以从其他渠道获取一些信息,比如要求GPT给你一些官方文档的地址去查看; -如果遇到了GPT记忆的内容出现问题你需要重新完整的将现在的内容跟他同步一次。 实现过程 开始我只是粗略的跟他说了一下需求。它就输出了具体需要做的步骤和具体代码,包括追问你的需求细节,查看开发文档的建议,以及项目文件结构,每个文件的具体代码。 按照他的指导创建了文件夹、文件和需要的图标,并将代码粘贴了进去。 我按照他给的方式开始在浏览器上运行插件开始调试果不其然开始报错了,开始不断的沟通修复问题。

封面图片

换回 Flomo 记录信息的同时发现Twitter 的信息不太好同步,就自己用 GPT-4 写了一个 Twitter to fl

换回 Flomo 记录信息的同时发现Twitter 的信息不太好同步,就自己用 GPT-4 写了一个 Twitter to flomo 的浏览器插件。 发现现在上下文长度长了以后,写这种小项目的门槛更低了。总共用了不超过 4 个小时就搞完了。 下面有用 GPT-4 写这个项目的提示技巧、插件使用方法以及插件下载: ## 总结的一些技巧: 补充开发文档: 告诉 GPT 谷歌已经讲浏览器扩展的Manifest V2改为了Manifest V3,并且将对应的更改内容文档上传到 GPT,告诉他根据这个编写代码。 先实现核心能力: 建议刚开始只实现最核心的功能,对于我这个项目来说就是获取推特内容,然后传输到 flomo 。 提供必要信息: 比如 GPT 显然是不知道 Flomo 的 API 格式的,你需要把对应的文档发给他,我都是直接全选文档页面内容,然后保存成 MD 格式。 善用控制台 log 和报错信息: 刚开始如果报错可以复制报错信息让 GPT 分析并改进,如果改了几次没改好,就想办法用 log 获取更多信息,比如我这个核心功能主要有两部分,先是获取信息,然后是传输,我们需要确定是哪一步错了,就可以让他在对应阶段完成的时候在控制台打印输出的 log 信息。 及时上传代码: 发现 GPT-4 输出的代码无法与原有代码对应的时候,应该及时重新上传现在完整的代码,防止他忘的越来越多。 最重要的立刻去做: 其实没有那么难,不要想那么多我不会写提示词也没有开发经验怎么办,GPT 都会告诉你,开始问出第一个问题是最难的一步。 这是这个项目与 GPT 的完整对话记录: ## 如何使用 点击Github 页面右上角的 Code 按钮选择 Downlaod zip 按钮将插件文件下载到本地。 打开浏览器扩展页面,打开开发者模式,选择加载解压的扩展程序选择解压后的文件夹。 加载之后点开插件图标,点击 Setting 按钮,进入设置页面。 你可以在 Flomo 的扩展中心&API 页面找到你的专属 API,填写到Flomo URL输入框就行。 Content Prefix是你希望同步到 flomo 时内容的标签,主要填写时前面需要加#。 点击Save 之后就可以使用了,支持右键保存到 Flomo 以及点击插件图标内的Send Current Flomo 保存。

封面图片

今日重磅: Open AI 正式推出 GPT-4!

今日重磅: Open AI 正式推出 GPT-4! 在演示视频中,GPT-4 可以实现: - 问它如何清洁装满食人鱼的鱼缸里面?( 回答惊喜连连~) - 自动编写一个python脚本来分析我的月度财务情况(支持主流编程语言) - 分析、理解图片,并「预测」可能性(这里的预测太酷了: 杠杆那头的棒球会被击飞) 综合来说: GPT-4 是多模态。直接读取图片和文档等应用场景。 (多模态意味着机器拥有了更多维度的输入数据处理能力,类似生物有了多感官能力。) GPT-4的高级推理能力超过了ChatGPT。 上下文理解巨幅提升。 GPT-4能够处理超过25,000字的文本,允许使用案例,如长形式的内容创建,扩展的对话,以及文件搜索和分析。 中文准确度大幅提升。 更多请访问Open AI官网: Invalid media:

封面图片

插件Notion Web Clipper

插件Notion Web Clipper 插件功能:网页剪藏 支持平台:#Chrome #Safari #Firefox 插件简介:Notion官方的网页剪藏插件,可以将网页内容保存到Notion中。 包含功能: ◉ 可以在任何你想保存的网页上点击Notion图标,选择你想要添加的工作区和页面 ◉ 可以创建一个新的数据库来保存你的网页,也可以搜索已经存在的页面或数据库 ◉ 可以修改保存的网页的标题,也可以添加标签、其他属性、评论和编辑 ◉ 可以在任何设备上阅读你保存的网页,无论在线与否 ◉ 可以在Chrome、Firefox和Safari浏览器上使用这个插件,也可以在iOS和Android手机上使用分享功能来保存网页 插件下载:点击下载 频道 群聊 投稿 商务

封面图片

RT JiayuanOpenAI 刚刚发布了 GPT-4

RT Jiayuan OpenAI 刚刚发布了 GPT-4 GPT-4 是大型多模态模型(large multimodal model),支持图像和文本的输入,并生成文本结果。 这个 thread 会汇总一下有关 GPT-4 的一些信息(包括论文中的一些要点和实际的体验)。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人