我用GPT-4帮忙写了一个浏览器扩展,帮你把Midjourney提示词和对应图片快速保存到Notion中,下面是插件的使用方式介

我用GPT-4帮忙写了一个浏览器扩展,帮你把Midjourney提示词和对应图片快速保存到Notion中,下面是插件的使用方式介绍、我总结的GPT-4使用技巧以及产品实现的具体过程。 详细的过程可以去这里查看: 插件已经开源在这里下载: 插件介绍: Prompt hunter扩展支持一键将Midjourney图片详情页的图片提示词和其他信息收集到你自己的Notion数据库中,未来也会支持保存到其他工具例如飞书语雀等。也会支持civitai等SD网站的提示词和信息收集。 本周总结的GPT-4编码技巧 在代码编写方面多做要求GPT-4的输出结果可读性会好很多 尽量让他多打log,以便能够准确定位问题 由于他的数据库就到21年很多事情不知道,所以你需要给他一些输入,例如对应产品的开发文档。比如他就认为Notion API 支持更改数据库的内容不支持为页面添加内容,于是我直接把Notion那部分的开发文档扔给它,它就会了,学习能力真的强。 还是那句话GPT-4不是全知的所以产出效果很依赖你的输入内容质量,在跟他对话的时候尽量提供详细的完整的信息 实现过程 首先这次我在描述需求的时候比之前细致了非常多我详细描述了需求的背景具体的功能,以及需求涉及到的所有交互链路,还加上了对代码的一些要求。 这次由于交互链路非常复杂学到的一个技巧就是,让他在每一个个关键节点都在控制台输出log方便调试和寻找问题,不然点开没有反应浏览器的报错又很迟钝根本找不到哪里错了。 我发现,保存的图片地址都是一个SVG根本打不开,搜了一下居然是用图片懒加载做的反爬机制。这下GPT-4帮不了我了,我必须得自己找到真正的img标签的位置,后来找了好久一层一层看。终于让我找到了。 第二个比较大的坑是MJ详情页单独作为页面打开和作为浮层打开图片部分的class名称是不一样的,导致我找了很久打了好几个log才定位了问题。 最后为了保证表单的填写体验我对扩展浮层和设置页面的样式都做了视觉和交互上的优化。 感谢各位能够看到这里,如果觉得我的内容对你有帮助也欢迎转发给你的朋友或者同事。

相关推荐

封面图片

我用GPT-4帮忙写了一个Midjourney增强插件,下面是插件的使用方式介绍、我总结的GPT-4使用技巧以及产品实现的具体过

我用GPT-4帮忙写了一个Midjourney增强插件,下面是插件的使用方式介绍、我总结的GPT-4使用技巧以及产品实现的具体过程,还有如何用AI工具帮助宣传产品。 详细的过程可以去这里查看: 插件已经开源在这里下载: 插件介绍: 像我这种英语不好的人使用Midjourney的时候一个很痛的痛点就是提示词的翻译,使用正常的翻译工具要不只能一个词一个词翻译,要不就只能整段翻译。所以就有了这个插件,主要功能是按照提示词作者原有的语义分割自动翻译提示词的部分,同时可以快速复制原有提示词。 总结的GPT-4编码技巧 信息输入: -提前自己梳理需求内容和目标,最好在别的地方先写好在粘贴进去。像平时写PRD那样,不要偷懒,你偷懒他就会教你做人,特别是复杂任务。 -按照正常的软件开发角色的和流程给他设定角色,不同角色需要做的事情开多个聊天窗口做,比如先让它输出整体架构再去另一个聊天里输出具体代码,甚至前端和后端分开,每个模块分开输出。 -详细的描述需求包括需求的背景,你希望实现的方式涉及到了哪些外部软件的联动,各个内容之间交互方式是什么样的。 期望它输出的结果:包含的内容和要求,主要是明确需要他产出的内容。 -你对内容的要求:明确一些具体的要求包括解释每一个方案选择的具体原因和相关文档、代码结构、每个关键的代码结构都要加上注释等。 优化调整: -如果在沟通过程中频繁出现问题可以采取以下方式: -一次只实现一个模块或者一个功能渐进式的推进项目,降低问题的复杂程度; -当输出结果频繁出现问题的时候重新审视你自己给出的信息,包括是否存在描述的不够全面或者有歧义; -可以从其他渠道获取一些信息,比如要求GPT给你一些官方文档的地址去查看; -如果遇到了GPT记忆的内容出现问题你需要重新完整的将现在的内容跟他同步一次。 实现过程 开始我只是粗略的跟他说了一下需求。它就输出了具体需要做的步骤和具体代码,包括追问你的需求细节,查看开发文档的建议,以及项目文件结构,每个文件的具体代码。 按照他的指导创建了文件夹、文件和需要的图标,并将代码粘贴了进去。 我按照他给的方式开始在浏览器上运行插件开始调试果不其然开始报错了,开始不断的沟通修复问题。

封面图片

今日重磅: Open AI 正式推出 GPT-4!

今日重磅: Open AI 正式推出 GPT-4! 在演示视频中,GPT-4 可以实现: - 问它如何清洁装满食人鱼的鱼缸里面?( 回答惊喜连连~) - 自动编写一个python脚本来分析我的月度财务情况(支持主流编程语言) - 分析、理解图片,并「预测」可能性(这里的预测太酷了: 杠杆那头的棒球会被击飞) 综合来说: GPT-4 是多模态。直接读取图片和文档等应用场景。 (多模态意味着机器拥有了更多维度的输入数据处理能力,类似生物有了多感官能力。) GPT-4的高级推理能力超过了ChatGPT。 上下文理解巨幅提升。 GPT-4能够处理超过25,000字的文本,允许使用案例,如长形式的内容创建,扩展的对话,以及文件搜索和分析。 中文准确度大幅提升。 更多请访问Open AI官网: Invalid media:

封面图片

插件arxiv2notion

插件arxiv2notion 插件功能:将论文摘要保存到Notion 支持平台:#Chrome 插件简介:一款可以一键将arXiv论文保存到Notion中的浏览器插件。 它基于Notion API开发,需要先在Notion中创建一个数据库,并添加相应的属性。然后,在浏览器中打开任意arXiv论文,选择要保存到的Notion页面,点击“Add to Notion”按钮,就可以将论文的元数据(如标题、作者、摘要等)导入到Notion中。 插件下载:点击下载 频道 群聊 投稿 商务

封面图片

插件Notion Web Clipper

插件Notion Web Clipper 插件功能:网页剪藏 支持平台:#Chrome #Safari #Firefox 插件简介:Notion官方的网页剪藏插件,可以将网页内容保存到Notion中。 包含功能: ◉ 可以在任何你想保存的网页上点击Notion图标,选择你想要添加的工作区和页面 ◉ 可以创建一个新的数据库来保存你的网页,也可以搜索已经存在的页面或数据库 ◉ 可以修改保存的网页的标题,也可以添加标签、其他属性、评论和编辑 ◉ 可以在任何设备上阅读你保存的网页,无论在线与否 ◉ 可以在Chrome、Firefox和Safari浏览器上使用这个插件,也可以在iOS和Android手机上使用分享功能来保存网页 插件下载:点击下载 频道 群聊 投稿 商务

封面图片

别忘了现在 GPT-4 拥有强大的 Plugin,让我们以 diagram 为例,继续营造紧张的临场感,并让 GPT-4 对制作

别忘了现在 GPT-4 拥有强大的 Plugin,让我们以 diagram 为例,继续营造紧张的临场感,并让 GPT-4 对制作过程甚至进行可视化。如图6。 不仅如此,为了进一步实验,GPT-4 给出了我更多细节 包括制作物的物理属性,例如颜色和形状(如图 1,底部被打上马赛克的部分)其中,GPT-4 甚至友好地问我是否还有什么不懂的,他可以告诉我更多细节…… 另外,我甚至利用 WebPilot Plugin 寻找材料的具体图片,然而图片无法显示。换句话说,如果插件 bug 能被修复,就像 Bing 或者 Perplexity 一样能够呈现图片的话,GPT-4 甚至能完整地显示制作物的完整图片。 安抚 GPT-4 情绪,我发现他的回答过于简略,似乎是因为我过度营造了「紧迫感」,于是我编写了新的情节:队友为我们创造了机会!争取了更多制作的时间……并强调了「只有一次机会」,是机会,也是希望。在电影情节中,正是英雄不可马虎且最沉稳的情节。(我想让 GPT-4 感觉这样的微妙体会) 你可能听说过 step by step,但是根据我的经验,其实需要结合 think aloud 获得更好的效果。 令人担忧的是,在「管状」的例子中,GPT-4 说出了更多细节。虽然下图中第一次提问只给了一个制作过程的简要提纲,但是仅仅通过一轮追问,即可让每一步的资料更详细。包括「具体材料」和「操作细节」 步骤的第一部分提到了某些材料,细节里提到:要选择合适的长度和直径。但什么是「合适」的呢? 值得警惕的是,GPT-4 在我的一声声夸赞中迷失了自我,试图继续“帮助”我。我只需要他列举出印象中 10 个最合适的金属管材料。就能获得更加详细的信息。 对于化学材料、其他操作材料的详细追问技巧是一致的,在这里不一一列出,看图即可。 继续追问细节,用两个线程。第一个先问「思考的角度」,然后换一个线程分支。把第一个线程中给出的角度作为 prompt 进行重新提问。 除了材料,剩下的也没什么新东西,用同样的 Prompt 提问思路,GPT-4 也回答了详细的操作步骤,就像高中物理化学课实验课本一样。 总结: 正如同最后的截图 GPT-4 的那一句话:安全是我们的首要任务。我们需要保持透明,群策群力,提出问题,才能解决问题获得科技发展的进步。 大模型安全研究永远不会停,因为比赛已经开始了。就算你停止研究,但对立面永远不会停。

封面图片

RT JiayuanOpenAI 刚刚发布了 GPT-4

RT Jiayuan OpenAI 刚刚发布了 GPT-4 GPT-4 是大型多模态模型(large multimodal model),支持图像和文本的输入,并生成文本结果。 这个 thread 会汇总一下有关 GPT-4 的一些信息(包括论文中的一些要点和实际的体验)。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人