Vercel昨晚推出了 AI SDK 3.0 ,其中这个生成UI的功能太强了,比之前的V0进步非常大。

Vercel昨晚推出了 AI SDK 3.0 ,其中这个生成UI的功能太强了,比之前的V0进步非常大。 比如下面这个演示,可以生成股票交易中的所有可交互组件。感觉很快会有在聊天机器人中展示自动生成组件的产品。 这里试试:

相关推荐

封面图片

试了一下lllyasviel的Web UI分支Forge,太强了。

试了一下lllyasviel的Web UI分支Forge,太强了。 在我的电脑上测试的时候图片生成速度快了一倍左右,Web UI需要3.7秒的图Forge只需要1.9秒。 而且lllyasviel还在Forge预装了很多非常有用的功能,比如提高图像质量的FreeU以及可以帮助SD1.5直接生成大图的Kohya的HRFix。 如果你平时就是用Web UI画画图不装一些奇怪复杂插件的话,或者你的显卡比较差,都推荐替换为Forge。 安装方式直接从下面链接替换整合包就行,如果你需要用你WebUI的模型文件的话可以鼠标右键用记事本打开web ui根目录的webui-user.bat文件。 把第二张图位置加上这段内容就行,文件夹目录改成你需要的目录(注意斜杠):ckpt-dir D:/sd/novelai-webui-aki-v2/models/Stable-diffusion vae-dir D:/sd/novelai-webui-aki-v2/models/VAE lora-dir D:/sd/novelai-webui-aki-v2/models/Lora gfpgan-models-path D:/sd/novelai-webui-aki-v2/models/GFPGAN esrgan-models-path D:/sd/novelai-webui-aki-v2/models/ESRGAN controlnet-dir D:/sd/novelai-webui-aki-v2/models/ControlNet 这里安装:

封面图片

卧槽,Midreal AI这个小说生成工具太强了。

卧槽,Midreal AI这个小说生成工具太强了。 与其他LLM直接生成的所谓根本没有逻辑和情节的“小说”不同。这个产品可以生成真正的小说,逻辑性和创造力都在线,而且还加入了互动能力,每到关键节点会让你选择剧情走向,还会生成一张配图。 下面是我测试的小说的一部分,之前AI生成的小说我根本看不下去,这个居然在我些东西的时候我给听完了。我的提示词是让他生成一个黄金时代科幻风格的克苏鲁神话故事。它非常懂这些上来就把故事地点安排在了因斯茅斯镇。并且克苏鲁神话的经典元素神秘学,和神经病角色一个不少。情节和气氛渲染也很到位。 他们这么厉害主要是强在两个能力: 内存跨越技术:可以实现几乎无限的记忆保留,确保游戏体验长期无缝连接。 长篇写作能力:长篇写作能力能够让叙事从头到尾保持连贯和引人入胜。 接下来说一下如何使用,通过链接进到服务器里面,选择Start频道。输入/start回车,然后输入提示词就是你想要一个什么样的小说。 目前支持中文和英文,我看频道里有人的发了NFSW的提示词,不知道能不能生成。 产品链接: Invalid media:

封面图片

vercel的ai sdk+ chatbot都做的很方便上手,我将-chatbot项目 实践套壳gpt(chat.c

vercel的ai sdk+ai chatbot都做的很方便上手,我将ai-chatbot项目 实践套壳gpt(chat.aicube.fun),缝合langchain官方的next.js+langchain.js的示例模板https://. 一键部署到vercel,还用tauri打包成客户端,实践下来确实可以成为AI Navtive初创企业的首选框架 当然新的rsc版本,多了AI State和UI State这样的设定,开始让框架有点繁琐了,我个人是不太感冒,庆幸自己是在之前fork了这个项目,保留了简洁的chatbot框架,方便自己拓展改造。欢迎对rsc有研究的朋友指正。 感谢文章作者 @Scarlett-事业脑版 的精彩创作,期待更多好文!

封面图片

终于有时间尝试了一下这几天开放的SD视频生成项目Animatediff,下面是,卧槽这也太强了。

终于有时间尝试了一下这几天开放的SD视频生成项目Animatediff,下面是视频,卧槽这也太强了。 新版还支持镜头控制,可以说是本地版本的Pika了。生成的视频比Pika清晰多了,而且比Runway要稳定很多,再加上SD强大的模型支持,这还用啥Pika。 就是比较吃算力512的视频36帧4070ti要四五分钟。

封面图片

Magnific AI 的 Upscaler 太强了,可能是目前最强的图像放大器。除了单纯的像素放大之外,细节的修复增强也是他们

Magnific AI 的 Upscaler 太强了,可能是目前最强的图像放大器。除了单纯的像素放大之外,细节的修复增强也是他们做的最好。 经过我的实验发现:在二次元 / 摄影图像处理上的效果尤其明显。之前总觉得 Nijijourney 生成的例如新海诚风格的图像在局部细节上表现为「一团带着噪点和竖条纹理的浆糊」。现在结合 Magnific AI 之后,这感觉一下就上来了,而且放大的同时直接修复人物面部崩坏的效果也非常顶。 链接: 我说一下二次元图像的操作细节: Optimized for 选择 Art & Illustrations。(摄影的话选择 Films & Photography 效果最好) Prompt 不需要像 Midjourney 那样说得特别完整,保证主体的描述清晰即可。但是我一般都直接把 Midjourney Prompt 粘贴过来,比较省事。 Resemblance 这个参数不要向负数方向拉动,因为会严重偏离原图。所以一般保持不动或者向正数(右边)方向拉动,如果你发现二次元人物修复后的效果不太好,那就尝试把这个数值拉高一点。 HDR 的理想数值,无论是动漫、插画还是摄影,在 2~4 基本能保证一个不错的效果。 Creativity 同 HDR。 在相同的 Prompt 之下,Engine 选择 Auto 就好了,没有必要手动选择。有时候如果动漫图像过锐,我会选择 Illusio,实验发现得到的效果比较好。 Invalid media:

封面图片

Perplexity认为谷歌、Meta、马斯克和整个世界都在抄袭它

Perplexity认为谷歌、Meta、马斯克和整个世界都在抄袭它 此人便是Perplexity 的CEO Aravind Srinivas。4月12号他忽然在X平台发文,致敬自己公司的设计师,配图却是Meta AI的聊天界面。这是干啥?Aravind Srinivas紧接着用“引用源”加上Perplexity的界面截图解释:暗指Meta AI从醒目logo、标语、到加了表情包的灵感问题提示,整体页面设计全都“抄袭”了自家产品。对此评论区意见分成了两派,有的说小扎确实是能靠抄别人的东西拿奥斯卡奖。“就跟我抄高年级的期末作业一样。”“恭喜perplexity的设计师创造了新的行业模版。”另外一些网友却认为这有点牵强了,“那你要这么说,Perplexity形状是方的,meta是圆弧的…”有人也阴阳了回去:“你是说致敬ChatGPT的设计师吧?尽管Perplexity想出来把提示问题移到屏幕中间的好点子,还是恭喜你们了。”Aravind Srinivas那边似乎并不服气,凌晨四点又继续发文说:“抄袭好东西是正确的做法。我们都应该这样做。我们从Google那里借鉴了一些东西(知识卡、组件)。Google也从我们这儿借鉴了一些东西(后续问题、来源归属),OpenAI则从双方那里都借鉴了(突出链接、提供建议问题、快速查询重构)。Grok拿走了在Perplexity Discover上首次实现的新闻曝光功能。当被其他聪明的人采用时,恰恰证实了这些想法是好的。”配图是左边的Grok和右边的perplexity:好家伙,这回是Google、OpenAI、Grok都含沙射影地中枪了所有做聊天机器人的公司,不约而同抄都把Perplexity作为首要“抄袭”对象。结果被这位大哥一句话直接扎心:“我们都不知道还有Perplexity Discover这种东西存在。”“任何人都可以复制想法,然后加上你自己的特色。世界就是这样的,天性如此,我们当然也可以这样做。”网友让Srinivas别抱怨了。再说那什么Discover,本质上不就是 News Feed吗?那可不是Perplexity发明的,Google的搜索引擎里已经有这个功能十几年了。说起来,这也不是Aravind Srinivas第一次“指责”别人借鉴他的劳动成果了。今年一月时,贾扬清在X上发布了一个基于LeptonAI 云平台的对话式搜索引擎 demo,用500行Python代码轻松实现了类似Perplexity的效果。这个“Lepton Search”的后端是Mixtral-8x7b 模型,接入Bing 搜索 API,用户输入问题后就能返回答案、引用来源和相关问题。LeptonAI通过这个演示向大家展现了现在构建一个人工智能应用有多简单。换句话说,等于把Perplexity这个产品 “剥皮”了。它的前端设计的确看起来很fancy,但技术门槛其实很容易实现。这很快引来Srinivas的空降,转发贾扬清的推文并用一贯“委婉”的语气内涵道:“很高兴看到 Perplexity 成为未来融资动作的标杆,包括前 Meta 和阿里巴巴高管都来取经!Perplexity 的影响力已经不局限于产品本身,而是辐射到了整个科技生态和行业发展,令人振奋!”双方粉丝当时也各执一词。支持Perplexity的人认为Lepton就是抄袭,反对方觉得Lepton只是通过演示证明自己的能力,再说你perplexity也没有知识搜索专利,着实是反应过度了。贾扬清也没有示弱,表示自己搭建这个demo的灵感来自于和微软技术专家@youwu_5u喝咖啡时,关于 RAG 的效果究竟是源自搜索还是大模型的讨论,并以代码全部开源正面回击。所以从现在Srinivas又“出征” Meta和Grok,我们也看出来了,Perplexity还真是时刻处于战备状态,觉得全世界都在抄它!不过来来回回,好像指责的总是离不了“创意、界面设计、功能”上的抄袭,除此之外再无其它。有网友无情戳穿,“这是不是因为,Perplexity明白,自己除了UI也真没什么可抄的了”。甚至有人用任何AI聊天机器人都能生成类似的前端代码,再加上一些自己的想法,就能打磨出一款全新外壳。工作流程来说,Perplexity先获取用户输入,基于实时索引重构查询,再将回答问题的任务交给大语言模型,要求它阅读所有相关链接,从中提取出相关段落整合内容返回给用户。拆解下来,本质上还是靠Google和Bing们提供的检索API和GPT-4、 Claude 3等LLM。作为一家应用类公司和API接口供应商,Perplexity并没有自己的基础大模型,默认的两款免费自研模型都是从GPT微调而来,也就没有坚固不可逾越的技术护城河。搜索体验上的优化与创新才是Perplexity最初吸引用户的法宝,也自然成为他们握紧在手里,拼命捍卫的东西。Srinivas在X发布的记录Perplexity产品构思的第一块白板尽管对于平台类公司来说,这种彼此间的“借鉴”已经太司空见惯,打车软件Uber和Lyft,点餐应用DoorDash、Uber Eats和Postmates,国内的美团和饿了么等等例子就更多。但年轻的Perplexity在还没有形成稳定而广泛的客户群,功能也比较朴素、尚未全面开花,在现金流还需要考虑卖广告来加持的情况下,这种担心随时被替代的焦虑感就更严重。甚至需要抓住一切机会去“碰瓷”,即时这看起来难免有些应激。另一个不可否认的现实是,市场上形形色色的AI初创公司们之间存在一个清晰的估值断层。那些开发了基础大语言模型或具备核心技术的OpenAI、Anthropic、Cohere、Scale AI等总是处于领先的第一梯队,而Perplexity或Poe这样的平台类公司估值一旦达到某个位置就难以突破。Poe现在冲的是最快速地集成市场上最新的大模型,以及Poe bot创作者共享经济模式,加上Quora做后备,也算找到了自己的一条路。而对Perplexity这个目前仅靠对话式搜索引擎一个饭碗的公司来说,也必须承认,创意一旦公开就不再是秘密,人人都有权利去借鉴和优化。最后也说句公道话,时至今日,作为一名Perplexity订阅用户,它对于琐碎信息的整理能力和杜绝AI幻觉的准确性,依然是吸引我的付费的点。做的最快能证明团队足够敏锐和优秀,做到最好更是需要持续研习的智慧。Perplexity与其紧盯着对手们在网上抱怨,不如放下独创性的执念,巩固优势并继续沉下心洞察市场、打磨产品,用下一个耳目一新的功能证明自己。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人