今天候机的时候看到一款很特别的“AI 硬件”产品,给我留下了深刻印象。

今天候机的时候看到一款很特别的“AI 硬件”产品,给我留下了深刻印象。 先介绍一下这款产品,它叫诗歌相机(Poetry Camera),看着和一个拍立得相机并无二致,一切不同发生在用户按下快门之后。 完成拍摄后,相机吐出的不是相纸,而是一张印有一首诗歌的小纸条,就好像拍立得当场洗出了一张照片。诗歌纸条的内容,是 GPT-4V 基于用户拍摄的画面本身的元素/颜色/情绪等等信息,生成的一首小诗。 这款产品给我的冲击之处在于,最先进的前沿技术代表与老式的仪式感代表在这款产品上得到了融合,特别是还是借助的诗歌这个载体。 它不仅使用了拍立得这个具有特殊意义的相机形态作为载体(拍摄立刻出片,不可修图,不可保存电子档),并且在输出件上再做了一层减法连图片都不保留,诗歌就是这一瞬间保存的唯一载体,连文字都以实体的纸条形态承载,不可被修改,不可被直接转发。 而这样一个略带复古和仪式感的流程,中间最核心的部分则是由最前沿的多模态大模型完成图像输入到诗歌生成输出的。 这个新旧的交融很打动我。 而且和给出的画面已有基本预期的拍立得比起来,生成诗歌结果的不确定性也许更让人期待。 这还是一个开源项目,开发者已经在 Github 上公开了详细的 DIY 教程( API,你也可以打造一个属于自己的拍立得(写诗版)。 这里是官网链接:

相关推荐

封面图片

这只猫在 Instagram 上已经拥有近 50 万粉丝。它甚至有自己的网站。这只猫的外表给所有订阅者留下了深刻印象。毕竟,At

这只猫在 Instagram 上已经拥有近 50 万粉丝。它甚至有自己的网站。这只猫的外表给所有订阅者留下了深刻印象。毕竟,Atchum 看起来像太空传奇“星球大战”中的英雄之一 - Chewbacca

封面图片

【生活随感】十几年前读《古拉格群岛》时,里面有一段话给我留下了极深的印象。

【生活随感】 十几年前读《古拉格群岛》时,里面有一段话给我留下了极深的印象。 索尔仁尼琴写道:“苏联大吹大擂地把第一颗人造卫星发射到天上去的那天,在梁赞,正对着我的住所的窗口,有两对穿着犯人外套和棉裤的自由妇女用抬斗把灰浆抬上四层楼。” 在有人病死、有人饿死、有人自杀、还有更多人求医无门的年,我听着电视机里长篇累牍的关于神舟十三号的报道时,仿佛走进了某种时间隧道。 他们根本没变。

封面图片

搞笑演员出身的泽连斯基,3年前摇身一变成为乌克兰总统。他拒绝撤离、毅然留守首都基辅抗衡俄军的作风,相信给各位读者留下了深刻的印象

搞笑演员出身的泽连斯基,3年前摇身一变成为乌克兰总统。他拒绝撤离、毅然留守首都基辅抗衡俄军的作风,相信给各位读者留下了深刻的印象。 Reddit有名用户就感叹道:「乌克兰人投票给一个傻瓜,选出了一名总统;其余国家的人投票选总统,却选出来一堆傻瓜。」 Posted by IG @glozr_ #乌克兰 #ukraine #kyiv #泽连斯基 #总统

封面图片

Google Labs推出一款名为NotebookLM的AI笔记本产品,这是一种全新的笔记工具。旨在通过总结信息、解释复杂的想法

Google Labs推出一款名为NotebookLM的AI笔记本产品,这是一种全新的笔记工具。旨在通过总结信息、解释复杂的想法和头脑风暴新的联系,帮助用户更快地获得洞见。使用人工智能技术来帮助用户处理和理解信息。 这款产品是“基于你自己的文档”的,这意味着它会使用你提供的文档作为信息源,然后基于这些信息为你提供服务。这样,你就可以得到一款完全个性化的AI笔记工具,它能理解你的需求,帮助你更有效地处理和理解信息。 主要功能包括: 1.总结信息:NotebookLM可以自动阅读和理解你的文档内容,然后为你生成一个简洁的摘要,帮助你快速把握文档的主要内容和关键信息。 2.解释复杂的想法:如果你的文档中包含一些复杂的概念或想法,NotebookLM可以帮助你理解这些复杂的内容。它可以将复杂的概念用简单易懂的语言解释清楚。 3.头脑风暴新的联系:NotebookLM可以帮助你发现文档内容之间的新的联系和关联。比如,它可能会发现你的两篇文档虽然主题不同,但是其中的某些观点或信息是相互关联的。 NotebookLM的一些关键点: 1.以AI为首的笔记本:NotebookLM以强大的语言模型为核心设计。它是一种新型的笔记软件,旨在帮助人们更快地学习。目前对美国的一小部分用户开放。 2.解决信息过载:该产品旨在帮助用户处理信息的快速增长。它旨在帮助用户从多个来源综合事实和想法,并更快地建立联系。 3.NotebookLM的特性:该产品允许用户将语言模型基于他们的笔记和来源,创建一个熟悉他们相关信息的个性化AI。用户可以选择特定的Google Docs来基于NotebookLM。该产品可以生成摘要,回答关于文档的问题,并帮助用户提出创新的新想法。 4.隐私和安全:模型只能访问用户选择上传的源材料,用户与AI的文件和对话对其他用户不可见。收集的数据不用于训练新的AI模型。 || #工具 #笔记工具

封面图片

百乐红酒爆香烟解析:‌百乐红酒爆珠香烟‌是一款结合了红酒香气与爆珠设计的香烟产品,旨在为烟民提供一种独特的吸烟体验。这款香烟产自

百乐红酒爆香烟解析: ‌百乐红酒爆珠香烟‌是一款结合了红酒香气与爆珠设计的香烟产品,旨在为烟民提供一种独特的吸烟体验。这款香烟产自美国,最初专为女性设计,因其丰富的口味,特别是水果爆珠系列,在全球范围内广受欢迎。 首先,从外观上看,百乐红酒爆珠香烟的包装以葡萄酒红为主色调,搭配简约的白色,盒上精致的小壁虎图案与下方的立体爆珠相映成趣,整体设计既吸引眼球又富有特色。 打开包装,一股诱人的红酒香味扑鼻而来,穿透力极强。烟支入口淡雅舒适,纯净的烟气中带有香甜的味道,过喉丝滑柔顺。特别的是,这款香烟设计了爆珠元素,当烟民捏碎爆珠时,浓郁的红酒味道在口腔中瞬间爆发,甜香醉人,还带有丝丝清凉的感觉,这种独特的体验让人欲罢不能。 此外,百乐红酒爆珠香烟的焦油含量为9mg,烟气烟碱量为0.7mg,提供了不同于传统香烟的吸烟感受。对于热爱红酒或追求独特口味的烟民来说,百乐红酒爆珠香烟无疑是一款不可多得的选择,它不仅满足了人们对香烟口感的需求,还通过创新的葡萄酒味爆珠设计,让人们在享受香烟的同时,也能感受到红酒的馥郁醇香。 综上所述,百乐红酒爆珠香烟以其独特的口感设计和红酒香气的融合,为烟民带来了全新的吸烟体验,成为市场上备受瞩目的产品之一‌。

封面图片

在MWC体验AI Pin:不会取代手机 但点燃了AI硬件之火

在MWC体验AI Pin:不会取代手机 但点燃了AI硬件之火 和之前预料的差不多,AI 成了这届 MWC 大会的重中之重,各式各样围绕 AI 进行设计和产品定义的硬件设备,更是现场最受关注的品类之一,甚至就连在场外,苹果放弃造车据传也是因为战略重心转向 AI。但说回 AI 相关硬件,除了 AI 手机、AI PC,过去一年最受关注和期待的产品应该就是以 AI Pin、rabbit r1 为代表的独立 AI 终端,按照计划,它们都将在今年 3 月、4 月正式发货在宣布放弃传统智能手机新项目All in AI时,魅族曾提到这两款AI新物种,不过魅族认为这两款AI新物种都不够完美,因此魅族要做更好的AI终端。2月29日晚魅族将新发布的魅族21 Pro定义为“AI入场券”。那么AI Pin、rabbit r1体验到底如何?1月,雷科技CES报道团曾深入聊过 rabbit r1 这款全新形态的产品,而在本次 MWC 现场,我的同事“一位天明”就在高通展台体验了听闻已久 AI Pin,结合他的分享,我们对 AI Pin 这款产品有了新的认识。挂在胸前的 AI 助理,还长了“眼睛”了解过 AI Pin 的读者应该知道,AI Pin 是一款没有屏幕的独立穿戴设备,搭载了高通骁龙八核芯片,通过 eSIM 支持网络连接,不依赖于手机或者其他个人终端,将语音作为核心的交互方式,但其实还支持激光投射、手势以及触摸(机身表面)三种交互。不过总的来说,AI Pin 最主要的使用方式还是“对话”。就像手机或者智能音箱上接入大模型的 AI 助手一样,用户可以问各种问题来获取所需信息,还支持 50 种语言的实时翻译,可以将用户的语言实时翻译成另一种语言,或是将他人的语言翻译成用户的母语。图片来源:HumaneAI Pin 虽然没有屏幕,但也是有图形用户界面。当用户需要查看信息的时候,AI Pin 可以通过内置的单色激光投射到手掌上浏览,同时支持手势交互,通过手指的点按进行导航。The Verge 记者还指出,AI Pin 的手势比他想象得更加流畅和灵敏。这在很大程度上可能受益于 AI Pin 对视觉大模型的关注。AI Pin 搭载了一颗广角摄像头,当然不是为了拍照,核心是成为 AI Pin 的“眼睛”,并利用大模型了解摄像头捕捉的画面,比如在 MWC 现场就能“看到”这是一个人声鼎沸的会场,或者对面人的穿着打扮。另外值得一提的是,AI Pin 的穿戴设计可能是最容易被忽略的地方之一。打造 AI Pin 的 Humane 公司之所以将其设计成挂在胸前的设备,核心还是为了让 AI Pin 拥有更接近用户第一人称视角,可以“观察”用户看到的现实世界。这也是很多人对于 AI Pin 最期待的地方。回想一下,OpenAI 去年发布 GPT-4 的时候,就特意演示过让 GPT-4 通过照片了解冰箱里的“材料”,并以此给出一份合适的菜谱。理论上,通过视频获取的信息密度远高于照片,而“看我所看”的 AI Pin,确实有潜力成为真正意义上的“AI 助理”,一个能看不能动的“具身智能”。理想丰满现实骨感,AI Pin面临不少挑战AI Pin也不是第一款想通过机器视觉技术来解决人机交互问题的设备,早在2012年Google就推出了Glass,后来国内的百度跟着做了一款智能眼镜百度Eye,它们当时的故事是视觉搜索,用户戴着眼镜就能“指哪打哪”,然而受限于硬件算力、深度学习算法的智能水平、续航以及网络,智能眼镜并未取得成功,成了先烈,不过,它们在这一阶段的探索也给后来的AR眼镜等相对成熟的品类奠定了基础。图片来源:Google Glass大模型时代AGI(通用型人工智能)有了更强的感知能力,同时也具备了理解与模拟真实世界的能力,基于此拥有真正的认知能力。在此基础上,AI硬件被寄予厚望,AI Pin也是希冀用新一代AGI技术来实现Google、百度们探索失败的智能视觉交互。图片来源:Open AI Sora然而,目前视觉大模型方面的技术还难以支撑识别万物,AI Pin 通过摄像头了解到的现实世界信息还很有限,视觉交互在短期内很难做到完全可用。续航也是一个问题。AI Pin 采用了分体式的设计,由一个 AI Pin 本体和一个通过磁铁连接的无线充电宝(他们叫做 Battery Boost)组成,Humane 公司还专门设计了热更换的电池以延长续航时间,但就算是总的续航时间,也停留在“轻度负载能坚持大半天”的水平。而这还是建立在少用或者不用激光投射的基础上,毕竟激光在这样一个小型设备上确实是非常耗电的。还存在算力的问题。据雷科技了解,AI Pin 采用了混合模型,设备本身的算力极其有限,端侧模型只用来处理语音识别以及基本操作等需要快速响应的请求,更多的处理还是交给云端模型进行处理。但云端处理就必然涉及到连接和延迟问题,还要再加上模型生成的时间,在 MWC 现场的演示中,AI Pin 往往就需要等待好几秒才能给出回应。对于语音交互来说,无疑是很糟糕的体验。更何况,语音交互还存在严重的局限性,网友当年对锤子 TNT 的群嘲都还历历在目。当前,AI硬件的重点攻克方向就是端侧算力的提升,除了给终端装配更强大的AI芯片外,在MWC24上联发科甚至展示了“多设备共享算力”技术即让A设备可将闲置算力共享给B设备来进行大模型等巨量计算,然而这样的计算模式又需要新的边缘侧网络技术的支持,有挑战,也有机会。不可能取代手机,点燃了AI硬件的星星之火“手机能做的,AI Pin 都能做。”Humane 的工作人员在现场讲解时提到,AI Pin 的终极目标是取代手机。但 AI Pin 真的可能取代手机成为下一代的个人计算平台吗?恐怕没有多少人相信,不管是在现场的雷科技编辑,还是 The Verge、DIgital Camera World 在内的媒体明确指出自己的质疑,包括语音交互的局限性,算力、隐私与体验之间的权衡,以及大量具体到产品体验的实际问题。更何况,这是一款售价高达 699 美元(约合人民币 5029 元)起的设备,有网友就吐槽得好,“有这钱为什么不换个好点的手机。”事实上也是,AI Pin 能做的,理论上都能通过手机做到,并且考虑到更强大的算力、屏幕和软件生态,手机大概率会做得更好,这也是包括 rabbit r1 在内所有独立 AI 终端所面临的挑战。不过也要承认的是,受限于设计和形态,手机很难像 AI Pin 一样挂在胸前,很方便就能让机器“观察世界,回答一切”,这其实也是可穿戴计算设备一直备受追捧的一个重要原因,单单是从口袋拿出 → 解锁 → 呼出相应界面,这几步就能制造足够的“摩擦”,劝退用户随时随地“召唤”AI 助理。从这个角度来看,手机相比 AI Pin 或者 Vision Pro 这类穿戴设备确实存在天然的问题。所以 AI Pin 的成功或失败其实不重要,更关键的问题可能是:可穿戴的 AI 终端能不能在手机全面 AI 化的未来找到生存的空间,甚至在技术的进一步突破之后,成为下一代个人计算平台?这当然还是一个没有答案的问题,但可以相信,一定会有人和厂商继续沿着这条路进行探索,而 AI Pin 正是这样的一次探索,哪怕AI Pin像Google Glass一样一败涂地,但它至少点燃了一团AI硬件的星星之火,包括荣耀、OPPO、三星、魅族、小度、Rabbit在内的越来越多厂商正在AI硬件的路上,勇往直前。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人