GPT-4V 开启了AI 多模态时代
GPT-4V开启了AI多模态时代越来越多人拿到ChatGPT新的多模态能力,让我们先望梅止渴,看看海外玩家们如何探索出的大批新场景和应用案例;相信你也和我一样能意识到,GPT-4V正在推动世界进入全新的阶段。无论你是学生、父母、老师、医生、程序员、设计师、创作者、工程师,或是传统农业和制造业,都能在以下场景找到启发。教学场景。Peteryang演示了一个教育场景:他使用ChatGPT的图像识别和分析能力,他的孩子讨论了人体结构,从大脑到心脏的精确说明令人振奋。提示词只有一句:“我现在一年级。给我解释一下。”这代表着学生将进入前所未有1:1的个性化指导时代。(图1)停车场景。面对眼花撩乱的停车指示牌,Peter还请GPT-V智能识别并推理分析了一下具体的可行性,「请一句话告诉我:现在周三下午4点,我能在这停车吗?」结果秒出~(图2)饮食健康。MckayWrigley测试了GPT-4V作为健康管理工具的能力,智能分析了图片中所有的蔬菜水果「转换」成了基于热量、蛋白、脂肪的结构化数据(Json格式便于后续编程,图3)故事脚本分析。MckayWrigley还让GPT-V分析了《盗梦空间》的设计图标,发现ChatGPT对图表的结构和流程、各个部分的位置有着深入的理解,并能够连贯、智能地将其拼凑在一起。(图4)图片对照。AndrewMorgan发现GPT-V非常擅长对比图片差异。「找不同」功能看起来微不足道,但是想一想库存管理、取证扫描、甚至制造业等生产场景,他认为视觉智能的应用前景不可估量。(图5)学术研究。教授EthonMollick让GPT-4V识别了一个手稿,识别率惊人的高。他认为对于许多学术领域来说,这可能会是一件大事,特别是因为AI还可以对文本进行「推理」。(图6)室内设计。PietroSchirano请GPT-4V给出了改进建议,结合自定义说明将其进行了个性化建议中,从颜色到触感(图7)。Pietro感到难以置信!摄影技巧。Pietro还尝试GPT-4V对指定的摄影作品给建议,其专业建议的推理能力令人大开眼界。参数设置建议,如图8。
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人