AIGC Weekly #12更新了,本期主要介绍了我制作的8K分辨率高清AI壁纸,GPT-4以及能力推测。下面是上周一些行业动
AIGC Weekly #12更新了,本期主要介绍了我制作的8K分辨率高清AI壁纸,GPT-4以及能力推测。下面是上周一些行业动态和产品推荐,更多详细的内容可以去图里的竹白查看: 本周精选: 我制作了一批AI生成的桌面壁纸: GPT-4要来了?-推测多模态模型的能力: 微软Kosmos-1模型论文: 谷歌PaLM-E模型介绍: GPT-4可能具备的能力: - 引入了视觉智商测试集,用于诊断 MLLM 的非语言推理能力。 - 无OCR阅读理解:输入屏幕截图、扫描文档、街道标志或任何包含文本像素。直接推断内容而不需要明确使用OCR。这对于在多媒体网页上解锁AI应用程序或来自真实世界摄像头的“野外文字”非常有用。 - 多模态聊天:关于一张图片进行对话。甚至可以在中途提供“后续”图像。 - 广泛的视觉理解能力,如字幕、视觉问答、物体检测、场景布局、常识推理等。 - 音频和语音识别(?):这个没有在Kosmos-1论文中提到,但Whisper已经成为OpenAI API,并且应该很容易集成。 产品推荐: Fini-将知识库转换为聊天机器人: OpenGPT-快速创建你自己的AI应用: OpenAI Translator-基于Chat GPT的桌面翻译工具: Logoscapes-将你的LOGO融入到现实照片中: Invideo-快速将你的想法制作为视频: Poe-现在体验最好的聊天机器人产品:
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人