AIGC Weekly #12更新了,本期主要介绍了我制作的8K分辨率高清AI壁纸,GPT-4以及能力推测。下面是上周一些行业动
AIGCWeekly#12更新了,本期主要介绍了我制作的8K分辨率高清AI壁纸,GPT-4以及能力推测。下面是上周一些行业动态和产品推荐,更多详细的内容可以去图里的竹白查看:https://op7418.zhubai.love/posts/2246868665025081344本周精选:我制作了一批AI生成的桌面壁纸:https://mbd.pub/o/bread/ZJaWm5huGPT-4要来了?-推测多模态模型的能力:https://www.heise.de/news/GPT-4-is-coming-next-week-and-it-will-be-multimodal-says-Microsoft-Germany-7540972.html微软Kosmos-1模型论文:https://arxiv.org/abs/2302.14045谷歌PaLM-E模型介绍:https://palm-e.github.io/GPT-4可能具备的能力:-引入了视觉智商测试集,用于诊断MLLM的非语言推理能力。-无OCR阅读理解:输入屏幕截图、扫描文档、街道标志或任何包含文本像素。直接推断内容而不需要明确使用OCR。这对于在多媒体网页上解锁AI应用程序或来自真实世界摄像头的“野外文字”非常有用。-多模态聊天:关于一张图片进行对话。甚至可以在中途提供“后续”图像。-广泛的视觉理解能力,如字幕、视觉问答、物体检测、场景布局、常识推理等。-音频和语音识别(?):这个没有在Kosmos-1论文中提到,但Whisper已经成为OpenAIAPI,并且应该很容易集成。产品推荐:Fini-将知识库转换为聊天机器人:https://www.usefini.com/OpenGPT-快速创建你自己的AI应用:https://open-gpt.app/OpenAITranslator-基于ChatGPT的桌面翻译工具:https://github.com/yetone/openai-translatorLogoscapes-将你的LOGO融入到现实照片中:https://logoscapes.ai/Invideo-快速将你的想法制作为视频:https://invideo.io/ai/Poe-现在体验最好的聊天机器人产品:https://poe.com/
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人