谷歌宣布正式推出Germini1.5Flash,该模型速度更快,体积更小,部署更加灵活,并支持多模态。

None

相关推荐

封面图片

【#谷歌正式推出Germini1.5Flash】谷歌宣布正式推出Germini1.5Flash,该模型速度更快,体积更小,部署更

封面图片

中信证券:谷歌 Gemini 模型发布,AI 进入多模态时代

中信证券:谷歌Gemini模型发布,AI进入多模态时代中信证券研报指出,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemini模型作为谷歌以及全球范围内最先发布的多模态模型,在性能上是第一个在MMLU上超越人类专家的模型。模型根据体量大小分为GeminiUltra、GeminiPro、以及GeminiNano三个版本,支持在云端以及边缘测运行。同时谷歌同步发布最新版本的计算芯片TPUv5p,相较上一代TPUv4性价比提升2.3倍。我们认为,多模态Gemini模型的正式发布,一方面可以拓宽应用场景的拓展,另一方面能够带来算力需求的持续升级。我们持续看好后续AI产业的前景,认为后续GPT-5等模型的发布亦将带来更多的催化。

封面图片

xAI 推出首个多模态 AI 模型 Grok-1.5V

xAI推出首个多模态AI模型Grok-1.5V马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力,Grok还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中,Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中,Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像,旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

封面图片

赶在谷歌Gemini发布前 OpenAI要抢发“多模态”大模型

赶在谷歌Gemini发布前OpenAI要抢发“多模态”大模型然而,OpenAI又要来截胡了。据媒体最新报道,OpenAI正在积极努力将多模态功能(类似于Gemini预计提供的功能)纳入GPT-4,目标赶在Gemini发布前推出多模态大型语言模型(MLLM),即代号为Gobi的下一代大型语言模型,以击败谷歌并保持领先地位。随着ChatGPT在各领域展现出非凡能力,多模态大型语言模型近来也成为了研究的热点,它利用强大的大型语言模型(LLM)作为“大脑”,可以执行各种多模态任务。MLLM展现出了传统方法所不具备的能力,比如能够根据图像创作故事、视觉知识问答、无需OCR(光学字符识别)的数学推理等,从自然语言理解到图像解释等,提供更广泛的信息处理能力。报道称,OpenAI早在3月份发布GPT-4时就预先展示了这些功能,但除了一家名为“BeMyEyes”的公司外,没有向其他公司开放。后者主要为有视力障碍或失明的人开发移动应用程序。六个月后,OpenAI正准备在更大范围内推出被称为GPT-Vision的功能。为什么OpenAI花了这么长时间才推出这项功能?报道称主要是担心新的视觉功能会被不良行为者利用,比如通过自动解决验证码来冒充人类,或者通过面部识别来跟踪人们。但OpenAI的工程师们似乎接近于解决围绕这项新技术的法律担忧。谷歌也面临这个问题,当该公司被问及正在采取哪些措施来防止Gemini滥用时,谷歌发言人指出,该公司在7月份做出了一系列承诺,以确保其所有产品能够负责任地开发。然而,考虑到谷歌拥有与文本、图像、视频和音频相关的专有数据(包括来自搜索和YouTube等平台的数据),该行业向多模态模型的发展可能会有利于发挥谷歌的优势。一位使用过早期版本的人说,与现有的模型相比,Gemini似乎已经产生了更少的错误答案。OpenAI首席执行官SamAltman在最近的各种采访中暗示,GPT-5还没有出现,但他们计划对GPT-4进行各种增强,新的增强模型可能是其中之一。报道称,OpenAI似乎还没有开始训练Gobi,所以现在就说它最终会成为GPT-5还为时过早。在上周接受《连线》杂志采访时,谷歌CEO皮查伊表达了他对谷歌目前在AI领域地位的信心,并认可技术进步的持久性,以及他们在平衡创新与责任方面深思熟虑的战略。无论如何,这场竞赛就相当于人工智能版的iPhone与Android。人们正屏息以待Gemini的到来,它将揭示谷歌和OpenAI之间的差距到底有多大。风险提示及免责条款市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。...PC版:https://www.cnbeta.com.tw/articles/soft/1384867.htm手机版:https://m.cnbeta.com.tw/view/1384867.htm

封面图片

【xAI发布支持视觉的多模态AI模型Grok-1.5V】

【xAI发布支持视觉的多模态AI模型Grok-1.5V】2024年04月13日05点09分老不正经报道,马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力,Grok还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。在多个领域的基准测试中,Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中,Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像,旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。

封面图片

谷歌宣布推出 Gemini 1.5 闪电模型等

谷歌宣布推出Gemini1.5闪电模型等当地时间5月14日,谷歌DeepMind首席执行官宣布推出Gemini1.5闪电模型,该模型能够兼顾快速和成本效益。该公司还展示了Astra模型,该模型通过智能手机摄像头分析世界,并与用户进行对话。该公司将推出人工智能视频生成模型Veo,对标OpenAI的文生视频模型Sora。谷歌发布第六代TPU芯片Trillium。谷歌宣布推出Imagen文生图模型,相较于其他同类产品具备更高的细节调整功能,逼真的光线和更少的干扰,能够从草图快速升成高分辨率图像。安卓15已融入谷歌Gemini大模型升级后能力,Android15Beta2将在当地时间5月15日正式推出。谷歌宣布推出全新音乐工具MusicAISandbox。——财联社、、、、、

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人