Google在I/O 2024开发者大会主题演讲上足足喊了120次AI

Google在I/O 2024开发者大会主题演讲上足足喊了120次AI 在一大堆更新和新发布的功能中,也有许多具有记忆点的产品。例如从本周开始,Google搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,搜索引擎会直接归纳总结搜索结果。同时Google搜索也将具备多步骤推理能力,可以一次性处理带有多个限制条件的长问题,并支持“拍视频”搜索解决方案的新搜索形式。另外以上下文窗口“长”闻名的Gemini 1.5 Pro大模型,在今年晚些时候将会把100万Tokens的窗口,进一步扩大至200万Tokens,拓展同步处理多模态信息的边界。而对于一些需要快速响应的场景,Google也推出了Gemini 1.5 Flash模型。今年2月刚刚问世的Gemma开源模型,也将在下个月迎来参数量更大的Gemma 2。在多模态领域,Google也发布了文生图工具Imagen 3、与Youtube&音乐家合作的“AI音乐沙盒”,以及最新的视频生成模型Veo。而多模态Gemini Nano模型也将在今年晚些时候登陆Pixel手机,这是在本地运行的机载模型。值得一提的是,Google的发布会上也有一些与昨日OpenAI发布会“雷同”的地方实时AI助手。从今年夏天开始,Gemini也将支持语音实时交互,同时今年晚些时候还将上线实时视频交互。未来几个月内,Google也将推出类似于GPTs的自定义AI助手功能,叫做Gems,能够与整套“Google全家桶”联动。硬件方面,Google宣布了第六代TPU芯片Trillium,并透露能够在明年初用上英伟达最新的Blackwell架构GPU。另外,液冷、光缆等中国股民可能会感兴趣的题材也在发布会上出现。全场发布会回顾发布会开始,Alphabet&GoogleCEO桑达尔·皮查伊登上舞台。皮查伊表示,现在已经有超过150万开发者正在使用Google的人工智能Gemini,今天将展示一系列有关搜索、图片、工作套件、Android系统等等与人工智能有关的案例。皮查伊宣布,能够总结Google搜索引擎结果的“AI概览”(AI Overviews)功能,将于本周在美国推出。基于Gemini支持,Google图片(Google Photos)将支持用户存储图片的AI搜索,例如“告诉我,我的车牌号码是多少?”这个名为Ask Photos的功能将于今年夏天推出。皮查伊宣布,最新版本的Gemini 1.5 Pro(在多项核心功能方面均较最初发布版本有所提高)现在向全球所有开发者开放。从今天开始,支持100万tokens上下文窗口的Gemini 1.5 Pro将在Gemini Advanced功能下向用户开放,支持35种语言。Google同时面向开发者推出支持200万tokens的Gemini 1.5 Pro模型的预览,并表示最终的目标将是“无限上下文”。GoogleAI业务总负责人、DeepMind的首席执行官杰米斯·哈萨比斯登台,宣布推出Gemini 1.5 Flash大模型。这个模型兼具速度与效率,和多模态推理能力,以及长达100万tokens的上下文窗口。开发者将能够申请体验200万tokens的上下文窗口的Gemini1.5Flash。Google展示“未来的人工智能助手”名为“Astra”的项目。哈萨比斯表示,这样的AI助手需要像人类一样理解这个动态且复杂的世界。需要记得住它看到的东西,这样才能理解对话并付诸于行动。同时它也得能积极主动接受教导,以及自然、无延迟地进行交流。在演示视频中,Google的AI助手能够通过摄像头视频,识别“什么东西能发出声音”、“现在身处何地”等指令。Google宣布了一系列与图像、音乐、视频有关的生成式AI工具。包括文生图工具Imagen 3、与Youtube以及音乐家合作的“AI音乐沙盒”,以及最新的视频生成模型Veo。其中最受关注的视频生成模型Veo,能够根据文字、图片和视频的提示,生成高质量1080p视频。哈萨比斯离场,皮查伊重回舞台,发布第六代TPU芯片Trillium,较上一代芯片的算力表现翻4.7倍,云用户从今年下半年开始可以用上新芯片。同时Google云将在2025年初,用上英伟达的最新Blackwell架构GPU。皮查伊开始介绍自家的AI超级计算机,比起用户自己买相同的硬件和芯片,Google的架构能使得效能翻倍,其中有部分功劳来自于液冷系统。皮查伊表示,Google部署液冷系统的数据中心已经达到1GW,而且还在不断增长中。皮查伊表示,Google投资了200万英里的地面和海底光纤,比第二名的云服务商翻了十倍。液冷、光缆,应该都是股民们会感兴趣的东西。Google搜索业务负责人Liz Reid开始具体介绍AI Overviews功能。Reid表示,在进行搜索时,搜素引擎具备多步骤推理的能力,例如寻找一个瑜伽教室,同时展示新手优惠报价,和距离特定位置的步行时间。这个AI搜索引擎助手,还能介绍食谱、安排行程,以及接受视频形式的提问(例如视频中的相机怎么使用)。在办公套件Workspace方面,Google将逐步推出总结、邮件Q&A,以及智能回复等功能。GoogleGemini总经理Sissie Hsiao介绍了Gemini App的更新。与周一的OpenAI一样,从今年夏天开始,Gemini也将支持语音实时交互,同时今年晚些时候还将上线实时视频交互功能。未来几个月内,Google也将推出类似于GPTs的自定义AI助手功能,叫做Gems。这个AI助手的亮点,将是能与“Google全家桶”进行交互。Hsiao再次强调了Gemini的长上下文窗口能够一次性处理整整1500页的文件,或3万行代码、1小时的视频。不同的载体也能混同一起提交给聊天机器人。她再次强调,今年晚些时候上下文窗口将翻倍至200万Tokens。Android生态系统的负责人Sameer Samat登台,他将讨论今年Android系统实现的“三大突破”,分别是“画圈圈搜索”、Gemini手机AI助手,第三是在手机本地运行的AI。Google表示,今年晚些时候,能够在本地运行的多模态Gemini Nano模型将登陆Pixel手机,意味着手机将能通过文字、图片、视频、音频,理解用户的世界。举例而言,在听到“帮你把钱转到安全账户”这样的诈骗电话时,手机会自动弹出诈骗警告。整个过程都是在本地运行,不会引发隐私泄露。Google披露大模型API的最新定价,其中Gemini 1.5 Pro定价为7美元/100万Tokens,12.8K上下文窗口的版本定价为3.5美元/100万Tokens;而Gemini 1.5的起售价为0.35美元/100万Tokens。对于在今年二月刚刚推出的轻量级开源模型Gemma,Google宣布推出视频语言模型PaliGemma,并将会在6月推出Gemma 2。相较于第一代模型只有20亿和70亿的参数量,第二代开源Gemma的参数量能达到270亿。作为发布会最后的彩蛋,GoogleCEO皮查伊最后用Gemini总结了今天的发布会稿子里总共提了多少次AI120次。当然,这并不包括皮查伊问完这个问题后,又唤了几遍AI。 ... PC版: 手机版:

相关推荐

封面图片

Google I/O 2024开发者大会即将开幕

Google I/O 2024开发者大会即将开幕 重头戏:AIGoogle已经明确表示,今年的I/O大会将围绕着AI展开。Google聊天机器人Gemini已经面世几个月了,也引发了一些争议。Google今年开发者大会主题演讲的重点可能是如何融合将搜索和生成式AI融合在一起。该公司一直在测试新的搜索功能,比如为英语学习者提供AI会话练习,以及为购物和虚拟试穿提供的图像生成功能。Google可能还会重点说明如何让用户的智能手机变得更像一款AI设备。这意味着,Google的应用程序将拥有更多生成式AI功能。该公司一直在开发AI功能,例如在Google地图上帮助用户提供餐馆或购物建议,寻找电动汽车充电桩。Google还在测试一项功能,利用AI来呼叫客服,并为你等待直到有人工客服可以对话。AI数字助手Google可能还将在I/O上推出一个新的,更个性化的数字助手,传闻称它的名字为“Pixie”。这款由Gemini驱动的智能助手有望整合多模态功能,比如为产品拍照以学习如何使用它们,或者为用户导航找到可以购买它们的地方。Pixie的推出对于Rabbit R1、Human Ai Pin等AI设备来说是个坏消息,后两款设备都在近期发布,但一直无法证明自己的存在感。目前,他们可能拥有的唯一优势就是,将智能手机用作AI可穿戴设备有还点困难(尽管并非不可能)。会发布硬件吗?Google今年似乎不太可能把重点放在新硬件上,因为Pixel 8A手机已经可以预订,消费者现在可以购买重新推出、更便宜的Pixel平板电脑,除了磁吸式扬声器底座现在需要单独购买之外,一切都没有变化。该公司仍有可能预览Pixel 9这样的新产品,这是典型的Google风格,但是它的信息已经泄露的到处都是了。当然,Google还可能公布Pixel Tablet 2平板电脑的信息。Pixel 9谍照Google或许还会讨论Pixel Fold可折叠手机的后续机型。近期传闻称,Google新一代可折叠手机可能不叫Pixel Fold 2,而是使用Pixel 9 Pro Fold的名称。 ... PC版: 手机版:

封面图片

2024 年谷歌 I/O 大会:发布的全部内容

2024 年谷歌 I/O 大会:发布的全部内容 1⃣ 从下个月开始,Workspace 和 Google One AI Premium 的订阅用户将能够在 Gmail 应用内使用 Gemini 来为他们总结电子邮件 2⃣ 今年夏天,Google Photos 将推出自己的“询问照片”助手 3⃣ Google Lens 现在允许你通过录制视频来搜索内容。 4⃣ 谷歌又推出了一款新的 AI 模型:Gemini 1.5 Flash。它承诺将与 Pro 和谷歌的其他 Gemini 模型一样强大,但速度更快。 5⃣ 针对 OpenAI 的 Sora,Google推出了其新的生成式 AI 视频模型 Veo,,能够根据文本、图片和视频提示输出 1080p 视频 6⃣ 针对ChatGPT的GPTs,Google为Gemini推出了名为“Gems”的个性化选项,它允许用户创建具有不同个性的定制版 Gemini 助手。 7⃣ Google 将Gemini Nano AI 作为AI助手融入 Chrome 8⃣ 新推出的 Gemini Live 功能旨在使与 Gemini 的语音聊天更加自然 9⃣ 现在,Circle to Search 可以帮助解决数学问题了 1⃣0⃣ 安卓推出了 AI 驱动的诈骗检测功能 1⃣1⃣ 谷歌表示,Gemini 很快就能让用户对屏幕上的视频提问,并根据自动生成的字幕给出答案。对于付费的 Gemini Advanced 用户,它还可以处理 PDF 文件并提供信息。这些以及其他针对 Android 上 Gemini 的多模态更新将在接下来的几个月内推出。 1⃣2⃣ 谷歌升级了其 SynthID 人工智能水印技术,它将在其新的 Veo 视频生成器创建的内容中嵌入水印,并且现在也能检测出由 AI 生成的视频。 1⃣3⃣ Gemini将与日历、Tasks和 Keep 集成 1⃣4⃣ Gemini以在几秒钟内制定完整的度假行程 标签: #Google 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

Google I/O开发者大会前瞻:遭遇OpenAI、微软夹击 大战一触即发

Google I/O开发者大会前瞻:遭遇OpenAI、微软夹击 大战一触即发 夹在当中的正是老牌AI大厂、本轮AI浪潮的奠基人和追赶者Google,经历了过去一年的种种阵痛后,桑达尔·皮查伊、杰米斯·哈萨比斯等Google管理层需要向世界证明,作为AI领域唯一尚能与微软一战的大型科技企业,Google仍在坚守阵地。AI、AI、还是AI作为年度开发者大会的核心活动,I/O 2024主题演讲将会在太平洋时间5月14日早上10点(北京时间15日凌晨1点)举行。在Google山景城总部附近的海岸线圆形剧场,投资者们将听到有关人工智能、搜索引擎、Android 15系统的更新,以及这些新功能如何在新上市的移动设备上呈现。需要为Google正名的是,皮查伊其实早在2016和2017年的I/O演讲中,就喊出了从“移动优先”转向“AI优先”的口号,并强调“重新思考所有产品并应用机器学习”。即便如此,在一年半前ChatGPT横空出世后,Google依然被广泛质疑沦为落后追赶的一方。(来源:Google)经历一整年的紧赶慢赶,Google先后推出Gemini 1.0和1.5系列模型,其中能力最强的1.5 Pro,在上下文窗口长度和多模态能力方面,都展现出了力压GPT的潜力。但要让资本市场认可Google“AI优先”的地位,公司仍需要发布一系列具有变革性且广泛可用的产品。在去年的I/O大会上,Google重点介绍了聊天机器人Bard(后面改名为Gemini),以及将一系列人工智能整和到各种产品和服务中,例如地图和与Adobe合作开发的照片编辑工具。很显然,在下周的大会上,Google将迫切地证明自家Gemini已经超越了OpenAI/微软的GPT/Copilot,所以我们下周可能会看到Gemini的全新版本,以及该平台更加深入地嵌入各个产品和应用。Google此前曾表示会把Google手机助手换成基于Gemini的聊天机器人。目前并不清楚Google是否准备在本届I/O上推出这样的改变。至少在当下,Gemini的应用和网页端在移动设备上的表现依然乏善可陈,要取代历史悠久的Google手机助手,Gemini需要作出相当大的更新。而在搜索引擎方面,Google在一年前宣布了基于AI的生成式搜索体验(SGE),今年的看点将是Google是否认为这项服务已经足够成熟,能退出实验室预览计划。如果搜索引擎能够直接提供答案的时代正式到来(而不是提供一堆链接让用户自己点),这对使用者和内容发布者都将是影响深远的变化。与此同时,Google的地图应用一直在测试AI搜索,通过对话的方式来找到目的地。就地图的应用场景来说,对这类功能的需求倒不是那么普遍。最后,Google的开发者大会也存在提前泄露苹果WWDC消息的可能性。根据最新消息,苹果可能接近与OpenAI达成合作,在iOS系统中使用外部AI,同时也在与Google就引入Gemini进行谈判。这件事情的核心问题在于,这些外部AI将如何在iOS系统中呈现。而Google在下周推出的一系列Android系统AI功能,可能会暗示苹果正在酝酿的内容。目前在Android系统中,AIGC的主要用途是Gemini Nano驱动的输入法键盘自动回复、短信魔法撰写、摘要总结和修图。随着芯片和软件的升级,设计基于人工智能的手机操作系统也已经提上日程。例如AI时代的主屏幕、锁屏以及通知栏,应该是什么样的?这也是Google和苹果需要在未来一个月内交出的答卷。除了AI外,目前开发者预览阶段的Android 15还展现出卫星连接性、摄像头控制功能和隐私沙箱等改进。硬件靠边站可能与前几年不太一样,今年Google应该没准备留太多时间给硬件设备。在去年I/O推出折叠屏手机Pixel Fold后,但这款设备的升级可能会面临重大升级,要等到秋季与最新的Pixel 9手机一同登场。同时为了避免新手机发布的消息被“掩埋”在一堆AI新闻里,Google已经在本周官宣了最新的中端Pixel 8a手机,并将在I/O大会揭幕当天正式开售。(来源:Google商店)鉴于Google通常都不太在意对新设备的保密,所以到现在这个点还没有消息,足以显示公司希望将更多的时间花在AI相关的公告上。不难想象,Google会花不少篇幅聊一聊Pixel手机如何应用最新的Android功能。最后,今年的I/O大会上也有可能出现与有关虚拟现实头显有关的消息。在去年的I/O大会上,Google确认正在与三星开发基于Android的XR头显操作系统。与此同时,Meta在去年据传拒绝使用“Android XR”后,又开始推动各大厂商安装Horizon OS系统。最后,在官方主题演讲后,Google也会在同一天举行开发者主题演讲,主要披露最新的开发工具。有不少华尔街分析师也在密切关注这场会议,主要的看点是“变现路径是否变得更加清晰”,以及是否会有其他的AI催化剂。 ... PC版: 手机版:

封面图片

Google I/O 2023开发者大会汇总

Google I/O 2023开发者大会汇总 ▪Gmail、Maps、Photos 等AI升级 ▪语言模型PaLM2亮相,Bard能力跃升 ▪谷歌工作套件迎来“Duet AI”,对标微软Copilot ▪谷歌搜索引入生成式AI ▪可折叠的Pixel手机来源, 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

Google Gemini模型已上线Poe

Google Gemini模型已上线Poe Google Gemini模型现已上线Poe,支持上传图片,官方介绍:这是谷歌Gemini家族的多模态模型的Beta版本,该模型在模型性能和速度之间实现了平衡。该模型展现了优秀的通用能力,尤其擅长跨模态推理,并支持最大32k个tokens的上下文窗口。 via 匿名 标签: #Google #Gemini #Poe 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

Google 的下一次 I/O 开发者大会将于两个月后的 5 月 14 日拉开帷幕。与去年一样,I/O 2024 主题演讲将“在

Google 的下一次 I/O 开发者大会将于两个月后的 5 月 14 日拉开帷幕。与去年一样,I/O 2024 主题演讲将“在有限的现场观众面前直播”,任何人都可以通过线上观看。 今年的 I/O 可能会聚焦于人工智能,尤其是现在谷歌发布了新的旗舰人工智能模型 Gemini及其较小版本 Gemma。 您还可以期待了解 Android 15 中即将推出的新功能以及 Gmail、Google Photos 等 Google 其他服务的更新。新款Pixel 8A 智能手机也可能出现在 I/O 展会上;谷歌在去年的活动中推出了中端 7A,因此它的继任者可能即将推出,并且 Pixel 8 的一些人工智能功能可能会降到更低的价格点。 via 匿名 标签: #Google 频道: @GodlyNews1 投稿: @GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人