《Others 之间的大厂较量:从 Galaxy S23 换回 Google Pixel,我都想了些什么?》

《Others 之间的大厂较量:从 Galaxy S23 换回 Google Pixel,我都想了些什么?》 原文中提到了一个可变字体支持问题。文章发出后,热心读者/开发者 @ 万能胶 通过 AOSP 再次提交了引入 CJK 可变字体支持的 CL,并获得了来自 Google 文字和图形团队负责人的回复。 这位负责人表示,虽然 VF 可变字体相比传统的多字重字体在体积上有优势,但仍旧会增加超过 40MB 的空间占用,此外 Google 仍需评估相关改动的内存影响。 我们关于可变字体的相关科普内容:

相关推荐

封面图片

Others 之间的大厂较量:从 Galaxy S23 换回 Google Pixel,我都想了些什么? [by 克莱德]

封面图片

三星Galaxy S24 系列需求持续高于S23 显示屏出货量5个月内增长13%

三星Galaxy S24 系列需求持续高于S23 显示屏出货量5个月内增长13% 不出所料的是,Galaxy S24 Ultra 占据了这些面板出货量的大部分,市场份额达到 46%。自 Galaxy S24 系列问世以来,显示供应链咨询公司(Display Supply Chain Consultants,DSCC)在其最新数据中显示,三星的最新产品已经超越了其前代产品。2024 年 1 月,Galaxy S24 系列的面板出货量比 Galaxy S23 高出 21%,比 Galaxy S22 更是高出 66%。最新智能手机的改进给消费者留下了深刻印象,吸引他们更换自己手中的设备。为了增加买气,三星还向那些希望成为 Galaxy S24 系列早期用户的用户提供了一些预购订单和额外积分,因此这可能也是提高面板出货量的一个因素。据 DSCC 报告,3 月份的显示屏出货量比 Galaxy S23 高出 13%,比 Galaxy S22 高出 47%,至于为什么三星在最新发布的产品上取得了更大的成功,报告给出了以下原因。"S24系列与S23系列相比之所以能实现两位数的增长,主要有以下几个因素。这些因素包括:与 S23 系列上市时价位相近的更大显示屏、所有 S24 机型均采用 LTPO 背板、非常积极的促销活动带来的强劲预购订单,以及三星在 Unpacked Event 上强调的 Galaxy AI 功能。Galaxy AI 由四个软件模型组成,包括Google的 Gemini Pro、Gemini Nano 和 Imagen 2,以及三星自主开发的 Gauss。Gemini 是一个生成式人工智能语言模型,主要用于文档摘要、翻译、搜索和聊天推荐等语言相关服务。高斯负责 13 种语言的语音识别、口译和翻译功能。Google表示,三星将成为首批测试 Gemini Ultra 的合作伙伴之一,Gemini Ultra 是规模最大、功能最强的 Gemini 模型,今年晚些时候将广泛提供给开发者和企业使用"。三星 Galaxy S 系列产品的打折速度也比竞争对手快得多,这可能会吸引消费者选择其中的一款作为他们的日常用机。虽然三星凭借 Galaxy S24 系列强势卷土重来,但这种势头能否在未来几个月延续下去还有待观察,苹果公司曾在 2023 年击败其在这一领域的最大竞争对手而成为最大的智能手机供应商,因此我们可以继续观察这家韩国巨头能否夺回失去的桂冠。 ... PC版: 手机版:

封面图片

Google图像生成人工智能Imagen 3迎来升级

Google图像生成人工智能Imagen 3迎来升级 Google人工智能研究部门DeepMind负责人德米斯-哈萨比斯(Demis Hassabis)说,与前代产品Imagen 2相比,Imagen 3能更准确地理解文字提示,并将其转化为图像,而且在生成图像方面更具"创造性和细节"。此外,该模型产生的"干扰人工智能"和错误也更少。哈萨比斯补充说:"这也是我们目前渲染文本的最佳模型,而渲染文本一直是图像生成模型面临的挑战。"为了消除人们对深度伪造可能性的担忧,Google表示,Imagen 3 将使用 DeepMind 开发的SynthID 方法,在媒体上应用隐形加密水印。在Google的ImageFX工具中可以注册 Imagen 3 的私人预览版,Google表示,该模型将"很快"提供给使用Google企业生成式人工智能开发平台 Vertex AI 的开发人员和企业客户。Google通常不会透露太多用于训练人工智能模型的数据来源,这次也不例外。这是有原因的。大部分训练数据来自网络上的公共网站、资源库和数据集。而其中的一些训练数据,特别是未经内容创作者许可的受版权保护的数据,是知识产权相关诉讼的源头。Google的网站发布者控制功能允许网站管理员阻止搜索引擎与AI爬虫从他们的网站上获取数据,包括照片和视频。但是,Google并没有提供"退出"工具,而且与某些竞争对手不同的是,Google并没有承诺对权利人(在某些情况下是在不知情的情况下)为训练数据集做出的贡献进行补偿。缺乏透明度并不令人惊讶,但令人失望的尤其是像Google这样拥有丰富资源的公司。 ... PC版: 手机版:

封面图片

从太空绘制地球水道图:SWOT卫星改变了洪水预报的方式

从太空绘制地球水道图:SWOT卫星改变了洪水预报的方式 地表水和海洋地形卫星(SWOT)旨在对地球表面的水进行首次全球调查,它将收集地球上水体随时间变化的详细测量数据。图片来源:NASA/JPL-Caltech河流、湖泊和水库就像我们地球的动脉,通过相互连接的巨大网络输送维持生命的水。当地球的水循环速度过快时,就会导致洪水泛滥,危及生命和财产安全。随着气候变化改变了降水模式,全世界越来越多的人生活在洪水易发地区,这种风险正在增加。科学家和水资源管理者使用多种类型的数据来预测洪水。今年,他们有了一个新工具:来自地表水和海洋地形(SWOT)卫星的淡水数据。美国国家航空航天局(NASA)和法国国家空间研究中心(CNES)合作建立的观测站正在测量地球上几乎所有水面的高度。SWOT 的设计目的是测量每一条宽度超过 300 英尺(100 米)的主要河流,初步结果表明它可能能够观测到更小的河流。2011 年,苏里斯河的洪水淹没了北达科他州的这个社区。美国和法国的 SWOT 卫星为科学家和水资源管理者提供了一种新的工具,用来观察三维洪水,这些信息可以改善对洪水发生地点和频率的预测。资料来源:北达科他州水务委员会溪流测量仪可以精确测量河流的水位,但只能测量个别地点的水位,而且往往相隔很远。许多河流根本没有水位计,尤其是在没有资源维护和监测水位计的国家。水位计也可能因洪水而失灵,当水位超过河岸并流入水位计无法测量的区域时,水位计就不可靠了。SWOT 能以三维方式更全面地观察洪水,测量洪水的高度、宽度和坡度。科学家们可以利用这些数据更好地追踪洪水在地形中的脉动,从而改进对洪水发生地点和频率的预测。在这张 2023 年 10 月 8 日的图片中,季风雨造成的洪水覆盖了孟加拉国东北部的广大地区。这颗由美国和法国共同研制的卫星首次以高分辨率为整个地区提供及时、精确的水面高程信息,从而改进了洪水预报。图片来源:NASA/JPL-Caltech/UNC-Chapel Hill/Google Earth建立更好的洪水模型将 SWOT 数据纳入洪水模型的一项工作由位于科罗拉多州博尔德的环境科学合作研究所 (CIRES) 的 J. Toby Minear 领导。Minear 正在研究如何将 SWOT 数据纳入美国国家海洋和大气管理局的国家水模型,该模型可预测美国河流发生洪水的可能性及其时间。SWOT 淡水数据将填补测量仪之间的空间空白,帮助 Minear 等科学家确定河流沿岸特定地点发生洪水的水位(高度)。SWOT 河流坡度数据如图所示的加利福尼亚州萨克拉门托河的坡度数据可以改善对水流通过河流和冲刷地貌的速度的预测。为了计算坡度,科学家将较低的水位(右)减去较高的水位(左),然后除以河段长度。图片来源:NASA/JPL-Caltech/UNC-Chapel Hill/Google地球他希望 SWOT 能以多种方式改进国家水模型数据。例如,它将对河流坡度以及坡度如何随水流变化提供更准确的估算。一般来说,河流坡度越陡,水流速度越快。水文建模人员利用坡度数据来预测水流通过河流和流出地表的速度。SWOT 还将帮助科学家和水资源管理者量化湖泊和水库的储水量。虽然美国有大约 90,000 个相对较大的水库,但其中只有几千个水库拥有纳入国家水模型的水位数据。这就限制了科学家们了解水库水位与周围陆地高程和潜在洪水之间关系的能力。SWOT 正在测量数以万计的美国水库,以及几乎所有大于两个足球场的美国天然湖泊。包括美国在内的一些国家在河流测量网络和详细的当地洪水模型方面投入了大量资金。但在非洲、南亚、南美部分地区和北极地区,有关湖泊和河流的数据却很少。在这些地方,洪水风险评估通常依靠粗略估计。SWOT 的部分潜力在于,它能让水文学家填补这些空白,提供有关地表蓄水量和河流流量的信息。联合国大学教堂山分校博士生玛丽莎-休斯(Marissa Hughes)用三脚架安装全球定位系统,以精确测量新西兰怀马卡里里河一段的水面高程。测量结果用于校准和验证来自美国-法国 SWOT 卫星的数据。信用:Alyssa LaFaro/NC Research美国国家航空航天局SWOT淡水科学负责人、北卡罗来纳大学教堂山分校研究员塔姆林-帕维尔斯基(Tamlin Pavelsky)说,SWOT有助于应对气候变化引发的极端风暴所造成的日益严重的洪水威胁。想想2017年的休斯顿和哈维飓风吧,"他说。"如果没有气候变化,我们不太可能在一场风暴中看到 60 英寸的降雨量。随着强降水事件变得越来越常见,社会将需要更新工程设计标准和洪泛区地图。"地球水循环的这些变化正在改变社会对洪水和洪泛区的假设,随着降雨强度的增加以及洪水易发地区人口的增长,未来全球数亿人将面临更大的洪水风险。SWOT 洪水数据还有其他实际用途。例如,保险公司可以利用 SWOT 数据建立的模型来改进洪水灾害地图,从而更好地估计一个地区潜在的破坏和损失风险。一家大型再保险公司 FM Global 是 SWOT 目前的 40 家早期采用者之一,这是一个致力于将 SWOT 数据纳入其决策活动的全球组织社区。帕维尔斯基说:"FM Global 等公司和美国联邦紧急事务管理局等政府机构可以通过与 SWOT 数据进行比较,对其洪水模型进行微调。这些更好的模型将让我们更准确地了解洪水可能发生的地点和频率。"关于任务的更多信息SWOT 于 2022 年 12 月 16 日从加利福尼亚州中部的范登堡空军基地发射升空,目前正处于运行阶段,收集的数据将用于研究和其他目的。SWOT 项目由美国国家航空航天局和法国国家空间研究中心联合开发,加拿大航天局和英国航天局也提供了支持。美国国家航空航天局的喷气推进实验室由加利福尼亚州帕萨迪纳的加州理工学院代为管理,是该项目的美国部分牵头单位。在飞行系统有效载荷方面,NASA 提供了 KaRIn 仪器、GPS科学接收器、激光反向反射器、双波束微波辐射计和 NASA 仪器操作。法国国家空间研究中心提供了多普勒轨道成像和卫星辐射定位集成系统、双频波塞冬测高仪(由泰雷兹阿莱尼亚航天公司开发)、KaRIn 射频子系统(与泰雷兹阿莱尼亚航天公司合作,并得到英国航天局的支持)、卫星平台和地面操作。加空局提供了 KaRIn 高功率发射机组件。美国国家航空航天局(NASA)提供了运载火箭和该局设在肯尼迪航天中心的发射服务计划,并管理相关的发射服务。编译来源:ScitechDaily ... PC版: 手机版:

封面图片

GPT-4o:OpenAI变慢了

GPT-4o:OpenAI变慢了 虽然Sam Altman在OpenAI线上直播前,已经预告不会发布GPT-5(或GPT-4.5),但外界对OpenAI的期待早已是九牛拉不转了。北京时间5月14日凌晨,OpenAI公布了最新的GPT-4o,o代表Omnimodel(全能模型)。20多分钟的演示直播,展示了远超当前所有语音助手的AI交互体验,与外媒此前透露的消息基本重合。虽然GPT-4o的演示效果仍可称得上“炸裂”,但业内人士普遍认为很难配得上Altman预告中的“魔法”二字。很多人认为,这些功能性的产品,都是“偏离OpenAI使命”的。OpenAI的PR团队似乎也预料到了这种舆论走向。发布会现场以及会后Altman发布的博客中对此解释道:“我们使命的一个关键部分是将非常强大的人工智能工具免费(或以优惠的价格)提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型,没有广告或类似的东西。当我们创办 OpenAI 时,我们最初的想法是我们要创造人工智能并利用它为世界创造各种利益。相反,现在看起来我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,让我们所有人都受益。”遥遥领先的GPT-4o“如果我们必须等待 5 秒钟才能得到‘每个’回复,用户体验就会一落千丈。即使合成音频本身听起来很真实,它也会破坏沉浸感,让人感觉毫无生气。”在OpenAI发布会前夕,英伟达Embodied AI负责人Jim Fan在X上预测了OpenAI会发布的语音助手,并提出:几乎所有的语音AI都会经历三个阶段:1. 语音识别或“ASR”:音频->文本1,例如Whisper;2. 计划下一步要说什么的 LLM:text1 -> text2;3. 语音合成或“TTS”:text2 ->音频,例如ElevenLabs或VALL-E。经历 3 个阶段会导致巨大的延迟。GPT-4o在响应速度方面,几乎解决了延迟问题。GPT-4o的响应音频输入的最短时长为232毫秒,平均响应时长320毫秒,几乎与人类相似。没有使用GPT-4o的ChatGPT语音对话功能平均延迟为2.8秒 (GPT-3.5) 和5.4秒(GPT-4)。您目前设备暂不支持播放GPT-4o演示直播GPT-4o不仅通过缩短延迟极大地提升了体验,还在GPT-4的基础上做了很多升级包括:极佳的多模态交互能力,包括语音、视频,以及屏幕共享。可以实时识别和理解人类的表情,文字,以及数学公式。交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌。超低延时,且可以在对话中实时打断AI,增加信息或开启新话题。所有ChatGPT用户均可免费使用(有使用上限)。速度是GPT-4 Turbo的2倍,API成本低50%,速率限制高5倍。多模态能力进步了吗?“突破模型的局限性才能有创新。”有业内专家认为,GPT-4o的多模态能力只是“看起来”很好,实际上OpenAI并未展示对于视觉多模态来说真正算是“突破”的功能。这里我们按大模型行业的习惯,对比一下隔壁厂Anthropic的Claude 3。Claude 3的技术文档中提到,“虽然Claude的图像理解能力是尖端的,但需要注意一些局限性”。其中包括:人物识别:Claude不能用于在图像中识别(即姓名)人物,并将拒绝这样做。准确性:Claude在解释200像素以下的低质量、旋转或非常小的图像时,可能会产生幻觉或犯错误。空间推理:克劳德的空间推理能力有限。它可能很难完成需要精确定位或布局的任务,例如读取模拟钟面或描述棋子的确切位置。计数:Claude可以给出图像中物体的近似计数,但可能并不总是精确准确的,特别是对于大量小物体。AI生成的图像:Claude不知道图像是否是人工智能生成的,如果被问到,可能不正确。不要依赖它来检测假图像或合成图像。不适当的内容:Claude不会处理违反我们可接受使用政策的不适当或露骨的图像。医疗保健应用:虽然Claude可以分析一般医学图像,但它不是为解释CT或MRI等复杂诊断扫描而设计的。Claude的输出不应被视为专业医疗建议或诊断的替代品。在GPT-4o网站发布的案例中,有一些与“空间推理”有相关的能力,但仍难算得上突破。此外,从发布会现场演示中GPT-4o输出的内容很容易看出,其模型能力与GPT-4相差并不大。GPT-4o跑分虽然模型可以在对话中增加语气,甚至即兴演唱,但对话内容还是与GPT-4一样缺乏细节和创造力。此外,发布会后OpenAI官网还发布了GPT-4o的一系列应用案例探索。包括:照片转漫画风格;会议记录;图片合成;基于图片的3D内容生成;手写体、草稿生成;风格化的海报,以及连环画生成;艺术字体生成等。而这些能力中,照片转漫画风格、会议记录等,也都是一些看起来很普通的文生图或者是AI大模型功能。能挑战现有的商业模式吗?“我注册5个免费的ChatGPT账号,是不是就不需要每月花20美元订阅ChatGPT Plus呢?”OpenAI公布的GPT-4o使用政策是ChatGPT Plus用户比限制普通用户的流量限制高5倍。GPT-4o对所有人免费,首先挑战的似乎是OpenAI自己的商业模型。第三方市场分析平台Sensor Tower公布的数据显示,过去一个月中,ChatGPT在全球App Store中的下载量为700万,订阅收入1200万美元;全球Google Play市场的下载量为9000万,订阅收入300万美元。目前,ChatGPT Plus在两个应用商店的订阅价格均为19.99美元。由订阅数据推断,ChatGPT Plus过去一个月中,通过应用商店付费的订阅用户数为75万。虽然ChatGPT Plus还有大量的直接付费用户,但从手机端的收入来看,每年进项才不到2亿美元,再翻几倍也很难撑起OpenAI近千亿的估值。由此来看,OpenAI在个人用户充值方面,其实并不需要考虑太多。更何况GPT-4o主打体验好,如果你跟AI聊着聊着就断了,还要换账号重新聊,那你会不会愤然充值呢?“最初的 ChatGPT 暗示了语言界面的可能性;这个新事物给人的感觉有本质上的不同。它快速、智能、有趣、自然且有帮助。”Sam Altman的最新博客中提到了“语言界面的可能性”,这也正是GPT-4o接下来可能要做的:挑战所有GUI(图形交互界面),以及想要在LUI(语音交互界面)上发力的人。结合近期外媒透出的OpenAI与苹果合作的消息,可以猜测GPT-4o可能很快就要对所有AI PC、AI手机的厂商“抛橄榄枝”或是“掀桌子”。不管是哪种语音助手或是AI大模型,对于AIPC、AI手机来说核心价值都是优化体验,而GPT-4o一下把体验优化到了极致。GPT-4o很可能会卷到所有已知的App,甚至是SaaS行业。过去一年多时间里,市场上所有已经开发和正在开发的AI Agent都会面临威胁。某位资源聚合类app产品经理曾对虎嗅表示,“我的操作流程就是产品的核心,如果操作流程被你ChatGPT优化了,那相当于我的App没价值了。”试想,如果订外卖的App,UI变成了一句话“给我订餐”,那打开美团还是打开饿了么,对于用户来说就一样了。厂商的下一步只能是压缩供应链、生态的利润空间,甚至是恶性价格战。从目前的形式来看,其他厂商要在模型能力上打败OpenAI恐怕还需要一段时间。产品要对标OpenAI,可能只有通过做更“便宜”的模型了。对于国内产业的影响“最近忙死了,没顾上关注他们。”一位工业AI大模型创始人告诉虎嗅,近期一直在忙着沟通战略合作、产品发布、客户交流资本交流,完全没有时间关注OpenAI这种发布。OpenAI发布前,虎嗅也询问了多位来自各行各业的国内AI从业者,他们对OpenAI最新发布的预测与看法都很一致:非常期待,但与我无关。一位从业者表示,从国内目前的进度来看,要在短期内追上OpenAI不太现实。所以关心OpenAI发布了什么,最多也就是看看最新的技术方向。目前国内公司在AI大模型研发方面,普遍比较关注工程化和垂直模型,这些比较务实、容易变现的方向。在工程方面,近期蹿红的Deepseek就正在国内大模型行业中掀起... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人