谷歌借机器学习技术增强了现实生活中的文本图像翻译体验

谷歌借机器学习技术增强了现实生活中的文本图像翻译体验Google正在通过机器学习(ML)驱动的附加功能,对其翻译服务带来新一轮升级。这使得用户能够更轻松地翻译现实世界中出现的文本,比如店面招牌、菜单、文档、名片等项目。更棒的是,新功能不会简单粗暴地将译文覆盖到原始文本的上方,而是利用AI生成的背景来重建像素,以便带来更自然的使用体验。PC版:https://www.cnbeta.com/articles/soft/1322149.htm手机版:https://m.cnbeta.com/view/1322149.htm

相关推荐

封面图片

窥探深渊:机器学习增强了著名的M87“橙色甜甜圈”黑洞图像

窥探深渊:机器学习增强了著名的M87“橙色甜甜圈”黑洞图像2017年,EHT合作使用了一个由世界各地七个预先存在的望远镜组成的网络来收集M87的数据,创造了一个"地球大小的望远镜"。然而,由于用望远镜覆盖地球的整个表面是不可行的,所以数据中出现了缺口,就像拼图中缺少的碎片。M87超大质量黑洞最初由EHT合作在2019年成像(左);以及PRIMO算法使用相同数据集生成的新图像(右)。资料来源:Medeiros等人,2023年"通过我们的新机器学习技术,PRIMO,我们能够实现当前阵列的最大分辨率,"高级研究所的主要作者LiaMedeiros说。"由于我们不能近距离研究黑洞,图像的细节对我们理解其行为的能力起着关键作用。现在图像中的环的宽度小了大约2倍,这对我们的理论模型和引力测试将是一个强大的约束。"PRIMO是主成分干涉测量模型的缩写,由EHT成员LiaMedeiros(高级研究所)、DimitriosPsaltis(乔治亚理工大学)、TodLauer(NOIRLab)和FeryalÖzel(乔治亚理工大学)开发。他们的出版物《用PRIMO重建的M87黑洞图像》今天(4月13日)发表在《天体物理学杂志通讯》上。Lauer说:"PRIMO是解决从EHT观测中构建图像这一困难任务的一种新方法。它提供了一种补偿被观测物体信息缺失的方法,这对于生成使用一个地球大小的单一巨型射电望远镜所看到的图像是必需的。"动画展示了从EHT合作在2019年首次产生的M87黑洞图像,淡化到PRIMO算法使用相同数据集产生的新图像。资料来源:Medeiros等人,2023年PRIMO依赖于字典学习,这是机器学习的一个分支,使计算机能够根据大量的训练材料集产生规则。例如,如果给计算机提供一系列不同的香蕉图像--经过充分的训练--它可能能够确定一个未知的图像是或不是香蕉。除了这个简单的案例,机器学习的多功能性已经在许多方面得到了证明:从创造文艺复兴风格的艺术作品到完成贝多芬的未完成作品。那么,机器可能如何帮助科学家渲染黑洞图像?研究小组已经回答了这个问题。通过PRIMO,计算机分析了超过3万个黑洞吸积气体的高保真模拟图像。模拟的集合涵盖了黑洞如何吸积物质的广泛模型,寻找图像结构中的共同模式。各种结构模式按照它们在模拟中出现的频率进行排序,然后进行混合,以提供EHT观测结果的高度精确表示,同时提供图像缺失结构的高保真度估计。2023年2月3日,一篇与该算法本身有关的论文发表在《天体物理学杂志》上。"我们正在使用物理学来填补数据缺失的区域,这是以前从未使用机器学习的方式,"Medeiros补充说。"这可能会对干涉测量法产生重要影响,干涉测量法在从外行星到医学等领域发挥着作用。"研究小组证实,新渲染的图像与EHT数据和理论预期一致,包括预计由落入黑洞的热气体产生的明亮发射环。生成图像需要假设缺失信息的适当形式,而PRIMO通过在2019年发现M87黑洞的大体细节看起来像预测的那样来做到这一点。"在2019年EHT公布了第一张黑洞的地平线规模的图像后约四年,我们已经标志着另一个里程碑,第一次产生了一个利用阵列的全部分辨率的图像,"Psaltis说。"我们开发的新机器学习技术为我们理解黑洞物理的集体工作提供了一个机会。"新的图像带来了对M87黑洞的质量和决定其目前外观的物理参数的更精确的确定。该数据还为研究人员提供了一个机会,可以对事件视界的替代方案进行更多的约束(基于更暗的中心亮度凹陷),并对引力进行更有力的测试(基于更窄的环形尺寸)。PRIMO还可以应用于其他的EHT观测,包括我们银河系的中心黑洞SgrA*的观测。M87是一个巨大的、相对较近的、位于处女座星系团中的星系。一个多世纪前,人们观察到一股神秘的热等离子体喷流从其中心喷出。从20世纪50年代开始,当时的射电天文学新技术显示,该星系的中心有一个紧凑的明亮射电源。在20世纪60年代,M87被怀疑在它的中心有一个巨大的黑洞为这种活动提供动力。从20世纪70年代开始的地面望远镜的测量,以及后来从20世纪90年代开始的哈勃太空望远镜的测量,为M87确实藏有一个黑洞提供了强有力的支持,根据对围绕其中心的恒星和气体的高速度的观测,黑洞的重量是太阳的几十亿倍。2017年对M87的EHT观测是在几天内从几个不同的射电望远镜同时连接起来获得的,以获得尽可能高的分辨率。现在具有代表性的M87黑洞的"橙色甜甜圈"图片在2019年发布,反映了从这些观测中产生图像的首次尝试。"2019年的图片只是一个开始,"梅德罗斯表示。"如果说一张图片胜过千言万语,那么该图片背后的数据还有很多故事要讲。PRIMO将继续成为提取这种洞察力的重要工具。"...PC版:https://www.cnbeta.com.tw/articles/soft/1354723.htm手机版:https://m.cnbeta.com.tw/view/1354723.htm

封面图片

OpenAI正式推出GPT-4 提供文本图像综合访问能力

OpenAI正式推出GPT-4提供文本图像综合访问能力在一系列领域--包括带有文字和照片、图表或屏幕截图的文件--GPT-4表现出与纯文本输入类似的能力。此外,它还可以使用为纯文本语言模型开发的测试时间技术,包括少数几个镜头和思维链提示。坏消息是,图像输入目前还没有向公众开放,因为它们处于"研究预览"模式。目前还没有关于何时能普遍使用的消息。新版本还将允许用户改变GPT-4答案的语气,博文指出:与经典的ChatGPT个性的固定言辞、语气和风格不同,开发者(以及很快ChatGPT用户)现在可以通过在"系统"消息中描述这些方向来规定他们的人工智能的风格和任务。系统消息允许API用户在一定范围内大幅定制他们的用户体验。该博客还展示了一些性能图表来说明GPT-4的改进。在一个案例中,OpenAI让聊天机器人参加了一些模拟考试。我们通过使用最新的公开测试(就奥林匹克数学和AP自由回答问题而言)或购买2022-2023年版本的练习考试来进行,我们没有为这些考试做专门的培训。上图显示,与GPT-3.5相比,GPT-4在大多数情况下提供的考试成绩要好得多与以前的版本一样,GPT-4在获取更多的最新科目信息方面是有限的,因为它只能回溯到2021年9月。OpenAI还表示,新版本"相对于以前的模型,大大减少了信口开河的现象",但它"并不完全可靠"。如果他们注册了一个等待名单,GPT-4的API目前可供开发者使用,普通人如果注册了ChatGPTPlus,就可以在有限的基础上访问GPT-4,该费用为每月20美元。博文提到,OpenAI可能会推出另一个订阅级别,允许更多的人访问。...PC版:https://www.cnbeta.com.tw/articles/soft/1349447.htm手机版:https://m.cnbeta.com.tw/view/1349447.htm

封面图片

GEEML:谷歌地球引擎机器学习

GEEML:谷歌地球引擎机器学习这个python包使用并行处理和谷歌地球引擎大容量端点更容易从谷歌地球引擎中提取卫星数据。在目前的状态下,它支持以csv的形式提取传统机器学习(表格数据)的数据,以及提取深度神经网络的GeoTiff图像补丁。GEEJS代码编辑器中的机器学习功能仍然有限。例如,不支持XGBoost、LightGBM、NGBoost等。此外,python生态系统对训练、验证和超参数调优的支持要多得多。但是,要利用此功能,需要在本地下载数据或将数据存储在GoogleDrive或GoogleCloudStorage中,以从机器学习python生态系统中受益。因此,这个包旨在让下载GEE处理的机器学习格式的数据变得更容易和更快。特征:并行导出图像或稀疏图像(例如GEDI)。导出点或多边形处的栅格值(ee.FeatureCollection)。汇总多边形内的栅格数据(ee.FeatureCollections)。提取表格和深度神经网络(DNN)类型的数据集。#机器学习

封面图片

深度学习辅助漫画翻译工具, 支持一键机翻和简单的图像/文本编辑。特性如下:

深度学习辅助漫画翻译工具,支持一键机翻和简单的图像/文本编辑。特性如下:一键翻译译文回填参考对原文排版的估计,包括颜色,轮廓,角度,朝向,对齐方式等最后效果取决于文本检测,识别,抹字,机翻四个模块的整体表现支持日漫和美漫英译中,日译英排版已优化,文本布局以提取到的背景泡为参考,中文基于pkuseg进行断句,日译中竖排待改善图像编辑支持掩膜编辑和修复画笔文本编辑支持所见即所得地富文本编辑和一些基础排版格式调整、字体样式预设支持全文/源文/译文查找替换支持导入导出word文档适用于条漫#工具

封面图片

《机器学习宝典》包含:谷歌机器学习速成课程(招式)+机器学习术语表(口诀)+机器学习规则(心得)+机器学习中的常识性问题(内功)

《机器学习宝典》包含:谷歌机器学习速成课程(招式)+机器学习术语表(口诀)+机器学习规则(心得)+机器学习中的常识性问题(内功)该资源适用于机器学习、深度学习研究人员和爱好者参考!其中《机器学习知识点彩图版.pdf》以生动形象的图片描述机器学习中的知识点。其中《Google机器学习速成课程.pdf》以加利福尼亚房价预测为线索,讲解了机器学习概念、特征工程以及机器学习在现实世界的应用。该课程有对应知识点的习题和解答,你可以随时检测自己的学习效果。其中《机器学习中的常识性问题(最新网页版)》,该文系统性总结了机器学习基础知识。百度网盘#机器学习

封面图片

DALL-E 2 同源:机器学习研究员分享“文本到宝可梦”图像生成器

DALL-E2同源:机器学习研究员分享“文本到宝可梦”图像生成器在经历了九代《精灵宝可梦》之后,玩家们有时难免吐槽开发者只是从帽子里随机抽取单词,然后观察它们到底会在玩家群体中引发怎样的化学反应。对于抱着“这么搞我也行”心态的粉丝,这里有一款独特的人工智能生成器可以推荐给大家。PC版:https://www.cnbeta.com/articles/soft/1322341.htm手机版:https://m.cnbeta.com/view/1322341.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人