跟去年一样,苹果又剧透了今年即将发布的新无障碍功能。其中,Personal Voice 能帮助面临失语风险的用户通过说话来创建与

跟去年一样,苹果又剧透了今年即将发布的新无障碍功能。其中,Personal Voice 能帮助面临失语风险的用户通过说话来创建与自己嗓音相似的语音。用户可以使用 iPhone 或 iPad 录制 15 分钟的音频,朗读随机生成的文字提示,创建 Personal Voice。这项语言辅助功能使用设备端机器学习技术,确保用户信息私密安全。 #抽屉IT

相关推荐

封面图片

Google为Android和地图等产品推出新一批无障碍功能

Google为Android和地图等产品推出新一批无障碍功能 访问:NordVPN 立减 75% + 外加 3 个月时长 另有NordPass密码管理器 在Android系统中,Lookout 应用程序新增了一项名为"查找模式"的测试功能。它使用手机摄像头查找属于座位、桌子或浴室等物品类别的特定对象。Lookout 还能为通过该应用点击的图片显示人工智能生成的标题。Look to Speak 应用程序将推出无文字模式,用户可以用眼睛选择表情符号、符号和照片与他人交流。该应用已经允许用户用眼睛选择预先写好的自定义短语,然后大声说出。Google正在将Google地图 Lens 的屏幕阅读器功能扩展到全球所有支持语言的 Android 和 iOS 系统。这项从去年开始推出的无障碍功能使用手机摄像头和屏幕阅读器来显示附近的信息,如自动取款机、餐馆或公交车站。在全球范围内推广到Android和 iOS 系统的另一项功能是详细的语音导航,当视障用户步行前往目的地、穿过繁忙的十字路口或走错路时,该功能会再次利用手机摄像头为他们提供语音信息。Google表示,现在地图上有 5000 多万个地点提供了无障碍信息。Android和 iOS 上的轮椅图标用于告知用户无障碍洗手间、停车场等信息,现在也将出现在Google地图的桌面版上。此外,剧院、健身房和礼堂等企业和场所可以在Google地图上的企业简介中添加 Auracast 属性。这样,他们就可以向使用支持 Auracast 的蓝牙助听器、耳塞和耳机的游客播放增强音频或辅助音频。除此以外,Google还将重新设计声音通知提醒,以改进上机过程、声音事件浏览,并使用户更容易为家电保存自定义声音。声音通知会通过振动、摄像头闪烁或手机推送通知,告知用户门铃响或烟雾报警器响等家居声音。 ... PC版: 手机版:

封面图片

Mozilla Firefox将利用AI提高浏览器的无障碍浏览能力

Mozilla Firefox将利用AI提高浏览器的无障碍浏览能力 在最近 Mozilla Hacks 上的一篇文章中,Tarek ZIade 解释了Firefox浏览器将如何利用人工智能来提高可访问性,即为依赖屏幕阅读器等辅助技术的用户提供人工智能生成的图片说明。图片说明或"alt 文本"为读者提供了必要的背景信息,但遗憾的是,许多作者忽略了 alt 文本,导致近一半的图片缺少适当的描述。随着最新人工智能技术的发展,现在可以运行本地机器学习模型来自动生成标题,而无需向服务器发送潜在的敏感信息。Firefox 130 将在"nightly频道"中为 PDF 编辑器提供一项新功能,使用基于 Transformer 的小型开源机器学习模型生成 alt 文本。Mozilla 声称,这些模型在描述图片方面表现出色,而且无需耗费大量资源。因此,Firefox 用户即使在性能较弱的设备上也能获得图像描述(首先在 PDF 中)。博文称,小型模型可以生成包含 2 亿多个参数的 alt 文本,同时占用不到 200MB 的磁盘空间,并能在几秒钟内提供输出。与最新的 GPT-4o 等现代 LLM 的"巨无霸"相比,它们的细节和准确性都要逊色一些,但开发人员并不想用过多的信息来淹没用户。因此,Firefox 将重点放在制作类似这样的一句话描述上:一群人在办公室庆祝生日,前景是一个点燃的生日蛋糕,背景是一位面带微笑的女士。使用本地模型有几个好处。除了提高隐私性(图像不会被处理到任何地方),用户还能获得更好的资源效率、更高的透明度、更少的二氧化碳排放(训练大型模型会产生大量碳排放),以及定期增强的频繁更新。更多技术信息,请参阅官方文档。 ... PC版: 手机版:

封面图片

苹果公司要求:从年月日开始,所有提供创建账户的APP必须让用户很容易地删除他们的账户

苹果公司要求:从年月日开始,所有提供创建账户的APP必须让用户很容易地删除他们的账户 苹果公司去年宣布改变App Store的指导方针,要求所有支持创建账户的应用程序提供一个应用内选项,让用户删除他们的账户。然而,这一要求已被推迟了两次。现在,该公司已经为开发者设定了一个新的最后期限,要求他们根据新的准则更新他们的应用程序。 从年月日开始,App Store中所有以某种方式让用户创建新账户的应用程序也必须提供一种方式,让他们在想删除该账户。这些变化已在《应用程序商店审查指南》..(v)中详细说明,其中解释了应用程序在账户登录方面可以做什么和不能做什么。 如果你的应用程序不包括重要的基于账户的功能,让人们在没有登录的情况下使用它。如果你的应用程序支持账户创建,你也必须在应用程序中提供账户删除功能。除非与应用程序的核心功能直接相关或法律要求,否则应用程序不得要求用户输入个人信息以发挥作用。 除了提供让用户删除账户的方法外,苹果公司表示,账户删除在应用程序中 "应该很容易找到"。如果应用程序使用 "用苹果登录",开发者必须确保用户的令牌在账户被删除后已被撤销。 规则还明确指出,应用程序必须提供一个完全删除用户账户的选项,而不仅仅是停用它。与该账户相关的所有个人数据都必须被删除。当然,这是让用户对其数据有更多控制的另一种方式,确保在使用第三方应用程序时有更多的隐私。 tomac

封面图片

苹果公司要求:从2022年6月30日开始,所有提供创建账户的APP必须让用户很容易地删除他们的账户

苹果公司要求:从2022年6月30日开始,所有提供创建账户的APP必须让用户很容易地删除他们的账户 苹果公司去年宣布改变App Store的指导方针,要求所有支持创建账户的应用程序提供一个应用内选项,让用户删除他们的账户。然而,这一要求已被推迟了两次。现在,该公司已经为开发者设定了一个新的最后期限,要求他们根据新的准则更新他们的应用程序。 从2022年6月30日开始,App Store中所有以某种方式让用户创建新账户的应用程序也必须提供一种方式,让他们在想删除该账户。这些变化已在《应用程序商店审查指南》5.1.1(v)中详细说明,其中解释了应用程序在账户登录方面可以做什么和不能做什么。 如果你的应用程序不包括重要的基于账户的功能,让人们在没有登录的情况下使用它。如果你的应用程序支持账户创建,你也必须在应用程序中提供账户删除功能。除非与应用程序的核心功能直接相关或法律要求,否则应用程序不得要求用户输入个人信息以发挥作用。 除了提供让用户删除账户的方法外,苹果公司表示,账户删除在应用程序中 "应该很容易找到"。如果应用程序使用 "用苹果登录",开发者必须确保用户的令牌在账户被删除后已被撤销。 规则还明确指出,应用程序必须提供一个完全删除用户账户的选项,而不仅仅是停用它。与该账户相关的所有个人数据都必须被删除。当然,这是让用户对其数据有更多控制的另一种方式,确保在使用第三方应用程序时有更多的隐私。 9to5mac

封面图片

OpenAI可能会推出Jarvis一样的个人助理 新商标Voice Engine信息汇总

OpenAI可能会推出Jarvis一样的个人助理 新商标Voice Engine信息汇总 尽管这是商标申请,但是Google前雇员透露的信息以及上个月泄露的OpenAI正在开发的Agent产品都似乎印证着OpenAI要做的事情:开发一个全球最强的个人助理,接管个人设备,以Jarvis那样的形式提供服务!Voice Engine商标内容Voice Engine是OpenAI最近提交一个商标名称,其内容主要包含了语音识别和语音合成相关的内容。这个商标背后可能提供的产品和服务涵盖了广泛的计算机软件和开发工具领域,特别是在语音和自然语言处理技术方面。具体来说,可能提供的产品和服务包括但不限于:自动语音识别和生成软件:用于自动识别和生成语音的软件,可能在虚拟助手、智能家居设备等场景中有广泛应用。基于自然语言提示生成语音和音频输出的软件:这类软件能够根据文本、语音、视觉提示、图像或视频生成语音和音频输出,可用于各种应用,如内容创作、教育、娱乐等。注意,这不是文本转语音,而是根据文本提示生成语音结果!数字语音助手开发工具:提供用于构建数字语音助手的软件和开发工具,有助于开发者创建智能交互应用。虽然是工具,但是显然这是可以用于开发个人助理的工具!响应用户提示生成音频或语音的软件:这类软件能够根据用户的提示生成相应的音频或语音输出,可能用于互动媒体、游戏或其他应用中。这个目前在ChatGPT客户端也有了,就是用语音响应用户输入。机器学习基础的自然语言和语音处理软件:涉及使用机器学习技术进行自然语言和语音的处理、识别和分析的软件。多语言语音识别、翻译和转录软件:支持多语言的语音识别、翻译和转录功能的软件,适用于国际化应用、内容创作等场景。应用程序接口(API)软件和软件开发套件(SDKs):提供可作为API使用的软件,可能支持开发者在各种应用和服务中集成语音和自然语言处理功能。综上所述,VOICE ENGINE™旨在为开发者和创新者提供一系列强大的工具和软件,以便在各种平台和设备上开发和集成先进的语音交互和自然语言处理功能。而这其中最令人关注的应该是下面的2个内容:一个是可以配合Sora视频生成的功能,为视频配音;另一个则是作为个人助理,支持语音交互!为Sora视频配音的语音生成功能传统的语音领域的模型主要方向包括2类:一个是语音合成,即Text to speech(TTS):将文本转成语音。另一个是自动语音识别(Auto Speech Recognition,ASR),即识别语音转成文本。但是,根据这个描述响应用户提示生成音频或语音的软件,这个能力应该是类似视频生成和图片生成那种,基于文本prompt,来生成相应的语音结果。例如,你可以给系统说,生成一段音乐或者一只老虎在野外和狮子战斗的声音。然后模型返回相应的语音结果。这不是一种文本转语音而是语音生成的能力。在最近爆火的OpenAI的Sora演示中(OpenAI最强的视频生成大模型: OpenAI发布全新文本生成视频大模型Sora,可以生成无比逼真的最长60秒的视频,且生成的视频尺寸可以任意指定),所有的视频都没有声音。OpenAI官方说目前他们还没有实现为生成的视频配音的功能。但是未来会支持。这意味着基于文本生成音频应该也是类似的技术了。与Agent传言互相印证:OpenAI的Jarvis产品在前面的商标描述中提到,OpenAI的Voice Engine可以提供响应用户提示生成音频或语音的软件。这几乎就是一个个人数字助理的形态,它不同于语音合成或者语音识别。而是根据用户的输入进行语音的响应。这意味着用户可以通过文本、语音来输入,然后服务直接用语音回复结果。从技术角度来说,传统的语音助理应该是先通过ASR识别用户的语音,然后转成文本,GPT再根据文本生成答案,再由TTS技术合成语音输出。这个分步系统最大的缺点就是时延以及准确性!三个步骤,每个步骤准确率90%,最终的回复准确率可能只有72.9%了!如果这是一个端到端的模型(符合OpenAI当前的技术趋势),那么时延和准确性都值得期待!此外,结合此前的传言说GPT可能要接入个人本地电脑系统,那作为一个个人助手完全是没问题的。同时,Google前雇员Jonathan Chavez在前段时间也发布过一个消息,他说OpenAI在今年会推出一个全球最好的个人助理产品,就像钢铁侠中的Jarvis。Jarvis除了需要有GPT-4那种强大的语言响应能力外,还有个重要的特点是语音的输入和输出。虽然在当前的ChatGPT客户端和网页版中已经实现了语音交互以及文本转语音的能力。但是,它本身是为了支撑ChatGPT的功能存在的,范围局限在ChatGPT的对话过程中。一旦如果像Jonathan Chavez所说是一个前所未有最强大的个人助理,那么意味着它可以帮助我们操作我们的电脑和手机,使用APP等。这个消息和上个月泄露的OpenAI正在做一个强大的AI Agent也有很大的相关性:OpenAI正在开发一个全新的基于大模型的Agent产品。在这个传言中,OpenAI做的事情描述如下:OpenAI正在开发的这个Agent形式的产品,通过有效地接管用户的设备来让复杂任务被自动执行。然后,用户可以请求ChatGPT将数据从文档转移到电子表格中进行分析,或自动填写费用报告并将其输入会计软件。这类请求将触发ChatGPT来执行点击、光标移动、文本输入以及人们在使用不同应用程序时进行的其他操作。 ... PC版: 手机版:

封面图片

在EPIC数据泄露事件之后 - 三星迫使用户接受条款和条件,否则他们的数据将面临风险。

在EPIC数据泄露事件之后 - 三星迫使用户接受条款和条件,否则他们的数据将面临风险。 在韩国科技公司三星最近发生一连串数据泄露事件之后,试图采取合理的预防措施的用户不得不被迫接受该公司更新的条款和条件。 迄今为止,三星在2022年已经遭遇了两次数据泄露事件。第一次是由臭名昭著的 Lapsus$ 集团策划的,从该公司流出190GB的数据,其中包括所有生物识别解锁操作的算法、较新的三星产品的引导程序的源代码、以及授权和认证三星账户过程背后的所有源代码。 第二起泄露事件直接影响到用户,三星隐瞒了一个月才通知用户:大量的个人身份信息现在在犯罪分子手中。 虽然三星公司低调的新闻稿向客户保证“没有必要恐慌”,但谨慎的用户 也许对三星公司如此麻木而感到震惊的用户 立即登录他们自己的三星账户,以修改密码。 许多用户在购买手机时创建了一个三星账户,然后立即忘记了这码事。有些人阅读了服务条款和条件,而更多人则没有。您应该始终阅读条款和条件,任何时候。 如果您在2021年9月之前创建了账户,当这些条款发生变化时,三星并没有义务通知您 除非您试图登录自己的在线账户。 三星的条款和条件最后一次更新是在2021年9月30日,这一变化基本上没有被人们注意到。 虽然在技术上可以在不登录和不接受更新的条款和条件的情况下请求重置密码,但是您确实需要接受这些条款,才能访问您的三星账户的其他安全功能。 #DataBreach #Privacy #Samsung

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人