【Meta 开发了实时翻译闽南语的 AI】该模型目前仍在开发中,并且只适用于那类具有中间语言可以桥接两个不同语言的语言,如果两个

【Meta 开发了实时翻译闽南语的 AI】该模型目前仍在开发中,并且只适用于那类具有中间语言可以桥接两个不同语言的语言,如果两个语言之类没有密切相似的可桥接语言的话,将无法使用这个新模型,但该模型仍然为通用翻译开辟了更多的新语言。 #抽屉IT

相关推荐

封面图片

Meta 正开发更强大的新大型语言模型,对标OpenAI 的 GPT-4

Meta 正开发更强大的新大型语言模型,对标OpenAI 的 GPT-4 据知情人士透露,Meta 正在开发一款新的大型语言模型,并预计其功能将与 GPT-4 一样强大。根据 Meta 的目标,其新 AI 模型将比两个月前刚刚发布的名为 Llama 2 的模型强大数倍。这个新 AI 模型计划明年上线。 Meta 目前正在搭建这项工作所需的数据中心,并购置更多的 H100 芯片,这是英伟达用于此类 AI 训练的最先进制程芯片。其中一些知情人士说,虽然与微软合作在后者的云计算平台 Azure 上提供 Llama 2 服务,但 Meta 计划在自己的基础设施上训练这个新模型。

封面图片

:一种适用于所有 AI 开发人员的新编程语言。| 由 LLVM、Swift、Clang 作者 Chris Lattner 发布,

:一种适用于所有 AI 开发人员的新编程语言。| 由 LLVM、Swift、Clang 作者 Chris Lattner 发布,被誉为 AI 新时代的编程语言变革者,比 Python 高效 35000 倍。 虽然 Mojo 比 Python 更高效,但在 AI 领域,仍需要与 Python 的核心功能和类库完全兼容,不过这也使得 Mojo 语言的兼容性能让它在 AI 领域得到广泛应用。 该语言运用了 Python 易用性和 C 的性能优势,重构了 AI 基础设施,实现了硬件的无与伦比的可编程性和 AI 模型的可扩展性。 Mojo 语言具有许多特点,如渐进类型、零成本抽象、所有权和借用检查器、可移植参数化算法等。它能充分利用硬件性能,像 C++ 和 CUDA 一样发挥作用。 简单来说,Mojo 语言具有高效、易用、可扩展等特点,未来将为 AI 基础设施的发展提供更多可能性。

封面图片

【JetBrains 发布轻量级编辑器 Fleet】Fleet 适用于多开发语言,具有智能补全、重构、导航、调试以及 IDE 中

【JetBrains 发布轻量级编辑器 Fleet】Fleet 适用于多开发语言,具有智能补全、重构、导航、调试以及 IDE 中一直存在的所有功能。目前可以申请加入 Fleet 早期预览计划,以后应该是付费产品。 #抽屉IT

封面图片

密歇根大学开发的AI工具可以通过狗叫声分辨出其是否具有攻击性

密歇根大学开发的AI工具可以通过狗叫声分辨出其是否具有攻击性 这项研究是与墨西哥普埃布拉国家天体物理学、光学和电子学研究所(INAOE)合作进行的,研究发现,最初针对人类语言训练的人工智能模型可以作为一个起点,用来训练针对动物交流的新系统。相关成果已在计算语言学、语言资源和评估联合国际会议上公布。"通过使用最初在人类语音基础上训练的语音处理模型,我们的研究打开了一扇新窗口,让我们了解如何利用迄今为止在语音处理方面所取得的成果,开始理解狗叫声的细微差别,"马大计算机科学与工程系 Janice M. Jenkins 学院教授兼人工智能实验室主任Rada Mihalcea 说。"对于与我们共同生活在这个世界上的动物,我们还有很多不了解的地方。人工智能的进步可以用来彻底改变我们对动物交流的理解,而我们的研究结果表明,我们也许不必从头开始"。开发能够分析动物发声的人工智能模型的主要障碍之一是缺乏公开可用的数据。虽然记录人类语音的资源和机会很多,但从动物身上收集此类数据却比较困难。"动物的发声在逻辑上更难收集和记录,"第一作者、马萨诸塞大学计算机科学与工程系博士生 Artem Abzaliev 说。"它们必须在野外被动地记录下来,如果是家养宠物,则必须征得主人的同意"。由于缺乏可用数据,分析狗发声的技术难以开发,而现有的技术也因缺乏训练材料而受到限制。研究人员通过重新利用现有模型克服了这些挑战,该模型最初是为分析人类语音而设计的。这种方法使研究人员能够利用强大的模型,这些模型构成了我们今天使用的各种语音技术的支柱,包括语音到文本和语言翻译。这些模型经过训练,可以分辨出人类语音中的细微差别,如语调、音调和口音,并将这些信息转换成计算机可以用来识别所说词语、识别说话人等的格式。"这些模型能够学习和编码人类语言和语音中极其复杂的模式,"Abzaliev 说。"我们想了解能否利用这种能力来辨别和解读狗叫声。"研究人员使用了74只不同品种、年龄和性别的狗在各种情况下发出的声音数据集。亨伯托-佩雷斯-埃斯皮诺萨(Humberto Pérez-Espinosa)是INAOE的合作者,他领导的团队负责收集数据集。然后,阿布扎利耶夫利用这些录音修改了一个机器学习模型一种能识别大型数据集中模式的计算机算法。该团队选择了一种名为 Wav2Vec2 的语音表示模型,该模型最初是在人类语音数据上训练出来的。有了这个模型,研究人员就能生成从狗身上收集到的声音数据的表示,并解释这些表示。他们发现,Wav2Vec2 不仅在四项分类任务中取得了成功,而且其准确率高达 70%,超过了专门针对狗叫声数据训练的其他模型。"这是首次将针对人类语音进行优化的技术用于帮助解码动物交流,"Mihalcea 说。"我们的研究结果表明,从人类语音中得出的声音和模式可以作为分析和理解动物发声等其他声音的声学模式的基础。"除了建立人类语言模型作为分析动物交流的有用工具这将使生物学家、动物行为学家等受益之外,这项研究对动物福利也有重要意义。研究人员说,了解狗发声的细微差别可以大大改善人类解读和回应狗的情感和生理需求的方式,从而加强对它们的照顾,防止潜在的危险情况发生。 ... PC版: 手机版:

封面图片

报道微软正在自行开发比OpenAI更小更便宜的人工智能模型

报道微软正在自行开发比OpenAI更小更便宜的人工智能模型 这些 SLM 旨在提供与 OpenAI 的 GPT 等大型语言模型(LLM)类似的对话和生成能力,但对硬件的需求大大降低。与外部开发的替代产品相比,这将使微软的人工智能产品和服务具有更低的相关成本和碳足迹。GenAI 团队预计将并入微软的 Azure 云计算部门,将专注于创建更小的语言模型。为了支持 GenAI 团队,微软还从其研究小组调来了几位顶尖开发人员。微软公司副总裁米沙-比连科(Misha Bilenko)将领导该团队的工作。GenAI 团队的目标是创造出与 OpenAI 等公司提供的模型功能相匹配甚至更强的人工智能,同时针对较小的规模进行优化。迄今为止,微软已将 OpenAI 的多项人工智能功能纳入其产品中。例如,必应在Copilot中使用了GPT-4,必应图像创建器在图像生成中使用了Dall-E。最近几周,该公司还推出了Copilot Pro一项针对个人消费者的订阅服务,为他们提供更先进的人工智能功能。该报告是在 OpenAI 最近推出 GPT 商店之后发布的,用户可以在该商店创建、分享和销售基于 OpenAI 语言模型的定制人工智能模型。同样,微软也宣布了自己的计划,即为Copilot提供针对特定需求和主题定制的人工智能聊天机器人。然而,依赖外部开发的人工智能会产生一些费用,而且缺乏对技术本身的控制。微软致力于开发更小巧、更经济实惠的人工智能技术,这有可能为公司提供自己的解决方案开辟新的途径,减少对第三方供应商的依赖。据说美国司法部(DOJ)和联邦贸易委员会(FTC)希望调查 OpenAI 与微软的关系,以防您错过。上周,我们曾报道,这两个机构都急于调查这笔交易,特别是微软的参与及其对人工智能行业竞争的影响。 ... PC版: 手机版:

封面图片

微软开发者大会简报:编程进入自然语言时代、“AI员工”闪亮登场

微软开发者大会简报:编程进入自然语言时代、“AI员工”闪亮登场 编程小白也能开发软件?纳德拉在周二演示了“帮助小白编程”的GitHub Copilot Workspace,这是一款通过聊天实现完成程序编写的软件。这将使任何新手,即使对编程语言几乎没有了解,也能开发自己的软件。纳德拉表示:“任何人都可以在瞬间将想法转变为代码,你能够控制这个过程中的每一个环节...这将使得编程更加快乐和有趣。”微软计划在未来几个月里进一步打磨这个功能,使其更加可用。AI员工走上台前在微软的职场协作软件Teams等一系列应用中,AI将不再是一个工具栏上的按钮,而是打工人们可靠的新同事。这项名为Team Copilot的新功能将使得Copilot成为每个工作团队的新成员。Copilot可以作为会议的主持人,管理议程并实时纪录会议纪要,以及追踪并安排团队成员会议后的行动。Copilot还能成为项目经理,通过创建和分配任务、跟踪截止日期等方式推动团队协作。在另一项产品更新中,微软也表示将在今年晚些时候推出一款“AI代理”工具类似于“AI虚拟员工”,可以执行监控电子邮件、帮助新员工入职、输入数据等一系列琐碎的自动化任务。微软小心翼翼地强调,Copilot不会接管人们的工作,只会接手其中一些无聊的部分。AI实时视频翻译功能微软的Edge浏览器将在近期推出一款视频实时翻译功能。与目前常见的视频字幕翻译不同,这款产品已经能提供实时语音同传翻译。Edge的AI实时翻译初始将支持彭博、路透等一系列主流视频网站和主流新闻网站,且只支持英语、印地语、德语、俄语、意大利语和西班牙语的双向互译。微软也表示,后续将会支持更多的网站和语言。一款骁龙迷你电脑在昨日发布一系列新笔记本电脑后,周二一款搭载高通骁龙X Elite芯片的迷你主机也面向开发者推出。除了高通的芯片外,这款形似Mac Mini的机器还有32GB LPDDR5x内存和512GB的SSD。考虑到这款机器售价达到899.99美元,比起昨天的笔记本电脑(起售价999美元)并没有明显的价格优势。不过这款产品似乎也没准备卖给普通消费者,要获得它的唯一渠道是在高通官网上填写一个面向开发者的表格。小模型也要多模态在今年4月更新“小模型”Phi-3后,微软也在周二拿出了Phi-3-vision模型。顾名思义,这个模型可以阅读文本和查看图片,同时这个42亿参数量的模型足够紧凑,能够在移动设备上运行。目前Phi-3-vision已经发布在Azure的模型库中。与DALL-E和Stable Diffusion不同,Phi-3-vision不会生成图像,主要用来理解图像中的内容并为用户进行分析。与Meta深入合作微软也在周二宣布将“Windows体积应用程序”(Windows Volumetric Apps)引入Meta的Quest头显设备,使开发人员能够将其应用程序扩展到3D空间。微软表示,该扩展将允许用户不离开支持他们工作依赖的应用程序,同时增强空间理解的能力。彩蛋:奥尔特曼现身整场发布会的压轴环节交给了OpenAI CEO山姆·奥尔特曼,面对全场开发者,奥尔特曼猛灌了一锅“心灵鸡汤”。在与微软CTO凯文·斯科特的对话中,奥尔特曼表示自上周发布GPT-4o以来经历了“疯狂的一周”,因为他“从未见过一种技术以如此有意义的方式被如此迅速地采用” 。这名创业导师也强调,他最重要的建议是,现在是一个特殊的时期,所以要抓住机会去构建你想要做的事情,不要等待。奥尔特曼认为,就创业而言,眼下是2008年移动互联网爆发、甚至是整个互联网时期“最令人兴奋的时刻”。但“ChatGPT之父”也补充称,不要指望AI能为你做所有的工作,人工智能是一种新的促进因素,但它并不会自动打破商业规则。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人