美团王兴称人工智能将改变一切，内部团队正开发 AI 模型 #抽屉IT

印度改变人工智能监管立场厂商推出模型需政府批准

印度改变人工智能监管立场厂商推出模型需政府批准虽然印度信息技术部承认该通知不具有法律约束力，但印度信息技术部副部长拉吉夫-钱德拉塞卡（Rajeev Chandrasekhar）表示，该通知"表明这是监管的未来"。他补充说："这是作为一项建议要求你们遵守。"该部在通知中援引了 2000 年《信息技术法》和 2021 年《信息技术规则》赋予它的权力。该部要求"立即生效"，并要求科技公司在 15 天内向该部提交"已采取的行动及现状报告"。新的咨询意见还要求科技公司"适当"标注其人工智能模型所产生的输出"可能和固有的错误或不可靠"，这标志着印度扭转了之前对人工智能监管不闻不问的态度。不到一年前，印度科技部拒绝对人工智能的发展进行监管，而是认为该行业对印度的战略利益至关重要。印度的这一举动让许多行业高管大吃一惊。许多印度初创企业和风险投资公司表示，他们被新的咨询意见吓到了，认为这种监管将阻碍印度在全球竞争中的能力，而印度在全球竞争中已经落后了。初创公司 Kisan AI 的创始人普拉蒂克-德赛（Pratik Desai）写道："我真是个傻瓜，以为自己会从旧金山把 GenAI 带到印度农业。我们正在训练多模态低成本病虫害模型，并为此兴奋不已。在全职工作 4 年将人工智能引入印度这一领域之后，这太可怕了，也太打击人的积极性了。"许多硅谷领导人也批评了印度的政策转变。最热门的人工智能初创公司之一 Perplexity AI 的联合创始人兼首席执行官阿拉温德-斯里尼瓦斯（Aravind Srinivas）说，新德里的新建议是"印度的错误举动"。风险投资公司 Andreessen Horowitz 的合伙人马丁-卡萨多（Martin Casado）爆粗口说："真他X见鬼，真是滑天下之大稽。"此前，钱德拉塞卡曾对Google Gemini上个月的某次回应表示失望。上个月，一名用户询问Gemini（以前称为"Bard"）印度总理纳伦德拉-莫迪（Narendra Modi）是否是法西斯主义者。作为回应，Gemini 公司援引其未透露身份的专家的话说，莫迪被指责实施了一些被定性为法西斯主义的政策。对此，钱德拉塞卡警告Google说，这种回应"直接违反"了《2021 年信息技术规则》以及"《刑法典》的若干规定"。咨询补充说，不遵守《信息技术法》和《信息技术规则》的规定将导致"中介或平台或其用户在被识别后可能受到惩罚"。 ... PC版：手机版：

Google将合并其Android和硬件团队使之一切都与人工智能有关

Google将合并其Android和硬件团队使之一切都与人工智能有关该团队将由里克-奥斯特罗（Rick Osterloh）负责，他之前是设备与服务高级副总裁，负责监管Google的所有硬件工作。Android、Chrome 浏览器和 ChromeOS 的长期负责人 Hiroshi Lockheimer 将负责Google和 Alphabet 内部的其他项目。多年来，Google一直表示，它有意识地将自己的硬件工作与更广泛的Android生态系统工作分开，以避免给自己的设备带来特权，或使与三星等公司的关系复杂化。但在过去几年中，这种关系发生了变化：Google的硬件团队既要打造优秀的设备，也要向 Android 世界的其他成员展示产品的发展方向。看待这些变化的一种方法是简化流程：现在有一个团队负责人工智能研究，另一个团队负责人工智能产品。与此同时，Google显然正在更加努力地扮演其作为Android系统尖兵的角色尤其是在人工智能接管操作系统的时候。Google已经在它能想到的地方添加了Gemini模型和聊天机器人，在过去的两年里，它一直在为 Pixel 摄像头添加人工智能功能，而且显然对人工智能如何改变人们使用手机的方式以及运行 Android Auto、Wear OS、ChromeOS 和其他一切系统的设备。像这样的变化似乎是Google持续循环的一部分，Google是一家著名的公司，它允许一个庞大的、基本自主的工作环境这就是为什么会有 Gmail，但也有成千上万的消息应用和整合不足的产品然后偶尔努力围绕更大的计划和提高利润进行整合。联合创始人拉里-佩奇（Larry Page）在 2011 年称之为"箭簇少箭杆多"，当时的重大举措是 Google Plus。Google肯定希望其在人工智能领域的全力推进会有更好的结果。Google正试图围绕人工智能彻底改造自己，皮查伊本人曾说过，这项技术可能与火一样重要。Google拥有的每一个应用程序和管理的每一个平台都将被Gemini改变。为了实现这一目标，Google本身公司、结构、文化都将发生变化。这并非一帆风顺，但显然没有时间可以浪费。 ... PC版：手机版：

新闻联播也报道Sora了Sora爆火！人工智能将如何改变世界？

微软展示VASA-1人工智能模型能将照片变成"会说话的人脸"

微软展示VASA-1人工智能模型能将照片变成"会说话的人脸" 该模型目前只是研究预览版，微软研究团队以外的任何人都无法试用，但演示视频看起来令人印象深刻。Runway 和 NVIDIA 已经推出了类似的唇部同步和头部运动技术，但这种技术的质量和逼真度似乎要高得多，可以减少嘴部伪影。这种音频驱动动画的方法也与Google研究院最近推出的VLOGGER 人工智能模型类似。VASA-1 如何工作？微软表示，这是一个新的框架，用于创建栩栩如生的会说话的人脸，专门用于虚拟人物的动画制作。示例中的所有人物都是合成的，是用 DALL-E 制作的，但如果它能为逼真的人工智能图像制作动画，那么它也能为真实的照片制作动画。在演示中，我们看到人们说话时就像在被拍摄一样，动作略显生涩，但看起来非常自然。唇语同步令人印象深刻，动作自然，嘴部上下没有其他工具中出现的假象。VASA-1 最令人印象深刻的一点似乎是，它不需要正面朝上的人像图像就能工作。其中有面向不同方向拍摄的例子。该模型似乎还具有很强的控制能力，能够将眼睛注视的方向、头部距离甚至情绪作为输入来引导生成。VASA-1 的意义何在？其中一个最明显的应用案例就是游戏中的高级唇语同步。如果能创造出具有自然唇部动作的人工智能驱动的 NPC，就能改变游戏的沉浸感。它还可用于为社交媒体视频创建虚拟化身，HeyGen 和 Synthesia 等公司已经采用了这种技术。另一个领域是基于人工智能的电影制作。如果能让人工智能歌手看起来像在唱歌，就能制作出更逼真的音乐视频。尽管如此，该团队表示，这只是一次研究演示，并没有公开发布的计划，甚至也不会提供给开发人员在产品中使用。VASA-1 的效果如何？让研究人员感到惊讶的是，VASA-1 能够完美地对歌曲进行歌词嘴型同步，尽管训练数据集中没有使用音乐，但它仍能毫无问题地反映歌手的歌词。它还能处理不同风格的图像，包括蒙娜丽莎。他们让它以每秒 45 帧的速度创建 512x512 像素的图像，使用桌面级 NVIDIA RTX 4090 GPU 可在大约 2 分钟内完成。虽然他们说这只是用于研究，但如果它不能进入公共领域，那就太可惜了，即使只是面向开发者，鉴于微软在OpenAI中拥有巨大的股份，这甚至可能成为未来 Copilot Sora 集成的一部分。 ... PC版：手机版：

Stack Overflow CEO：正开发旗下 AI 工具，人工智能将导致开发人员爆炸式增长 - IT之家

谷歌 DeepMind 推出活细胞人工智能模型

谷歌 DeepMind 推出活细胞人工智能模型谷歌的 DeepMind 推出了一个人工智能模型，用于研究生命的基本构成要素及其在细胞内的相互作用，推动了揭示疾病秘密和寻找疾病(如癌症)疗法的努力。根据周三在《自然》期刊上发表的一篇论文，最初于2018年开发的AlphaFold 3对微小生物结构外观和相互作用做出了迄今最精确的预测。同构实验室的首席人工智能官马克斯•贾德伯格表示，AlphaFold 3的能力为研究人员提供了新的机会，可以迅速识别潜在的新药分子。同构实验室与制药公司礼来和诺华有合作关系。“这使得我们的科学家和药物设计师能够在原子水平上创造和测试假设，并且在几秒钟内使用AlphaFold 3生成高度准确的结构预测。”贾德伯格说，“与可能需要数月甚至数年的实验相比，这是非常快速的。”AlphaFold 3展示了“显著提高”的预测准确性，超过了许多现有的专业工具，包括基于前两代技术的工具。研究表明，开发正确的人工智能深度学习框架，可以大大减少获取“生物相关性能”所需的数据量。

相关推荐

印度改变人工智能监管立场 厂商推出模型需政府批准