亚洲首富倾力打造的大模型BharatGPT下月发布

亚洲首富倾力打造的大模型BharatGPT下月发布该模型以印度教神话中的神猴哈奴曼(Hanooman)命名。BharatGPT设想该模型在当前阶段，可通过11种当地语言在四个主要领域发挥作用：医疗保健、治理、金融服务和教育。信实工业与孟买等地的八所印度理工学院合作开发了这一模型，并得到了信实旗下印度电信巨头Reliance Jio和印度政府的支持。印度理工学院孟买分校计算机科学与工程系主任Ganesh Ramakrishnan介绍称，“这是一种完全不同类型的LLM。”他在接受采访时称，Hanooman将提供语音转文字功能，使其更加方便用户使用。印度有着非常复杂的语言系统，据统计，该国一共有1652种语言和方言，其中使用人数超过百万就有33种。印度宪法规定了18种语言作为联邦官方语言，另外还使用英语作为行政、司法用语。同时，印度约有3亿文盲，是世界上成年人文盲人口最多的国家。这使得传统的AI模型，对于不少印度民众而言未必能够很好地适用。而BharatGPT显然致力于解决这一困扰。BharatGPT表示，其模型目前可以支持11种印度语言，包括印地语、泰米尔语、泰卢固语、马拉雅拉姆语和马拉地语，研发者还希望可以扩展至22种印度语言。在周二向与会代表播放的一段视频中，印度南部的一名摩托车修理工用母语泰米尔语向人工智能机器人提问；一名银行家则用印地语与该工具对话，而印度第六大城市海德拉巴的一名开发人员则用它编写了计算机代码。研发者与信实工业的合作，包括在电信和零售等领域的行业应用模型。Ramakrishnan表示，Reliance Jio将为特定用途定制模型。该公司已经在开发“Jio大脑”，这是一个在拥有约4.5亿用户的网络中使用人工智能的平台。分析人士表示，如果Hanooman可以取得成功，将标志着印度在加速开发具有潜在变革意义的人工智能技术的竞赛中，取得了长足进步。事实上，亚洲首富安巴尼致力于打造印度自己的基础大型语言模型的消息，在去年三季度就曾被外界报道过。英伟达去年9月曾在官网上发布公告称，将与安巴尼的信实工业集团建立AI合作伙伴关系，双方合作开发大型语言模型，该模型将基于该国的多种语言进行训练，并且为生成式AI的应用量身定制，让AI技术更好地为14亿印度人服务。英伟达当时还宣布将向信实提供最先进的GH200超级芯片，同时也将向合作伙伴开放接入DGX AI算力云服务。 ... PC版：手机版：

在Telegram中查看

相关推荐

Databricks 发布最大开源大语言模型 DBRX

Databricks 发布最大开源大语言模型 DBRX 美国AI初创公司Databricks周三公布，该公司开发的通用大语言模型 DBRX将开源。DBRX在语言理解、编程、数学和逻辑方面轻松击败了Meta的Llama 2-70B、法国MixtralAI公司的Mixtral 和马斯克旗下xAI开发的Grok-1这类当前流行的开源模型。DBRX 在 30多种不同的最先进模型(SOTA) 基准指标测试中，均优于前述三种大模型。 DBRX 使用混合专家架构(MoE) ，拥有16个专家模型，共1320亿参数。该模型使用 3072 英伟达 H100 GPU在12万亿个token的数据集上进行训练，最大支持32k 的上下文窗口。同时，Databrick 也开源了该模型经过指令微调（instruct finetune）的版本。 ,

Stability AI 发布日语 StableLM 模型

Stability AI 发布日语 StableLM 模型 Stability AI 今天发布了日语 StableLM Alpha，将其语言模型产品扩展至国际市场，这是面向日语使用者的性能最佳的公开语言模型。新的70亿参数通用语言模型旨在为日本用户提供增强的人工智能文本生成能力。Stability AI 表示，在该公司进行的评估中，日语 StableLM 的表现优于其他四种基准日语模型。新模型发布了两个版本：和。基础模型设计用于使用大规模日语和英语训练数据进行一般文本生成。指令模型使用监督微调技术进行额外调整，以遵循用户提示和说明。此次发布为日本人工智能开发人员和研究人员提供了适合其语言的新生成模型。这也标志着 Stability AI 首次扩展到 Stable Diffusion 等英语语言模型之外。此举标志着随着全球生成式人工智能应用的增加，未来可能会进入其他国际市场。

Mistral Large 大语言模型发布

Mistral Large 大语言模型发布 Mistral Large 是 Mistral 新的尖端文本生成模型。它达到了顶级的推理能力，可用于复杂的多语言推理任务，包括文本理解、转换和代码生成。Mistral Large 在常用基准测试中取得了优异的成绩，使其成为世界上排名第二的可通过 API 普遍使用的模型（仅次于 GPT-4）。该模型也可以通过 Azure 直接调用。 Mistral Large 具有以下特点 - 支持英语、法语、西班牙语、德语和意大利语。 - 32K 标记上下文窗口。 - 精确的指令遵循使开发人员能够设计他们的审核策略。 - 原生支持函数调用。 Mistral 还发布了一个新的优化模型 Mistral Small，针对延迟和成本进行了优化，其性能优于 Mixtral 8x7B，并且延迟较低，这使其成为开源型号和旗舰型号之间的中间解决方案。

Rysana 发布 Inversion 大语言模型

Rysana 发布 Inversion 大语言模型 AI 公司 Rysana 今天在 X 宣布，发布 Inversion 大语言模型，该模型旨在解决传统人工智能系统中的速度、可靠性和推理问题。号称在错误率和速度上超过了 GPT-3.5-turbo 和 GPT-4-Turbo。申请候补名单地址：来源1：来源2：来源3： via 匿名标签: #AI #Rysana #Inversion 频道: @GodlyNews1 投稿: @GodlyNewsBot

微软入股、数值碾压Meta AI新贵Mistral发布旗舰大模型

微软入股、数值碾压Meta AI新贵Mistral发布旗舰大模型 Mistral AI正式成立于2023年5月。在去年这个时候，创办这家公司的三个法国年轻人还分别在谷歌DeepMind、Facebook上班。到去年12月，随着英伟达、赛富时以及一众华尔街资本挥舞支票，赶忙参与公司价值超4.5亿欧元（接近4.9亿美元）的融资，Mistral AI的市值已然超过20亿美元。（Mistral AI的三位创始人Guillaume Lample， Arthur Mensch， Timothée Lacroix都只有30多岁）发布最新大模型&首个聊天机器人Mistral AI周一宣布，正式推出最新旗舰模型Mistral Large。公司声称该模型具有“顶级的推理能力”，能用于处理复杂的多语言推理任务，包括文本理解、转换和代码生成。在AI理解能力测试基准MMLU的对比中，Mistral Large的得分仅次于GPT-4，略好于Anthropic开发的Claude 2。至于谷歌的Gemini Pro以及Meta的LLaMA 2 70B模型，则被甩开了一个身位。（来源：Mistral AI）据悉，这个模型拥有3.2万tokens的上下文窗口。按照一个token约等于0.75个英文单词的惯用算法，Mistral Large能够一次性从接近2.4万个英文单词的文档中精确提取信息。公司介绍称，该模型对英语、法语、西班牙语、德语和意大利语具有母语级流利程度，并对语法和文化背景有细致的理解。不过与一众大模型一样，实测下来中文也是能用的（后面有测试案例）。当然，最重要的是Mistral AI的开源属性除了使用云服务部署外，还能直接下载部署到本地。与封闭AI模型的龙头OpenAI不同，Mistral AI的大模型可以在“抱抱脸”等代码平台上下载，不过目前还没看到Large模型的文档。（来源：公司官网）公司也在周一发布首个聊天机器人LE CHAT，可以选用刚刚发布的Large模型，以及对延迟、成本进行优化的Mistral Small，还有一个名为Next的下一代原型模型。总而言之，提供了一个试用的窗口。从短暂的上手实测来看，这个模型哪怕使用中文，回答简单的推理题完全没有问题。（来源：LE CHAT）对于美国历史和法国历史，这个模型也能答得上来。不过在追加测试中，这个模型对中国文化历史的了解可以说是．．．．惨不忍睹，不过Mistral本身也没说这个模型懂中国历史。这也是国外开源AI模型存在的通病。（来源：LE CHAT、文心一言）微软收购公司部分股权同样在周一，Mistral AI与微软宣布达成了一项新的合作伙伴关系。从公告上来看，双方的合作主要包含三个方面：1、微软向Mistral AI提供开发和运营模型所需的算力；2、Mistral AI的大模型上架微软云服务，供全球用户部署；3、双方将探索合作，为特定客户制作特定模型。除了提供算力和云服务客户外，这份合作协议也使得微软持有Mistral AI“一小部分股权”。值得一提的是，Mistral这个法文单词的原意指的是“法国吹来的强风”，公司创立的愿景是搞AI其实不需要那么多钱，许多公司白白浪费了非常多的资金。创始人兼首席执行官Arthur Mensch直言，公司要做AI世界里资本效率最高的。Mensch透露，周一发布的Large模型，整个开发成本低于2000万欧元。作为对比，奥尔特曼去年提到过GPT-4的开发成本可能要超过1亿美元。对于微软而言，不管是代表封闭生态的OpenAI，还是开源社区的Mistral或Meta跑赢，公司都将是AI赛道的大赢家。这三家的AI模型都已经上架Azure的云服务，现在美股“股王”还持有前两家公司的股权。 ... PC版：手机版：

Google IO 将公布 PaLM 2 大模型

Google IO 将公布 PaLM 2 大模型 Google 将在年度开发者大会 Google I/O 上宣布它的新版通用大语言模型 PaLM 2。 PaLM 是 Google 在 2022 年 4 月宣布的大模型，有 5400 亿参数，Google AI 和 DeepMind 后在此基础上开发了一个用医学数据集微调的版本 Med-PaLM，它是首个在美国医师资格考试中获得及格分的 AI 模型。在 5 月 10 日周三举行的开发者大会上 Google 宣布的 PaLM 2 将是该公司最先进的大模型，其内部代号为“Unified Language Model（统一语言模型）”，包含逾百种语言，能执行范围广泛编程和数学测试，以及创意写作测试和分析。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人