大规模检索增强生成 - 构建用于同步和摄取数十亿文本嵌入的分布式系统。| blog

大规模检索增强生成-构建用于同步和摄取数十亿文本嵌入的分布式系统。文章详细介绍了NeumAI的一些技术和架构细节——NeumAI是一个用于大规模嵌入管理、优化和同步的数据平台，本质上有助于大规模RAG。RAG通过以“自然方式”执行搜索来帮助快速查找数据，并使用该信息/知识为需要此类信息的更准确的人工智能应用程序提供支持。这是许多人在构建准确且最新的人工智能应用程序时采用的最新方法。

在Telegram中查看

相关推荐

可扩展、分布式、协作式文档-图数据库，可用于实时 Web应用

可扩展、分布式、协作式文档-图数据库，可用于实时Web应用SurrealDB是一个端到端的云原生数据库，适用于Web、移动、无服务器、jamstack、后端和传统应用程序。SurrealDB通过简化数据库和API堆栈来减少现代应用程序的开发时间，消除对大多数服务器端组件的需求，让你能够更快、更便宜地构建安全、高性能的应用程序。SurrealDB既充当数据库，又充当现代、实时、协作的API后端层。SurrealDB可以作为单个服务器运行，也可以以高可用、高可扩展的分布式模式运行——支持从客户端设备进行SQL查询、GraphQL、ACID事务、WebSocket连接、结构化和非结构化数据、图形查询、全文索引、地理空间查询和逐行基于权限的访问。特征：数据库服务器或嵌入式库多行、多表ACID事务单节点或高度可扩展的分布式模式记录链接和有向类型图连接存储结构化和非结构化数据用于预先计算的高级分析的增量计算视图Realtime-api层，内置安全权限使用表格、文档和图形以任何方式存储和建模数据前端和后端开发的简单模式定义直接从网络浏览器和客户端设备连接和查询使用嵌入式JavaScript函数实现自定义高级功能

巨头联手打击 AI 造假：尼康索尼佳能相机将嵌入照片防伪技术

巨头联手打击AI造假：尼康索尼佳能相机将嵌入照片防伪技术据日经亚洲报道，相机巨头尼康、索尼和佳能将允许摄影师通过相机本身的技术嵌入数字签名。这些签名包含摄影师姓名、拍摄日期、时间和地点等信息，然后可以通过一个名为Verify的免费网络应用程序进行认证，该应用程序由一个由媒体机构、相机制造商和科技公司组成的全球联盟推出。如果图像由人工智能生成或由真实的照片篡改而来，Verify会将其标记为“无内容凭证”。预计这项新技术将在今年推出，索尼率先出击，承诺在“2024年春季”为其三款专业级无反相机推出固件更新。来源，频道：@kejiqu群组：@kejiquchat

微软以"数十亿美元的投资"扩大了OpenAI的合作关系

微软以"数十亿美元的投资"扩大了OpenAI的合作关系"我们与OpenAI形成了合作关系，围绕着一个共同的雄心壮志，即负责任地推进尖端人工智能研究，并将人工智能作为一个新的技术平台进行民主化，"微软首席执行官萨蒂亚-纳德拉说。"在我们合作关系的下一阶段，各行业的开发者和组织将可以通过Azure获得最好的人工智能基础设施、模型和工具链，以构建和运行他们的应用程序。"这项交易将看到微软增加其在开发和部署超级计算系统方面的投资，以协助OpenAI的研究。该交易的关键部分意味着微软是OpenAI的独家云合作伙伴，微软的云服务将为所有OpenAI的工作负载提供动力，包括产品、API服务和研究。微软还计划在各种消费者和企业产品中部署OpenAI的模型。据传，微软准备挑战Google，将ChatGPT整合到必应搜索结果中，据说该公司正在考虑将一些语言AI技术整合到其Word、PowerPoint和Outlook应用中。微软没有披露它在OpenAI上的具体投资额，但该公司一直希望利用其密切的关系来进一步商业化其AzureOpenAI服务。微软上周开始推出这项服务，它包括一些由OpenAI制作的人工智能模型，包括GPT-3.5、Codex和DALL-E。它是为企业利用OpenAI的模型而设计的，基本上是将GPT-3.5与你所期望的Azure的扩展性以及管理和数据处理的附加功能打包。关于这项交易的传言表明，微软可能会获得OpenAI75%的利润，直到它获得投资回报和该公司49%的股份。OpenAI表示，在这笔交易之后，它仍然是一家利润封顶的公司，允许它在有制衡的情况下继续筹集资金。"我们过去三年的合作关系非常好，"OpenAI首席执行官SamAltman说。"微软与我们的价值观相同，我们很高兴能继续我们的独立研究，并致力于创造先进的人工智能，使每个人都受益。"微软在2019年向OpenAI投资10亿美元后，于2020年购买了GPT-3背后的基础技术的独家授权。它与OpenAI建立了密切的关系，还计划在Bing中增加一个由OpenAI的DALL-E2驱动的AI文本-图像模型。...PC版：https://www.cnbeta.com.tw/articles/soft/1340681.htm手机版：https://m.cnbeta.com.tw/view/1340681.htm

夏普将与KDDI等协商构建AI数据中心

夏普将与KDDI等协商构建AI数据中心夏普公司3日正式宣布，为了设立面向人工智能的数据中心，与KDDI等就启动协商达成一致。全资子公司堺显示器产品公司将在今年9月底前停产大型液晶面板，夏普计划利用其场地打造新的收益来源。夏普已于2日同系统外包开发商Datasection及美国企业等3家公司达成协议。用于生成式AI学习和推理等的图形处理器(GPU)将采购美国英伟达的下一代型号。预计将建成亚洲最大规模的数据中心。夏普方面称，通过确保大规模电力及场地，“力争构建能迅速应对各类课题的AI数据中心”。——

谷歌宣布向云计算客户开放Gemini Pro 开发者可用其构建应用

谷歌宣布向云计算客户开放GeminiPro开发者可用其构建应用据报道，谷歌发布了面向企业的GeminiPro，允许开发者利用谷歌最新的人工智能模型构建应用程序。Gemini是一个通过大量数据训练的大型人工智能系统，可以根据用户的要求生成新内容。上周，谷歌推出了Gemini，声称这是第一款在许多领域都能超越OpenAIGPT-4的大语言模型，现在它又推出了面向企业的GeminiPro。谷歌云客户可以使用GeminiPro创建人工智能聊天机器人、易于查询的库存数据库以及营销演示等应用程序。该公司还强调，GeminiPro最初将免费提供给云客户，但有一些限制。不过，谷歌表示，最终计划确保其云人工智能产品的“价格具有竞争力”。谷歌公布的参数显示，GeminiPro基于文本的功能比其6月份发布的上一代人工智能模型PaLM2的输入成本低4倍，输出成本低2倍。谷歌云业务首席执行官托马斯·库里安（ThomasKurian）表示，这款人工智能模型的构建旨在“概括和无缝地理解、操作和组合不同类型的信息，包括文本、代码、音频、图像和视频，就像人类同时看到、听到、阅读、收听和谈论不同类型的信息一样。”虽然谷歌是生成式人工智能领域的先驱，但其产品的受欢迎程度却远远落后于对手。上周，谷歌试图通过发布Gemini来反驳这种说法。Gemini有三款模型，分别为GeminiUltra、GeminiPro和GeminiNano。谷歌已经开始推出最小的Nano版本，可以直接在谷歌旗舰智能手机Pixel8Pro等设备上运行。同时，该公司还发布了定制版GeminiPro版本，这是谷歌的人工智能聊天机器人，旨在与OpenAI广受欢迎的ChatGPT展开竞争。通过向应用程序开发者和企业发布GeminiPro，谷歌希望发出这样的信息：它不再落后于OpenAI及其最新的人工智能系统GPT-4，该系统可通过合作伙伴微软的Azure云计算平台访问。谷歌表示，GeminiPro支持全球180个国家和地区的38种语言，目前接受文本作为输入，并可生成文本输出。谷歌还发布了一个专用的GeminiProVision平台，可以处理来自用户的基于文本和图像的提示。该公司还表示，GeminiUltra是该公司用于执行“高度复杂”任务的最大、功能最强的模型，在明年向公众发布之前，将向选定的云客户和合作伙伴提供早期试验。谷歌宣布，GeminiPro将被整合到两款关键的云产品中，即GoogleAIStudio和VertexAI。其中，GoogleAIStudio是一款基于网络的免费开发者工具，谷歌称其为“使用Gemini最快的构建方式”。该工具允许客户使用GeminiAPI开发应用程序。与此同时，VertexAI为开发者和云客户提供了更多的定制服务。企业将能够使用自己的数据定制Gemini，并构建基于Gemini的搜索工具和聊天机器人等应用程序。库里安表示，GeminiPro的定价正变得“更具吸引力”。该公司表示，开发者将可以通过GoogleAIStudio免费使用GeminiPro和GeminiProVision，这适用于大多数应用程序开发需求。更灵活的VertexAI在明年年初之前都是免费的。谷歌还公布了此前发布的人工智能模型的升级版本Imagen2，谷歌的文本到图像技术，将改进照片真实感，文本渲染和logo生成能力。谷歌还推出了MedLM，这是一系列针对医疗保健行业进行微调的模型，基于该公司在Med-PaLM2上所做的工作。Med-PaLM2是谷歌的人工智能模型，经过了专业医学知识的培训。谷歌还宣布与MistralAI建立全球合作伙伴关系，MistralAI是一家总部位于巴黎的人工智能初创公司，专注于开源软件。两家公司在一篇博客文章中表示，MistralAI将在谷歌云的基础设施上分发一些人工智能产品，包括优化的专有语言模型。虽然这项协议不具有排他性，但MistralAI的首席执行官兼联合创始人亚瑟·门施（ArthurMensch）赞扬了谷歌云灵活的工具和支持该公司产品的能力。他说：“谷歌云的开源支持和负责任开发人工智能技术的原则，广泛而可靠的基础设施能力，以及围绕隐私和安全做出的承诺，与我们开发开放可用模型的使命非常一致。”随着最近的发布，谷歌对Gemini的定位是“我们进入人工智能领域的下一步”，并吹嘘其拥有“最先进的能力”。这可能是谷歌试图转移人们对OpenAIChatGPT的关注，或者与他们正面交锋。如果发生这种情况，他们将更接近他们想要达到的目标。但目前，这些产品需要表现良好，并与消费者产生共鸣，包括云客户。...PC版：https://www.cnbeta.com.tw/articles/soft/1404299.htm手机版：https://m.cnbeta.com.tw/view/1404299.htm

埃里森表示，甲骨文今年在英伟达芯片上花费了“数十亿美元”

埃里森表示，甲骨文今年在英伟达芯片上花费了“数十亿美元”6月28日（路透社）—甲骨文公司正在花费“数十亿美元”购买英伟达公司的芯片，以扩展针对新一波人工智能浪潮的云计算服务。甲骨文创始人兼董事长拉里·埃里森周三表示，甲骨文的云部门正在努力与亚马逊网络服务公司和微软公司等规模更大的竞争对手抗衡。为了获得优势，Oracle专注于构建快速网络，该网络可以处理创建类似于ChatGPT的AI系统所需的大量数据。甲骨文还购买了大量图形处理单元（GPU），旨在处理人工智能工作的数据。埃里森在Ampere会议上表示，甲骨文还在Nvidia芯片上花费了“数十亿”美元，但在其投资的芯片初创公司AmpereComputing和AdvancedMicroDeviceInc的中央处理器单元(CPU)上投入更多。——

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人