AWS公开数据集 亚马逊在其 Amazon Web Services 中提供了一些大型数据集可以免费下载,需要注册一个aws账户

亚马逊在其AmazonWebServices中提供了一些大型数据集可以免费下载,需要注册一个aws账户,新用户有免费访问的权限Google提供了一些#数据集作为其BigQuery工具的一部分。包括GitHub公共资料库的数据,HackerNews的所有故事和评论。Youtube标签视频数据集包括来自4800个可视化实体的800万个YouTube视频ID和相关标签。它具有数十亿帧的预计算的、最先进的视觉功能

相关推荐

封面图片

持续更新的中文指令微调数据集,支持双语微调和数据修正。

持续更新的中文指令微调数据集,支持双语微调和数据修正。本数据集包括中文和英文的混合数据集,方便双语微调,以及后续做持续的数据修正。原始的Alpaca英文数据集也存在不少的问题,个别的数学类的sample是错的,有少部分output字段需要修正,一些的标签没有对齐等。本数据集会对原始的数据集进行修改和修正。再此基础上,翻译出对应的中文版本,中文版基本是原始sample的翻译,但是对于一些比如押韵类、时态类的一些instruction,直接翻译导致韵脚丢失,时态不一致等。需要对应的进行人工改写。主要分为以下几个方面:修改原始英文数据集的一些问题翻译为中文数据集调整直译导致的一些samplecode等一些特殊的输出不进行翻译对齐一些特殊的标签或者拒绝生成等输出#数据集

封面图片

因马斯克拒绝支付AWS的费用,亚马逊威胁要停付其在Twitter的广告费

因马斯克拒绝支付AWS的费用,亚马逊威胁要停付其在Twitter的广告费埃隆·马斯克(ElonMusk)在Twitter不断努力削减成本的过程中遇到了障碍:Twitter正在压榨以节省资金的一些供应商也是其广告客户。据称,就在上个月,Twitter销售和营销人员的同事告诉他们,亚马逊曾威胁要停止支付其在Twitter上投放的广告费用,因为该社交网络数月来拒绝支付其云计算服务的AmazonWebServices账单。——

封面图片

一个包含大约100万个AI偏好的数据集,从teknium/OpenHermes-2.5中提取而来。

一个包含大约100万个AI偏好的数据集,从teknium/OpenHermes-2.5中提取而来。它结合了来自源数据集和另外两个模型Mixtral-8x7B-Instruct-v0.1和Nous-Hermes-2-Yi-34B的回答,并使用PairRM作为偏好模型对生成结果进行评分和排名。该数据集可用于训练偏好模型或通过直接偏好优化等技术对齐语言模型。#数据集

封面图片

MiraData:大规模视频数据集,具有长时长和结构化描述

:大规模视频数据集,具有长时长和结构化描述视频数据集在视频生成(如sora)中发挥着至关重要的作用。然而,现有的文本视频数据集在处理长视频序列和捕捉镜头转换方面往往存在不足。为了解决这些局限性,我们引入了MiraData(迷你索拉数据),这是一个专门为长视频生成任务设计的大规模视频数据集。MiraData的主要特点长视频时长:以往的数据集通常视频片段很短(通常少于6秒),而MiraData则不同,它侧重于未剪切的视频片段,持续时间从1分钟到2分钟不等。这种延长的持续时间可以对视频内容进行更全面的建模。结构化字幕:MiraData中的每段视频都配有结构化字幕。这些标题从不同角度进行了详细描述,增强了数据集的丰富性。标题平均长度为349个字,确保了视频内容的全面呈现。

封面图片

亚马逊员工警告其AI聊天机器人Q有"严重幻觉" 可能泄露机密数据

亚马逊员工警告其AI聊天机器人Q有"严重幻觉"可能泄露机密数据Q的早期困境正值亚马逊努力与微软、Google和其他科技公司在建立工具和基础设施以利用人工智能优势的竞争中超越亚马逊的看法作斗争之际。今年9月,亚马逊宣布将向人工智能初创公司Anthropic投资40亿美元。本周二,在亚马逊网络服务(AmazonWebServices)年度开发者大会上,亚马逊发布了Q,这可以说是该公司本周发布的一系列人工智能新举措中最受瞩目的一个。在一份声明中,亚马逊淡化了员工讨论的重要性。发言人说:"一些员工正在通过内部渠道和票务系统分享反馈意见,这是亚马逊的标准做法。这些反馈没有发现任何安全问题。我们感谢所有已经收到的反馈,并将继续调整Q,使其从预览版产品过渡到全面可用。"Q现已推出免费预览版。亚马逊高管本周在台上表示,最初,它将能够回答开发人员有关AWS的问题、编辑源代码并引用来源。它将与微软和Google的类似工具竞争,但价格至少在开始时低于竞争对手。在发布Q的过程中,亚马逊高管宣传它比ChatGPT等消费级工具更安全。亚马逊网络服务公司(AmazonWebServices)首席执行官亚当-塞利普斯基(AdamSelipsky)告诉《纽约时报》,"由于安全和隐私问题,企业禁止使用这些人工智能助手"。对此,《纽约时报》报道称,"亚马逊打造的Q比消费者聊天机器人更安全、更私密"。一份关于Q的幻觉和错误回答的内部文件指出:"亚马逊Q可能会产生幻觉,并返回有害或不恰当的回答。例如,亚马逊小Q可能会返回过时的安全信息,从而使客户账户处于危险之中。文件中概述的风险是大型语言模型的典型风险,所有这些模型至少在某些时候会返回错误或不恰当的回答。"...PC版:https://www.cnbeta.com.tw/articles/soft/1401383.htm手机版:https://m.cnbeta.com.tw/view/1401383.htm

封面图片

YouTube 官方博客宣布,97% 的 YouTube 连接是加密的,另外3%是因为一些设备不完整支持现代HTTPS,它计划未

YouTube官方博客宣布,97%的YouTube连接是加密的,另外3%是因为一些设备不完整支持现代HTTPS,它计划未来逐步淘汰不安全的连接。YouTube是世界流量最大的网站之一,它的软件工程师表示由于AES硬件加速已经广泛使用,部署HTTPS加密所有视频服务不需要额外增加机器,今天的HTTPS连接速度很快。YouTube工程师称,加密能确保数据完整性,部署HTTPS事实上帮助消除了许多类型的串流错误。YouTube同时宣布其域名youtube.com将启用HSTS,帮助重定向HTTP到HTTPS。https://youtube-eng.blogspot.com/2016/08/youtubes-road-to-https.html

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人