: GPT驱动的视频检索和流媒体工具,可以用于以下用途:上传多个以创建库或集合,搜索这些并获得实时响应或编译,将可的集合发布到C

: GPT驱动的视频检索和流媒体工具,可以用于以下用途:上传多个视频以创建库或集合,搜索这些视频并获得实时视频响应或编译,将可搜索的集合发布到ChatGPT商店,接收摘要文本答案(RAG),从特定视频获得关键见解 | #工具

相关推荐

封面图片

:一个公有领域和允许复制的历史文本的集合,干净利落地呈现 (无广告或过度布局)用于教育用途。这里提供的主要来源是用于高中和大学/

:一个公有领域和允许复制的历史文本的集合,干净利落地呈现 (无广告或过度布局)用于教育用途。这里提供的主要来源是用于高中和大学/学院课程。 该网站从一开始就对学生应该获得的资源进行了非常广泛的了解,并且长期与“西方文明”历史方法相关的文件也提供了有关拜占庭,伊斯兰,犹太,印度,东亚和非洲历史的大量信息。您还会发现许多与女性历史和LGBT研究特别相关的文件。

封面图片

以下是我在做和想做的一些产品,大家有什么偏好或建议吗?

以下是我在做和想做的一些产品,大家有什么偏好或建议吗? 1. 套壳对话/画图/generator, 2. RAG 联网搜索, 3. 信息处理文章/音频/视频/pdf解析与摘要, , 4. 群聊总结/群管理工具, 5. 取名智能体服务, 6. GPTs 导航站, 7. AI 通用导航站, 8. 一键发布文章/视频/动态,提交产品工具, 9. AI 数字人,声音转换/数字人克隆/复活,整合 heygen / whisper 的一些能力 10. 智能体工作流编排平台,类似 dify/fastgpt/coze 11. 代码生成平台,text-to-code,类似 12. 视频创作者工具,text->脚本->插画->视频->发布 13. AI 音乐播放器,类似网易云音乐,播放 suno AI 生成的音乐

封面图片

是一个快速而简单的网站建设工具,使您能够通过拖放功能建立一个网站,完全不需要编码。有数百个预制模板供你选择。此外,所创建的网站是

是一个快速而简单的网站建设工具,使您能够通过拖放功能建立一个网站,完全不需要编码。有数百个预制模板供你选择。此外,所创建的网站是响应式的,对手机友好。 职业大师是一个伟大的搜索引擎,可以为专业领域的每个类别和子类别找到合适的面试问题。你可以找到与几乎所有领域有关的询问,并为你的梦想工作做相应的准备。 作为复古游戏的档案馆,老游戏下载拥有70年代、80年代和90年代的视频游戏的巨大数据库。这样你就可以重温你的童年记忆,并与你的朋友度过一段美好的时光。 用使你的PowerPoint幻灯片更有趣。它有一个巨大的有趣的PowerPoint幻灯片设计模板的集合,你可以下载和定制您的需求。 是一个日程安排工具,帮助你组织和管理你的工作日程。你可以在该工具中创建简单的规则并添加你的可用性偏好。通过分享你的日程安排的链接,你可以让人们知道你什么时候有空,这样他们就可以与你预定一个不影响你其他工作的会议。 是一个搜索引擎,让你从任何网站上搜索人的姓名和电子邮件地址。它有超过1亿个电子邮件地址的索引,并提供有效的搜索过滤器,以帮助你准确地找到你需要找到的电子邮件。 是一个聪明的由人工智能驱动的在线工具,用它可以去除几乎所有图片的背景。你可以有一个纯白色的背景或透明的PNG背景。通过插件,你可以把它与你现有的工具或工作流程结合起来。 如果你想去除视频的背景,你可以使用。它是一个智能的在线工具,可以让你删除不同支持格式的任何片段的背景。你可以保留透明的背景,也可以用其他东西代替它100%自动。 是一个由人工智能驱动的在线释义工具。它帮助你以不同的形式改写和加强你的句子。你还可以选择标准或流程模式,并让它集成到Chrome或微软Word中,以获得更顺畅的工作流程。 是一个自由设计师的平台,有两种工作方式。作为一个自由职业者,你可以找到设计项目,作为一个雇主,你可以为你的工作找到专业的自由设计师。除了设计,你还可以从网络开发、市场营销、写作和其他领域找到客户或自由职业者。 作为一个生产力工具,Axiom使你能够为你的浏览器创建机器人,使重复性任务自动化。你不必为此做任何编码工作,下载Chrome扩展程序,在任何网站或网络应用中实现流程自动化。 有没有想过一个可以回答几乎所有问题的来源?那么,WolframAlpha就是一个。从复杂的计算到回答任何领域的问题,该工具拥有的知识库和人工智能技术可以做到这一切。 一个真正的多功能和完全免费的工具,可以为你的文件做很多事情。你可以去除图像的背景,合并、转换、解锁和编辑PDF,将文件从一种格式转换成另一种格式,编辑视频和图像,以及更多。 为你提供合适的开源替代SaaS产品。它有300多个专有工具的替代品,你可以使用高效的搜索功能来为你找到一个。 正如其名,Magic Eraser是一个在线工具,可以从图像中删除任何物体。只要上传你的图片,标出你想删除的对象或区域,就可以了!你可以下载编辑过的图片。你可以下载编辑过的图片。它是免费的,可以不限数量的图片以及其他功能。 是一个在线照片修饰工具,它可以从你的图像中删除人或物体,擦除水印,和时间戳等,就像它们从来没有存在过一样。你可以使用免费版本来编辑无限的图片,但最多是720p的分辨率。它也可以作为iOS应用程序使用。 为了给你的系统添加一点乐趣,自定义光标可以让你把你的指针改成任何一个惊人的物体。从你最喜欢的人物到随机的有趣物体,你可以把你的光标改成任何东西。它可以在Chrome浏览器和Windows PC上使用。 是一个在线简历制作工具。你可以从头开始创建一份专业简历,或者使用模板为自己定制一份。你可以选择一个有创意的或更保守的简历模板,甚至可以在其中添加求职信。

封面图片

北大发起复现Sora:框架已搭 袁粒、田永鸿领衔 AnimateDiff大神响应

北大发起复现Sora:框架已搭 袁粒、田永鸿领衔 AnimateDiff大神响应 为什么发起这项计划?因为资源有限,团队希望集结开源社区的力量,尽可能完成复现。消息一出,就有人北大校友兼AnimateDiff贡献者等人即刻响应:还有人表示可以提供高质量数据集:所以,“国产版Sora”的新挑战者,就这么来了?计划细节,已完成3个初步功能首先,来看目前公布的技术细节即团队打算如何复现Sora。整体框架上,它将由三部分组成:Video VQ-VAEDenoising Diffusion Transformer(去噪扩散型Transformer)Condition Encoder(条件编码器)这和Sora技术报告的内容基本差不多。对于Sora视频的可变长宽比,团队通过参考上海AI Lab刚刚提出的FiT(Flexible Vision Transformer for Diffusion Model,即“升级版DiT”)实施一种动态掩码策略,从而在并行批量训练的同时保持灵活的长宽比。具体来说, 我们将高分辨率视频在保持长宽比的同时下采样至最长边为256像素, 然后在右侧和底部用零填充至一致的256x256分辨率。这样便于videovae以批量编码视频, 以及便于扩散模型使用注意力掩码对批量潜变量进行去噪。对于可变分辨率,团队则表示在推理过程中,尽管在固定的256x256分辨率上进行训练,,但使用位置插值来实现可变分辨率采样。具体而言:我们将可变分辨率噪声潜变量的位置索引从[0, seq_length-1]下调到[0, 255],以使其与预训练范围对齐。这种调整使得基于注意力的扩散模型能够处理更高分辨率的序列。对于可变时长,则使用VideoGPT中的Video VQ-VAE,,将视频压缩至潜在空间,支持这一功能。同时,还要在扩展空间位置插值至时空维度,实现对可变时长视频的处理。在此,主页也先给了两个demo,分别是10s视频重建和18s重建,分辨率分别为256x256和196x196:这三个功能都已经初步实现。相关的训练代码也已经在对应的仓库上上线:成员介绍,目前的训练是在8个A100-80G上进行的(明显还远远不够),输入大小为8帧 128 128,大概需要1周时间才能生成类似ucf(一个视频数据集)的效果。而从目前已经列出的9项to do事项来看,除了可变长宽比、可变分辨率和可变时长,动态掩码输入、在embeddings上添加类条件这两个任务也已完成。未来要做的包括:采样脚本添加位置插值在更高分辨率上微调Video-VQVAE合并SiT纳入更多条件以及最重要的:使用更多数据和更多GPU进行训练袁粒、田永鸿领衔严格来说,Open Sora计划是北大-兔展AIGC联合实验室联合发起的。领衔者之一袁粒,为北大信息工程学院助理教授、博导,去年获得福布斯30岁以下亚洲杰出人物榜单。他分别在中国科学技术大学和新加坡国立大学获得本科和博士学位。研究方向为深度视觉神经网络设计和多模态机器学习,代表性一作论文之一T2T-ViT被引次数1000+。领衔者之二田永鸿,北京大学博雅特聘教授,博士生导师,IEEE、ACM等fellow,兼任鹏城实验室(深圳)人工智能研究中心副主任,曾任中科院计算所助理研究员、美国明尼苏达大学访问教授。从目前公布的团队名单来看,其余成员大部分为硕士生。包括袁粒课题组的林彬,他曾多次以一作或共同一作身份参与了“北大版多模态MoE模型”MoE-LLaVA、Video-LLaVA和多模态对齐框架LanguageBind(入选ICLR 2024)等工作。兔展这边,参与者包括兔展智能创始人、董事长兼CEO董少灵(他也是北大校友)。完整名单:谁能率先发布中文版Sora?相比ChatGPT,引爆文生视频赛道的Sora研发难度显然更大。谁能夺得Sora中文版的首发权,目前留给公众的是一个大大的问号。在这之中,传闻最大的是字节。今年2月初,张楠辞去抖音集团CEO一职,转而负责剪映,就引发了外界猜测。很快,一款叫做“Boximator”的视频生成模型浮出水面。它基于PixelDance和ModelScope两个之前的成果上完成训练。不过,很快字节就辟谣这不是“字节版sora”:它的效果离Sora还有很大差距,暂时不具备落地条件,并且至少还需2-3个月才能上线demo给大家测试。但,风声并未就此平息。去年11月,字节剪映悄悄上线了一个AI绘画工具“Dreamina”,大家的评价还不错。现在,又有消息称:Dreamina即将上线类似sora的视频生成功能(目前在内测)。不知道,这一次是不是字节亮出的大招呢?Open Sora项目主页: ... PC版: 手机版:

封面图片

不指望硬件成看点?苹果WWDC24可能会有哪些“升级”

不指望硬件成看点?苹果WWDC24可能会有哪些“升级” WWDC面向的是开发者,今年的重中之重将是iOS 18。苹果将展示如何将人工智能(AI)技术整合到其设备和软件中,其中包括与OpenAI达成的历史性合作伙伴关系。随着这场大会的临近,各种关于iOS 18 AI应用和功能的传言已经在网上出现。根据科技网站The Information报道,苹果将使用其Ajax大语言模型驱动部分AI新功能。该公司计划采用虚拟黑盒技术处理AI应用上的数据,就连其员工也无法接触到这些数据,这有助于苹果兑现向用户做出的数据隐私承诺。以下是iOS 18中各项应用和服务在AI方面的升级,以及其他改进与变化:Siri:AI驱动未来·苹果的数字助手准备进行一次AI大升级。Siri将基于苹果自己的大语言模型,允许Siri控制应用程序内部的单独功能,无需开发者或用户进行任何必要的设置,就像App intenents框架或Siri捷径一样。相反,用户可以要求Siri做一些事情,比如删除电子邮件或编辑照片。Siri将迎来大升级·一些升级后的Siri AI功能要到明年才能准备就绪。例如,Siri处理多步骤任务功能或许会推迟。·更高级版本的Siri也将登陆Apple Watch,供用户随时随地使用。有报道称,用户可以使用手表上的Siri在其他设备上播放音乐。·Siri将能够接收听起来更自然的声音。·Siri将能够概述通知,包括人员、公司、日历事件、地点、日期等。照片:换新颜·一个新的界面即将到来。·用户将可以使用AI修饰照片,也许会让苹果在这个领域挑战Google相册。·例如,“清除”功能可以让用户使用生成式AI技术从照片中删除物体,类似于Google的魔力橡皮擦(Magic Eraser)。苹果照片的AI清除功能·有报道指出,苹果开发了一款名为“生成游乐场”(Generative Playground)的内部应用程序,该应用使用生成式AI来创建和编辑图像。目前还不清楚这一功能将如何呈现给终端用户,尽管信息(iMessage)已被发现以应用扩展的形式整合了它。Safari:整合更多AISafari将通过新的智能搜索功能提供网页和新闻文章的AI摘要。备忘录:融合AI·用户将能够要求AI提取备忘录摘要。·生成式AI还将帮助转录备忘录中的音频。·应用内录音将支持音频转录和AI摘要。·数学笔记(Math Notes)将通过AI识别数学方程的文本,帮助用户创建图形和解决方程。·用户还可以选择在输入时自动完成数学方程。·苹果内部有一个“智力计划”(Project Greymatter),它是一组AI工具的代号,这些工具将被集成到Safari、照片和备忘录等核心产品中。·语音备忘录的实时转录也即将到来。信息:AI大变脸·将支持生成式AI表情符号,让用户可以利用AI技术创建自己的表情符号。·AI可以概述未读短信。·总体上更深入地集成Siri。·“点按回应”(Tapbacks)将拥有新的图标。·除了消息本身的效果外,还将支持单个单词的消息效果。·短信将提供由苹果设备上的Ajax大模型生成的建议回复,使短信回复更容易。·信息有望在今年支持富媒体通信(RCS)。当用户通过信息与Android用户发短信时,它将带来已读回执、正在输入提示以及高质量的视频和图像。日历用户在回复短信时,苹果的大语言模型将能够与日历应用通信,查询安排。邮件邮件也将获得由Ajax生成的建议回复内容。设置设置将改进界面和更新,使得组织更有序,搜索功能更强,整体更条理。控制中心·一个新的音乐小组件即将推出。·HomeKit将得到改进,以便更好地集成智能家居。通知·AI将通过摘要的形式提供错过的通知。·苹果正在开发一种叫做“增强”通知的功能。聚焦搜索聚焦搜索将变得更快,搜索更可靠。主屏·iOS 18将让你随心所欲地放置应用图标,而不用让它们与网格对齐。·用户还可以改变应用图标的颜色,这可能是苹果对Google多彩设计语言“Material You”的回应。地图在iOS 18中,地图将支持定制化路线创建,用户可以设计自己的旅行路线。音乐Apple Music可能会推出自己的AI自动生成播放列表,与流媒体音乐服务Spotify展开竞争。更多改进其他计划更新的应用包括Freeform、Xcode以及苹果的生产力应用,例如Keynote和Pages,它们可能会获得生成式AI功能。 ... PC版: 手机版:

封面图片

黄仁勋剧透下一代GPU芯片 新演讲又把摩尔定律按在地上摩擦

黄仁勋剧透下一代GPU芯片 新演讲又把摩尔定律按在地上摩擦 好好好,像做iPhone一样造芯片。到这一代Blackwell为止,英伟达已经把AI模型有效扩展到万亿参数。(还给token定了个译名:词元)。1.8万亿参数GPT4的训练能耗,8年降低至原来的1/350。推理能耗,8年降低至原来的1/45000。看着这一波亮相和剧透,网友真相了:英伟达没有竞争对手,而是选择将摩尔定律放在地上摩擦……老黄是在书写自己的定律。所以应该叫老黄定律?还是英伟达定律?ComputeX前夜,老黄一开场就展开了一波隐形卖货,他自称不太准确的“CEO数学”:买得越多,省得越多……The more you buy, the more you save.经典语录依然引发现场欢呼大笑:虽然不太准确,但好像有些道理……除此之外,还有一些新产品亮相,包括能够模拟气冲的天气预测模型CorriDiff、数字人微服务、BlackWell系统、Spectrum-X、机器人平台Isaac……好了话不多说,这就来看看老黄这次到底搞了哪些事情“AI Factory Is generating”谈到当前新的产业革命,老黄表示:新的计算时代正在开始;而AI Factory正在诞生。他在现场展示了BlackWell系统。3月份GTC大会上还遮遮掩掩地说是GPT-MoE-1.8T模型,这下彻底摊牌了:GPT-4参数就是1.8T。跟DGX Hopper相比。现场还看到了它的真身,大概有两米那么高吧…而真正的AI Factory大概会长这样,大概有32000GPU。AI加速每个应用程序AI对于企业的影响,老黄认为AI加速每一个应用程序。他首先谈到了NIM推理微服务,这是一个帮助开发者或者企业轻松构建AI应用,简化大模型部署程序。不管是聊天机器人、还是生活/驾驶助手等,部署时间都能从几周缩短到几分钟。运行Meta Llama 3-8B的NIM可以产生比不使用NIM多3倍的tokens。企业和开发者可以使用NIM运行生成文本、图像、视频、语音和数字人类的应用程序。而背后源于丰富的技术合作生态近200家技术合作伙伴,包括Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI和Synopsys等,正在将NIM集成到他们的平台中。此次在这个NIM中还有上新,也就是ACE 生成式AI微服务,数字人AI技术套件。除了原有自动语音识别、文本到语音的转换和翻译、Nemotron语言模型、 Audio2Face等套件,还增加了两个技术:一个是可以基于音轨生成身体姿势Audio2Gesture;一个Nemotron-3 4.5B,这是英伟达首款SLM(小爱语言模型),专为低延迟端侧设备而生。∂接下来,这一数字人微服务将部署在一亿台RTX AI PC上面。当前英伟达在新的合作伙伴,比如华硕、MSI的加入下,已经拥有超过200种RTX AI PC型号。还推出了RTX AI Toolkit,一个工具和SDK集合,帮助Windows开发者定制优化本地部署模型。同Mac相比,部署了RTX的Windows的Stable Diffusion推理速度是Mac的7倍。每一台带有RTX的PC,都是一台RTX AIPC。用于机器人开发的技术平台Isaac这次一同亮相的,还有用于机器人开发的技术平台,NVIDIA Isaac。为啥搞这玩意儿呢,老黄给出的理由是这样的:机器人时代已经到来。有朝一日,所有会移动的东西,都将实现自主化。这个Isaac平台具体长啥样呢?Isaac平台提供一系列英伟达加速库、AI基础模型和仿真技术,供机器人制造商集成到自己的技术栈中。注意,平台是模块化的,允许公司单独或一起采用多种技术。具体而言,其中包括:NVIDIA Isaac ROS:一系列模块化的ROS 2包,为ROS社区开发者带来NVIDIA加速和AI模型NVIDIA Isaac Perceptor:一个参考工作流程,提供基于AI的自主移动机器人的多摄像头3D环视能力NVIDIA Isaac Manipulator:一个简化AI启用机械臂开发的参考工作流程NVIDIA Isaac Sim:一款参考应用程序,用于在基于NVIDIA Omniverse平台的物理环境中模拟、测试和验证机器人,并生成合成数据NVIDIA Isaac Lab:Isaac Sim中的参考应用程序,针对AI机器人基础模型训练的强化、模仿和迁移学习进行了优化据介绍,目前,包括比亚迪电子、西门子、泰瑞达机器人和Intrinsic(Alphabet的子公司)在内,全球超多名列前茅的机器人开发团队,都在采用Isaac平台。这些团队用上Isaac,一边提高制造工厂、仓库和配送中心的效率,同时确保人类同事的安全;一边也能充当重复劳动和超精确任务的执行者。现场放出了很多demo,很多工厂在英伟达Omniverse里建造了一个完全模拟现实的自助工厂,以及基于Isaac平台开发的AI机器人。官网悄悄推出游戏Agent助手除了现场老黄亲自发布的上述内容外,我们在英伟达官网还找到了一个彩蛋,一个巨久远的call back。Project G-Assist。时间回到2017年愚人节,英伟达官网开了个大玩笑:宣称自家发布了一款支持10080款游戏的USB人工智能超算卡GeForce GTX G-Assist。重点在于它很AI。GeForce GTX G-Assist像是个AI游戏助手,可以帮助玩家自动完成游戏操作,甚至代打击败Boss。今天,英伟达真的将这个愚人节玩笑变为现实英伟达官网上线Project G-Assist,一套工具和模型的集合而成的AI Agent系统,供游戏和应用程序开发者使用。通过前后剧情,Project G-Assist利用大模型对游戏输出响应,能够检查游戏性能和系统设置,建议用户优化以充分利用可用硬件,或者适当升级角色。玩家这边呢,还可以通过Project G-Assist找到最好的武器,也可以查询到最牛的攻略,然后就可以或制作武器材料,或一路杀怪通关。总而言之,Project G-Assist可以让人有个Agent外挂,但是不会让你完全挂机,官网还贴心表示:G-Assist 项目不会像我们在2017年愚人节预言视频中那样完全替代您玩游戏,但它可以帮助您从您最喜欢的游戏中获得更多收益。游戏体验再上大分!据介绍,Project G-Assist支持各种模态的输入。可以是来自玩家的文本提示,或声音指令;可以是屏幕上显示框架的上下文;可以是来自应用程序或系统本身的API。△演示人员语音输入中这些数据都通过连接了游戏知识数据库的大模型处理,然后使用RAG(检索增强生成)生成和用户相关的查询结果没错,Project G-Assist允许玩家使用PC或云端RTX AI驱动的知识库。Project G-Assist开发工具将出现在即将推出的RTX AI开发套件中,具体会用在哪些游戏上,还需要游戏开发商来决定并提供支持。为了让大家更好地使用Project G-Assist,英伟达贴心地附上视频教学大礼包,需要可自取。One More Thing整场发布会,老黄还整了不少活儿。比如AI老黄似乎已经成了发布会常客。在介绍天气预测模型时,他坦白承认在视频中那么流利讲普通话的那位是AI生成的,因为自己中文不太好。而本场重磅的BlackWell系统、AI Factory的核心构成,也被他各种搬来搬去……除了下一代GPU取名Rubin,我们还看到 Vera CPU,他们共同出现在新的Vera Rubin加速器上。而这一名称来源,实际上是来自美国一位女天文学家Vera Rubin,她是研究暗物质先驱。以及,COMPUTEX 2024不愧是6月开头就炸场的AI终端大戏。除了黄院士外,英特尔、AMD、高通等老板都悉数到场,接下来几天会挨个发表演讲。这些主题演讲,绝大部分都跟AIPC有关。大家一起蹲一蹲吧~ ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人