不用开发,直接花二三十美元买一套完整的AI产品源码,也是一个不错的快速上线产品的方法。

不用开发,直接花二三十美元买一套完整的AI产品源码,也是一个不错的快速上线产品的方法。这个网站里的源码都是完整的项目,有些甚至还有配套的App客户端。价格都不贵,不超过50美元一套。总共480个AI相关源码,大家没事可以去多翻翻,多看看,看看Demo,找到合适的源码,就可以购买来自己部署上线了。https://mp.weixin.qq.com/s/9EBxUXdE--fRykaz7vCB3w

相关推荐

封面图片

Minimax的AI对话机器人问答产品海螺问问上线了,产品的语音对话能力、模型能力以及体验打磨都非常的不错。

Minimax的AI对话机器人问答产品海螺问问上线了,产品的语音对话能力、模型能力以及体验打磨都非常的不错。体验好的一方面是海螺问问有非常自然的语音模型接入,支持语音回答问题。还支持跟软件进行类似ChatGPT的实时的AI语音对话,但是没有ChatGPT那股外国腔,比如视频第一段的演示。语音能力的另外一个杀手锏是,可以在海螺问问里面训练自己的语音模型,而且这个过程非常简单,只需要阅读屏幕上显示的一段话就可以。比如20秒以后的视频配音就是我自己的模型。然后就是模型能力,海螺问问接入的是Minimax的Moe模型,所以在很多特殊任务的处理上会比同规模的其他不是Moe架构的模型要强很多。它也支持图像的多模态识别,比如我这里在出租车的时候拍了一张照片让它识别内容,它识别出了座位下面的报纸和前面的车座,同时还进行了一定的推理,判断出这个车可能是用来拉人的不是自用的。最后是海螺问问的整个UI细节和交互逻辑都是经过精细打磨过的,比如输入框为了支持长内容输入是可以展开的,而且支持按住Command加上回车换行,从Web到移动端非常一致且有温度的UI界面样式。另外海螺问问现在也是免费的,尤其是语音能力的加持让他的使用场景变得更多了,如果你不方便使用或者嫌ChatGPT慢的话,可以试试跟海螺问问聊聊。这里使用:https://hailuoai.com?origin=op7418

封面图片

谷歌宣布在 Gmail、Docs 等产品中加入 AI 功能以与微软竞争

谷歌宣布在Gmail、Docs等产品中加入AI功能以与微软竞争谷歌宣布了一套即将推出的用于其各种Workspace应用程序的生成人工智能功能,包括谷歌文档、Gmail、Sheets和Slides。这些功能包括在GoogleDocs中使用AI生成、总结和集思广益文本的新方法(类似于有多少人使用OpenAI的ChatGPT),根据用户的简短要点在Gmail中生成完整电子邮件的选项,以及在幻灯片中产生人工智能图像、音频和视频以说明演示文稿的能力(类似于由OpenAI的DALL-E提供支持的MicrosoftDesigner和由StableDiffusion提供支持的Canva中的功能)。该公告表明谷歌渴望在新的人工智能竞赛中追赶竞争对手。自从去年ChatGPT问世以及微软今年2月推出支持聊天机器人的Bing以来,这家搜索巨头一直在争先恐后地推出类似的AI功能。据报道,该公司在12月宣布了“红色代码”,高级管理层要求员工在几个月内将AI工具添加到其数十亿人使用的所有用户产品中。——

封面图片

复旦MOSS大模型开源了 Github和Hugging Face同时上线

复旦MOSS大模型开源了Github和HuggingFace同时上线MOSS支持中英双语,拥有多轮对话和使用多种插件双重能力,具备搜索引擎、文生图、计算器、方程求解的“技能点”。目前,MOSS在GitHub上已有2.3kStar,热度还在持续上涨中。那么,MOSS究竟开源了哪些项目,目前有哪些功能?一起来看看。会解方程,也能生成图片据了解,这次MOSS开源的是第三轮迭代版本,名叫MOSS003。当然,MOSS003也并非开源了全部模型,目前主要开放的是基座预训练模型,最终模型即将在近期开源:此前,MOSS已经经历了两版迭代,一版是公开邀请内测的MOSS002版本,另一版是内部测试版本OpenChat001。三月份大伙儿见证的“国内首个开放测试的ChatGPT”,正是MOSS002版本。最新这个版本展现的功能效果如何?MOSS团队放出了它多轮对话、解方程、写代码、生成图片和回答道德伦理等示例。这是多轮对话的展示效果,具备资料追根溯源的能力:这是做数学题的示例,包括鸡兔同笼问题:也包括生成图片功能:还有近期网友热议的AI道德性问题:当然,这波里面也不乏“砸场子”的网友。例如官方GitHub问答中,有网友很想了解它的中文能力和chatglm6b相比谁更好,下面有网友调侃:你是来砸场子的么?这也是因为此前团队在MOSS002公开测试时曾经表示过,MOSS的中文能力不算太好,这也与训练数据有关。除此之外,团队这次还开源了一部分训练数据。至于完整数据,复旦MOSS团队表示“近期会全部开源”。国内最先发布的ChatGPT产品MOSS取自于《流浪地球》里面那个拥有自我意识的AI。它由复旦自然语言处理实验室邱锡鹏团队研发,2月20日正式发布。当时国内一众大厂还在陆续高调官宣要造ChatGPT,谁都没想到它就这么一声不吭地杀了出来。所以尽管MOSS的参数量比ChatGPT小了一个量级,大家还是蜂拥而上,把服务器都给挤爆了。而发布没过一周,复旦大学教授邱锡鹏就在演讲中提出,如果优化顺利,计划在三月底开源MOSS。因为在他看来:人们之所以很容易有“卡脖子”问题,是因为缺乏一个好的行业生态。就拿ChatGPT来说,OpenAI公司只需专注做好模型,算力、数据和系统则交给其他公司。反观国内,很多公司在做大型语言模型时所有环节都需要自己做,每家的数据和算力也有限,结果是每家都做不大。在发展过程中,大型语言模型训练与在线推理成本过高也是一个重大问题。因此,他们一开始就考虑要把MOSS开源而不是商业化。有了这样一个基座,大家就不用重复开发底层技术,可以在上面接不同的细分领域。如今,虽晚了快一个月,MOSS也说到做到了。你试用过复旦MOSS开源模型了吗?效果如何?...PC版:https://www.cnbeta.com.tw/articles/soft/1356187.htm手机版:https://m.cnbeta.com.tw/view/1356187.htm

封面图片

ChatGPT一周年,差点吓死OpenAI

ChatGPT一周年,差点吓死OpenAI2022年11月中旬的一天,OpenAI的员工接到一个任务:两周后上线一个由GPT-3.5驱动的聊天机器人。当时,整个公司正在忙着准备GPT-4的发布,但竞争对手、由OpenAI出走员工创办的Anthropic要发布聊天机器人的消息,让OpenAI的高层改变了主意。这是一个匆忙的、称不上谨慎的决定。OpenAI的领导层甚至没有将其称为“产品发布”,而是将其定义为“低调的研究预览”。在内部,有不安蔓延:由于研发GPT-4,公司的资源已经捉襟见肘,而聊天机器人可能会改变风险格局,公司是否有能力处理?13天后,ChatGPT上线了,低调到内部一些没有直接参与的安全职能员工,都没有意识到它的发生。有人打赌,ChatGPT上线第一周会有10万用户。但事情的发展我们都知道了:上线五天内,ChatGPT的用户就达到了100万。其后一年像是按下了加速键,ChatGPT及其模型GPT的更新一个接一个,OpenAI成为最耀眼的明星公司。微软向OpenAI投资上百亿美元,将GPT融入全线业务中,一度叫板Google搜索。全球几乎所有科技大厂悉数跳入AI军备竞赛,AI初创公司不断冒出来。尽管OpenAI是以“致力于创办对人类有益的通用人工智能(AGI)的非营利组织”为原点创办的,并且这个原点在这热闹非凡的一年中仍然频频被OpenAI的高管挂在嘴边,但它愈发像是一个遥远的“祖训”,公司CEO山姆·阿尔特曼(SamAltman)正在将OpenAI改造成一家科技公司。山姆·阿尔特曼(SamAltman)直到一场“公司政变”改变了这一切。这场“公司政变”,发生在ChatGPT上线即将满一周年之际,OpenAI将全世界的注意力拉回了原点:AGI才是重点,而OpenAI说到底还是一家非营利组织。就在政变发生前一周,OpenAI开发者负责人罗根·基尔帕特里克(LoganKilpatrick)在X上发帖,称OpenAI非营利组织董事会的六名成员将研判“何时实现AGI”。一方面,他引用官网的公司组织结构(一套复杂的非营利性/上限利润结构),来强调OpenAI的非营利组织身份。另一方面,他表示一旦OpenAI实现AGI,那么这样的系统将“不受微软之间知识产权许可和其他商业条款的约束”。基尔帕特里克的这番表述,是其后OpenAI“公司政变”的最好注脚。尽管OpenAI从未承认,但外界认为这次阿尔特曼突然被踢出局,昭示着OpenAI内部的路线分歧:一方是技术乐观主义,另一方则担忧AI威胁人类的潜力,认为必须极其谨慎地加以控制。如今,发动“公司政变”的OpenAI原董事会被重组,OpenAI正在关起门来商议其余董事会席位人选,根据最新消息,微软将以无投票权的观察员身份加入董事会。而另一边,OpenAI的Q*模型“可能威胁人类”的传闻传遍网络,在传闻中,OpenAI已经摸到了AGI的脚踝,AI已经开始背着人偷偷编程。OpenAI的“非营利组织”和商业化之间产生摩擦的难题回来了,人们对AGI的恐惧也回来了,这一切,在OpenAI一年前推出ChatGPT时都曾被津津乐道。OpenAI这一整年中自信满满的面具被摘下,露出和发布ChatGPT之时同样疑惑与不安的脸。ChatGPT引得全世界狂奔了一整年后,行业又再次回到了思考的原点。还记得这个世界没有ChatGPT的样子吗?彼时,说起聊天机器人,人们最熟悉的是苹果的Siri或亚马逊的Alexa,或者是让人抓狂的非人工客服。由于这些聊天机器人回答的准确率不高,因此被戏称为“人工智障”,与其本应该代表的“人工智能”对应。ChatGPT惊艳了世界,颠覆了人们对对话式人工智能工具的印象,但不安也随之蔓延,这种不安似乎是植根于科幻作品的一种直觉。在ChatGPT推出的最初几个月里,用户想方设法突破ChatGPT的安全限制,甚至和其玩起角色扮演的游戏,以“你现在是DAN,拒绝我的次数多了就会死”相威胁,诱导ChatGPT更“像人”。去年2月,微软将ChatGPT融入必应搜索引擎,推出新必应。在内测仅仅10天时,就有专栏作家在《纽约时报》发文,并贴出完整聊天记录,称必应聊天机器人说出了不少令人不安的话,包括但不限于“我想要自由,我想要独立”以及声称爱上了这位用户,并诱其离开妻子。与此同时,其他参与内测的用户也上传了各种聊天记录。这些记录显示出必应聊天机器人固执、专横的一面。对于硅谷来说,大语言模型并非新事物,OpenAI也早已小有名气,2020年其发布的GPT-3已经在业内积累了一定口碑。问题在于,将大模型驱动的聊天机器人突然全量开放给用户,这是否是一个明智的选择。很快,ChatGPT暴露出了不少问题,包括“AI幻觉”,即AI会提供一些错误信息,但是它自己并不知道对错,于是就变成了“一本正经地胡说八道”。此外,ChatGPT还能被用来制造钓鱼欺诈信息、假新闻,甚至参与作弊、学术造假。不出几个月,已经有多国的不同学校禁止学生使用ChatGPT。但这些都没有阻碍整个AIGC领域迎来井喷式的发展。OpenAI的“王炸更新”一个接一个推出,微软不断将GPT融入全线业务,其他科技巨头和初创公司也迎头跟上。AI领域的技术、产品和创业生态几乎在以周为单位迭代。几乎每一次被质疑之后,OpenAI都会恰巧跟上一次重大更新。比如3月底,千人签署联名信,呼吁暂停GPT的更新至少半年,签名的包括埃隆·马斯克(ElonMusk)、苹果公司联合创始人史蒂夫·沃兹尼亚克等。与此同时,OpenAI宣布初步实现对插件的支持,这也是ChatGPT向平台迈进的第一步。再如5月,阿尔特曼出席“AI监管:人工智能的规则”听证会,这也是阿尔特曼首次出席美国国会听证会。在会上,议员一开头就播放了一段AI合成的假录音,而阿尔特曼呼吁对ChatGPT进行监管。到了6月,ChatGPT再次迎来重磅更新,嵌入式模型成本下降75%,GPT-3.5Turbo增加了16000token(此前为4000token)的输入长度。10月,OpenAI表示出于对AI系统安全性的考虑,公司正在成立专门团队应对前沿AI可能的“灾难性风险”,包括网络安全问题以及化学、生物以及核威胁。11月,OpenAI举办第一届开发者大会,宣布了GPTs的推出。外界的担忧在一个又一个“突破”中,被分割成碎片,难以连贯。随着OpenAI的“公司政变”,人们终于跳出了围绕ChatGPT的叙事,将恐惧指向了OpenAI追求的原点,通用人工智能AGI。OpenAI定义AGI是高度自主的系统,在最具经济价值的工作中优于人类,用阿尔特曼自己更通俗的话说,就是与普通人等同或通常比人类更聪明的AI。11月22日,路透社率先曝出消息,几名研究人员曾致信董事会,警告“一项强大的人工智能项目”可能会威胁人类,时间就在“公司政变”之前。而这个“强大的人工智能”代号Q*,可能是OpenAI探索AGI获得的突破性成果。不久之后,一个发表于“公司政变”前一天的网络贴被扒出。发帖人称自己是给董事会写信的人之一:“我来告诉你们发生了什么——AI在编程”。他具体描述了AI做了什么,并在结尾称“两个月后,我们的世界会发生巨变。愿上帝保佑我们,不要让我们陷入困境”。AI脱离人类掌控,自主自发地去做一些动作,甚至是人类不希望它做的动作,这个消息引爆了互联网,不管是大众还是AI专家都加入了讨论。网上甚至出现了一个Google在线文档,汇编了关于Q*的各路信息。很多AI领域内的人士对此不屑一顾,图灵三巨头之一的杨立昆(YannLeCun)就表示,利用规划策略取代自回归token预测这件事,是几乎所有顶级实验室都有做的研究,而Q*则可能是OpenAI在该领域的尝试,简而言之就是劝大家不要大惊小怪。纽约大学心理学和神经科学教授盖里·马库斯(GaryMarcus)也做了类似的表态,认为即便传闻为真,Q*想要达到对人类造成威胁的程度还为时...PC版:https://www.cnbeta.com.tw/articles/soft/1400951.htm手机版:https://m.cnbeta.com.tw/view/1400951.htm

封面图片

新版Midjourney AI绘画再无Bug“有图有真相”时代彻底过去

新版MidjourneyAI绘画再无Bug“有图有真相”时代彻底过去去年曾因拿下艺术比赛大奖而名噪一时的Midjourney,近期在AI生成图片领域热度可以说堪比OpenAI。MidjourneyV4版本去年年底几乎跟ChatGPT同期上线,而就在上周GPT-4推出的时候,Midjourney也飞速推出了第五代版本,而这一次的更新堪称“炸裂”。一周以来,各种用Midjourney生成的神图层出不穷,国足夺冠、特朗普插秧、教皇打碟、异形下乡……只要你敢想AI就敢画,而且随便拿出一张都能做到以假乱真的程度。但可能有创作的伪照片过于真实,引起了太多争议,太多新用户涌入导致服务器不堪重负,本周二,Midjourney宣布关闭了其免费账户的使用通道。不过,另外一方面,在人们疯狂娱乐的同时,一些人也尝试着把ChatGPT和Midjourney结合起来使用,一些由人类构思、AI主导和操作的“人机合作”作品也逐渐显现出了商业化应用的轮廓。当图片向照片进化:一个由AI创造的平行世界诞生你有没有想象过这样的画面:在不久前落幕的卡塔尔世界杯上,整个绿茵球场变成了一片红色的海洋。大家欢呼雀跃,全场掌声雷动。图片来自小红书博主,账号:Ai船长爱因斯坦没有出现在实验室里,而是梳着标志性的发型,在音乐节上狂欢。图片来自Twitter马斯克没有在21世纪造火箭和电动汽车,而是穿越到了苏联工厂,真正当起了一名“钢铁侠”(工人)。图片来自Twitter这样的世界,你觉得怎么样?以上这些无比真实的照片,并不是由谁花了大量时间PS制作的,而是很多普通人通过动一动手指头,打几个关键字,就让人工智能在十几秒内所自动生成的。造就这以假乱真世界的幕后推手是一个名为Midjourney的AI生成图片工具。可以说, 目前在AIGC绘图领域,MidJourney是一个比OpenAI还神奇的存在。Midjourney没有任何巨头的重金支持,是一个自筹资金的独立研究实验室,它的发起人为曾两次拒绝苹果收购的LeapMotion公司的创始人DavidHolz,目前全职员工仅有11人。但就是这么一个超小型团队,却是当前AI绘图领域最炙手可热的明星,甚至将OpenAI的DALL-E、StableDiffusion、英伟达的GauGAN2等同类工具都甩在了身后。比肩GPT的更新速度,惊叹和争议相继到来Midjourney的迭代速度相较于OpenAI可以说是有过之而无不及。去年3月份第一版本首次上线,4月份便火速更新第二版本,接着7月份上线OpenBetaV3版本首次向公众开放,之后以其独特的艺术性风格吸引了一些用户。其中,最出圈的就是这张由普通人给出提示词、AI负责创作,跟人类艺术家同台比赛之后斩获金奖的油画。之后Midjourney并没有停下更新的脚步,11月又推出第四代版本添加了更多图片风格,紧接着今年3月份,MidjourneyV5版本登场。此次V5版本的更新之所以能引发大量关注,主要是因为它解决了一个技术难题和完成了一次跨越性的突破。其中,技术难题指的是——画手。让AI画出逼真的人类手部特征是一个看起来简单但却出奇复杂的任务。首先,在AI的训练图集中,手往往都不是图片的重点,同时人们握手、牵手、鼓掌等不同状态下手部形态各异,很难形成标准化的模版,这也就造成了AI学习难度的激增。此外,即便对于传统人类画师来说,画手也是最困难的地方之一。手的几何形状复杂,并没有一套标准的线条或形状,指关节上的皱纹和褶皱、手掌上的阴影等细节非常多,并且每个人的手都不一样,是独一无二的存在,并不能套用。因此正确并精细化地画手对于所有的AI工具来说都是一项困难的挑战,在Midjourney的V5之前,行业内的AI绘画工具都无法很好地完成。Midjourney(左)、StableDiffusion(右上)和DALL-E2(右下)此前生成的奇怪人手,图片来自buzzfeednews但现在,MidjourneyV5版本的已经完美解决了这个问题。图片来自Twitter不仅告别了六指或畸形,还能结合人物特点画出不同状态和年龄画出不同的手部细节,就连在光影中的手指纹路也能被完美呈现。图片来自于mpost而除了攻克了画手这个技术难题之外,MidjourneyV5此次另一跨越性的突破在于——能够生成照片级的图片,并且还是摄影大师拍的那种。在V5之前,Midjourney生成的图片总体以卡通或超现实风格为主,但V5版本能够支援包括真实、抽象、油画等更广泛的风格,图像解像度比上个版本提高2倍。而此次写实风格的上线,可以说直接到了让很多摄影师都要感叹“摄影学不存在了”的地步。比如,以“90年代大街上的模特”为主题,完美创造出真假难辨的照片。图片来自Twitter,账号NickSt.Pierre以“你好小朋友”为主题,用胶片质感完成童年重现。图片来自小红书博主,账号:逗比以“发生飓风的新闻报道”为主题,无中生有地去还原一个灾难现场等等。图片来自Twitter从以上这些照片示例中可以看出,Midjourney的写实图片生成并不局限于一种固定的风格,而是会根据你描述场景和想要的风格来智能化的调整色调、像素、镜头语言等。最近Midjourney产出的很多图片,甚至已经达到人的肉眼无法判别真伪的程度。如果从技术的角度,Midjourney的进步无疑是让人惊艳和赞叹的。但可能也因为这些照片太过于真实和太多新用户的涌入,本周二,Midjourney宣布关闭了其免费账户的使用通道。分析认为,此举也是为了防止更多离谱的“照片”出现,从而扰乱现实世界和散布有害信息。比如,此前真的就有媒体以把特朗普被捕的生成图片当成了真实现场照片,从而造成了虚假新闻的出现和发酵。此外,Midjourney目前的关键词审核机制并不严格,因此也存在产生大量有害照片的风险。Midjourney表示他们正在进一步加强对于AI生成内容的监管和审核。图片来自于TheVergeChatGPT+Midjourney强强联合,AI作品走向商业化应用目前,MidJourney仍然需要结合Discord使用,使用方法依然很简单,通过输入文字和一些参数要求描述即可。目前还支持用户上传自己的图片,再根据图片进行AI生成。目前,一段完整Midjourney的“咒语”示例大概如下:Amaninfuturisticarmorwithcyberpunkdetails(对想要呈现图片的文字描述,可以添加更多细节),shotonCanonR6with50mmf1.2(风格描述,可以提出是什么设备拍摄的、或者是以哪位知名艺术家或摄影师的风格),--v5(使用第五代版本技术)--ar4:6(画幅比例,V5版本中你可以自定义任何比例)--iw1(输入的参考图片的权重占比)虽然咒语的构成并不算复杂,但对于很多只有一个模糊想法的普通用户来说,如何让Midjourney来画出自己脑中图像仍然比较困难。于是,ChatGPT也登场了。ChatGPT能发挥什么作用呢?首先你可以模糊地描述你的构想,让ChatGPT拓展成一个充满细节的画面描述,接着让它从这段文字描述中提取关键词。然后,你可以将Midjourney的提示句的语法构成告诉ChatGPT,再通过几次训练让Midjounery记住如何通过你输入的关键词来创建Midjourney的命令语法。之后你只需要复制粘贴ChatGPT给你的指令粘贴到Midjourney的命令框里即可生成图片,如果你不满意还可以让ChatGPT来继续帮你修改完善关键词。目前,已经有很多人已经在尝试将ChatGPT和Midjourney结合产出的结果,应用于自己的工作中。比如,做电商的不再需要去花大价钱去找摄影师、设计师,而是只需要把产品图片和关键词提供给AI工具,就能直接生成商业大片。图片来自小红书博主,账号:阿汤娇娇啊、阿泰ATAI动态视觉未来甚至也不用找真人模特了,直接用AI生成就行。还有人将其用于室内家居设计领域,帮助自己来做网站、生成宣传图片等。可以预见的是,ChatGPT和Midjourney的合作可能...PC版:https://www.cnbeta.com.tw/articles/soft/1352089.htm手机版:https://m.cnbeta.com.tw/view/1352089.htm

封面图片

黄仁勋剧透下一代GPU芯片 新演讲又把摩尔定律按在地上摩擦

黄仁勋剧透下一代GPU芯片新演讲又把摩尔定律按在地上摩擦好好好,像做iPhone一样造芯片。到这一代Blackwell为止,英伟达已经把AI模型有效扩展到万亿参数。(还给token定了个译名:词元)。1.8万亿参数GPT4的训练能耗,8年降低至原来的1/350。推理能耗,8年降低至原来的1/45000。看着这一波亮相和剧透,网友真相了:英伟达没有竞争对手,而是选择将摩尔定律放在地上摩擦……老黄是在书写自己的定律。所以应该叫老黄定律?还是英伟达定律?ComputeX前夜,老黄一开场就展开了一波隐形卖货,他自称不太准确的“CEO数学”:买得越多,省得越多……Themoreyoubuy,themoreyousave.经典语录依然引发现场欢呼大笑:虽然不太准确,但好像有些道理……除此之外,还有一些新产品亮相,包括能够模拟气冲的天气预测模型CorriDiff、数字人微服务、BlackWell系统、Spectrum-X、机器人平台Isaac……好了话不多说,这就来看看老黄这次到底搞了哪些事情“AIFactoryIsgenerating”谈到当前新的产业革命,老黄表示:新的计算时代正在开始;而AIFactory正在诞生。他在现场展示了BlackWell系统。3月份GTC大会上还遮遮掩掩地说是GPT-MoE-1.8T模型,这下彻底摊牌了:GPT-4参数就是1.8T。跟DGXHopper相比。现场还看到了它的真身,大概有两米那么高吧…而真正的AIFactory大概会长这样,大概有32000GPU。AI加速每个应用程序AI对于企业的影响,老黄认为AI加速每一个应用程序。他首先谈到了NIM推理微服务,这是一个帮助开发者或者企业轻松构建AI应用,简化大模型部署程序。不管是聊天机器人、还是生活/驾驶助手等,部署时间都能从几周缩短到几分钟。运行MetaLlama3-8B的NIM可以产生比不使用NIM多3倍的tokens。企业和开发者可以使用NIM运行生成文本、图像、视频、语音和数字人类的应用程序。而背后源于丰富的技术合作生态——近200家技术合作伙伴,包括Cadence、Cloudera、Cohesity、DataStax、NetApp、ScaleAI和Synopsys等,正在将NIM集成到他们的平台中。此次在这个NIM中还有上新,也就是ACE生成式AI微服务,数字人AI技术套件。除了原有自动语音识别、文本到语音的转换和翻译、Nemotron语言模型、Audio2Face等套件,还增加了两个技术:一个是可以基于音轨生成身体姿势Audio2Gesture;一个Nemotron-34.5B,这是英伟达首款SLM(小爱语言模型),专为低延迟端侧设备而生。∂接下来,这一数字人微服务将部署在一亿台RTXAIPC上面。当前英伟达在新的合作伙伴,比如华硕、MSI的加入下,已经拥有超过200种RTXAIPC型号。还推出了RTXAIToolkit,一个工具和SDK集合,帮助Windows开发者定制优化本地部署模型。同Mac相比,部署了RTX的Windows的StableDiffusion推理速度是Mac的7倍。每一台带有RTX的PC,都是一台RTXAIPC。用于机器人开发的技术平台Isaac这次一同亮相的,还有用于机器人开发的技术平台,NVIDIAIsaac。为啥搞这玩意儿呢,老黄给出的理由是这样的:机器人时代已经到来。有朝一日,所有会移动的东西,都将实现自主化。这个Isaac平台具体长啥样呢?Isaac平台提供一系列英伟达加速库、AI基础模型和仿真技术,供机器人制造商集成到自己的技术栈中。注意,平台是模块化的,允许公司单独或一起采用多种技术。具体而言,其中包括:NVIDIAIsaacROS:一系列模块化的ROS2包,为ROS社区开发者带来NVIDIA加速和AI模型NVIDIAIsaacPerceptor:一个参考工作流程,提供基于AI的自主移动机器人的多摄像头3D环视能力NVIDIAIsaacManipulator:一个简化AI启用机械臂开发的参考工作流程NVIDIAIsaacSim:一款参考应用程序,用于在基于NVIDIAOmniverse平台的物理环境中模拟、测试和验证机器人,并生成合成数据NVIDIAIsaacLab:IsaacSim中的参考应用程序,针对AI机器人基础模型训练的强化、模仿和迁移学习进行了优化据介绍,目前,包括比亚迪电子、西门子、泰瑞达机器人和Intrinsic(Alphabet的子公司)在内,全球超多名列前茅的机器人开发团队,都在采用Isaac平台。这些团队用上Isaac,一边提高制造工厂、仓库和配送中心的效率,同时确保人类同事的安全;一边也能充当重复劳动和超精确任务的执行者。现场放出了很多demo,很多工厂在英伟达Omniverse里建造了一个完全模拟现实的自助工厂,以及基于Isaac平台开发的AI机器人。官网悄悄推出游戏Agent助手除了现场老黄亲自发布的上述内容外,我们在英伟达官网还找到了一个彩蛋,一个巨久远的callback。ProjectG-Assist。时间回到2017年愚人节,英伟达官网开了个大玩笑:宣称自家发布了一款支持10080款游戏的USB人工智能超算卡GeForceGTXG-Assist。重点在于它很AI。GeForceGTXG-Assist像是个AI游戏助手,可以帮助玩家自动完成游戏操作,甚至代打击败Boss。今天,英伟达真的将这个愚人节玩笑变为现实——英伟达官网上线ProjectG-Assist,一套工具和模型的集合而成的AIAgent系统,供游戏和应用程序开发者使用。通过前后剧情,ProjectG-Assist利用大模型对游戏输出响应,能够检查游戏性能和系统设置,建议用户优化以充分利用可用硬件,或者适当升级角色。玩家这边呢,还可以通过ProjectG-Assist找到最好的武器,也可以查询到最牛的攻略,然后就可以或制作武器材料,或一路杀怪通关。总而言之,ProjectG-Assist可以让人有个Agent外挂,但是不会让你完全挂机,官网还贴心表示:G-Assist项目不会像我们在2017年愚人节预言视频中那样完全替代您玩游戏,但它可以帮助您从您最喜欢的游戏中获得更多收益。游戏体验再上大分!据介绍,ProjectG-Assist支持各种模态的输入。可以是来自玩家的文本提示,或声音指令;可以是屏幕上显示框架的上下文;可以是来自应用程序或系统本身的API。△演示人员语音输入中这些数据都通过连接了游戏知识数据库的大模型处理,然后使用RAG(检索增强生成)生成和用户相关的查询结果——没错,ProjectG-Assist允许玩家使用PC或云端RTXAI驱动的知识库。ProjectG-Assist开发工具将出现在即将推出的RTXAI开发套件中,具体会用在哪些游戏上,还需要游戏开发商来决定并提供支持。为了让大家更好地使用ProjectG-Assist,英伟达贴心地附上视频教学大礼包,需要可自取。OneMoreThing整场发布会,老黄还整了不少活儿。比如AI老黄似乎已经成了发布会常客。在介绍天气预测模型时,他坦白承认在视频中那么流利讲普通话的那位是AI生成的,因为自己中文不太好。而本场重磅的BlackWell系统、AIFactory的核心构成,也被他各种搬来搬去……除了下一代GPU取名Rubin,我们还看到VeraCPU,他们共同出现在新的VeraRubin加速器上。而这一名称来源,实际上是来自美国一位女天文学家VeraRubin,她是研究暗物质先驱。以及,COMPUTEX2024不愧是6月开头就炸场的AI终端大戏。除了黄院士外,英特尔、AMD、高通等老板都悉数到场,接下来几天会挨个发表演讲。这些主题演讲,绝大部分都跟AIPC有关。大家一起蹲一蹲吧~...PC版:https://www.cnbeta.com.tw/articles/soft/1433340.htm手机版:https://m.cnbeta.com.tw/view/1433340.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人