YOLOv6 是美团发布的一款开源的面向工业应用的 2D 目标检测模型 [1],主要特点是速度快、精度高、部署友好,在美团众多视

YOLOv6 是美团发布的一款开源的面向工业应用的 2D 目标检测模型 [1],主要特点是速度快、精度高、部署友好,在美团众多视觉业务场景中都有着广泛的应用。 通过量化(Quantization)提升推理速度是实际工业应用中的基本操作,但由于 YOLOv6 系列模型采用了大量的重参数化模块,如何针对 YOLOv6 进行高效和高精度的量化成为一个亟待解决的问题。 本文旨在解决 YOLOv6 量化方面的难题,并以 YOLOv6s 模型为例,从训练后量化(Post-Training Quantization, PTQ)和量化感知训练(Quantization-Aware Training, QAT)两个方面进行分析,探索出了一条切实可行的量化方案。|

相关推荐

封面图片

是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,Ch

是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性: 更强大的性能:基于 ChatGLM 初代模型的开发经验,我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。 更长的上下文:基于 FlashAttention 技术,将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,开发者会在后续迭代升级中着重进行优化。 更高效的推理:基于 Multi-Query Attention 技术,ChatGLM2-6B 有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。 更开放的协议:ChatGLM2-6B 权重对学术研究完全开放,在获得官方的书面许可后,亦允许商业使用。

封面图片

LightNet 是一个基于流行的暗网平台的深度学习框架,旨在为计算机视觉任务创建高效、高速的卷积神经网络(CNN)。该框架经过

LightNet 是一个基于流行的暗网平台的深度学习框架,旨在为计算机视觉任务创建高效、高速的卷积神经网络(CNN)。该框架经过改进和优化,可为各种深度学习挑战提供更通用、更强大的解决方案。 LightNet 融合了多项前沿技术和优化来提高 CNN 模型的性能。主要特点包括: ●多任务学习 除了暗网中的对象检测之外,LightNet 还经过扩展以支持语义分割学习,从而可以对图像内的对象进行更准确、更详细的分割。此功能支持训练 CNN 模型来识别和分类图像中的各个像素,从而实现更精确的对象检测和场景理解。 例如,语义分割可用于识别图像中的各个对象,例如汽车或行人,并用相应的对象类别标记图像中的每个像素。这对于各种应用都很有用,包括自动驾驶和医学图像分析。 ●2:4 结构化稀疏性 2:4 结构化稀疏技术是一种减少 CNN 模型参数数量同时保持其性能的新颖方法。这种方法使模型更加高效并且需要更少的计算,从而缩短训练和推理时间。 例如,使用 2:4 结构化稀疏性可以减少 CNN 模型的内存占用和计算要求,从而更容易部署在手机或嵌入式系统等资源受限的设备上。 ●通道修剪 通道剪枝是一种优化技术,可以减少 CNN 模型中的通道数量,而不会显着影响其准确性。此方法有助于减小模型大小和计算要求,从而在保持性能的同时缩短训练和推理时间。 例如,通道修剪可用于减少 CNN 模型中的通道数量,以便在低功耗处理器上进行实时处理,同时仍保持高精度。这对于在计算资源有限的设备上部署模型非常有用。 ●训练后量化(维护中) 训练后量化 (PTQ) 是一种减少训练后 CNN 模型的内存占用和计算要求的技术。此功能目前正在维护中,将在未来版本中提供。 ●量化感知训练(未来支持) 虽然 PTQ 被认为足以满足 NVIDIA GPU 上的 LightNet,但对于不支持每通道量化的 AI 处理器,我们可能会考虑根据需要添加对量化感知训练 (QAT) 的支持。 | #框架

封面图片

西门子与阿里云战略合作,基于西门子Xcelerator和通义大模型探索工业创新

西门子与阿里云战略合作,基于西门子Xcelerator和通义大模型探索工业创新 6月29日,西门子与阿里云签署战略合作协议,双方将发挥在各自领域的技术优势,共同推动云计算、AI大模型与工业等不同场景的融合,赋能中国企业提升创新力和生产力,为中国经济的高质量发展注入加速度。 根据协议,阿里云正式成为开放式数字商业平台西门子Xcelerator的生态合作伙伴,双方将基于西门子Xcelerator与“通义大模型”,共同探索人工智能在工业等多场景的应用与创新,加速数字化转型。同时,西门子将借助阿里云的AI大模型,优化和提升西门子Xcelerator线上平台的用户体验。 “此次签约标志着西门子与阿里云在携手赋能产业数字化转型的道路上更进一步,也是我们基于西门子Xcelerator平台强强联合、融汇共创的有益实践。”西门子全球执行副总裁、西门子中国董事长、总裁兼首席执行官肖松博士表示,“我们期待与阿里云资源共享、技术共创、生态共赢,以科技力量普惠中国企业,尤其是广大中小企业,使其数字化转型更容易、更快速、更利于规模化落地。” “一个全新的智能化时代正在到来,而关乎国计民生的工业和制造业领域,必将是AI大模型应用的重要阵地。”阿里巴巴集团董事会主席兼首席执行官、阿里云智能集团董事长兼首席执行官张勇表示,“未来十年,云、AI和工业场景将持续深度融合。西门子与阿里云也将聚力协作,加速这一融合进程,提高工业生产效率并加速创新,帮助提升工业企业的竞争力。” 据了解,今年4月阿里云推出通义千问大模型,发布后吸引超过20万家企业申请接入测试。而后,阿里云与昆仑数智、朗新科技、千方科技、中金财富、石基集团、用友网络、亚信科技等七家行业数字化服务商合作,打造油气、电力、交通、金融、酒旅、企服、通信行业等领域的专属大模型,快速推进大模型行业落地。 via(author: 编辑:刘昕茹)

封面图片

当今天吃什么成为一个困扰职场人的每日问题时,美团高薪的工程师们没能力解决这个问题吗?显然是不可能,其实是为了利润有意为之。美团外

#大公司负面消息 当今天吃什么成为一个困扰职场人的每日问题时,美团高薪的工程师们没能力解决这个问题吗?显然是不可能,其实是为了利润有意为之。美团外卖列表的排序模型比淘宝更深谙人性。 美团知道用户不可能日复一日吃同一家商家的同一个商品,总会有吃腻的一天。 基于以上洞察,模型策略上将用户常下单的商家和购买了点金排名的商家的默认置顶并在每一次下滑载入时再次出现,将其他商家展示优先级降低。并不存在浏览不完的商家,而是用户并没有机会完整浏览完有限的商家列表。 但无论客户是否在浏览后下单,都不影响美团收取商家的曝光和点击的广告费。相反,用户浏览越久进店和返回的行为越频繁,美团赚的越多,商家的经营成本越高。 美团不会将模型策略如实的告知商家,但美团运营同学在和商家沟通商家低转化率时一定会归因到商家的定价、产品组合、是否开启优惠活动、活动力度、门店装修,让商家内卷从而帮助平台筑造价格护城河。 相比淘宝快消和服装类商品的弱即时性,就餐场景的强即时性、规律性、时限性会让用户自觉警惕沉默的时间成本,从而促进用户的冲动下单。

封面图片

一个医疗大语言模型的综合评测框架,具有以下三大特点:

一个医疗大语言模型的综合评测框架,具有以下三大特点: 1.大规模综合性能评测:GenMedicalEval构建了一个覆盖16大主要科室、3个医生培养阶段、6种医学临床应用场景、基于40,000+道医学考试真题和55,000+三甲医院患者病历构建的总计100,000+例医疗评测数据。这一数据集从医学基础知识、临床应用、安全规范等层面全面评估大模型在真实医疗复杂情境中的整体性能,弥补了现有评测基准未能覆盖医学实践中众多实际挑战的不足。 2.深入细分的多维度场景评估:GenMedicalEval融合了医师的临床笔记与医学影像资料,围绕检查、诊断、治疗等关键医疗场景,构建了一系列多样化和主题丰富的生成式评估题目,为现有问答式评测模拟真实临床环境的开放式诊疗流程提供了有力补充。 3.创新性的开放式评估指标和自动化评估模型:为解决开放式生成任务缺乏有效评估指标的难题,GenMedicalEval采用先进的结构化抽取和术语对齐技术,构建了一套创新的生成式评估指标体系,这一体系能够精确衡量生成答案的医学知识准确性。进一步地,基于自建知识库训练了与人工评价相关性较高的医疗自动评估模型,提供多维度医疗评分和评价理由。这一模型的特点是无数据泄露和自主可控,相较于GPT-4等其他模型,具有独特优势。 | #框架

封面图片

新技术实现前所未有的月球测绘精度

新技术实现前所未有的月球测绘精度 科学家们开发出了从阴影到形状的增强技术,大大提高了绘制月球表面地图的效率和准确性。这项创新为任务规划人员提供了更详细的地图,特别是对月球南极等具有挑战性的地形。这幅以月球表面的国际天文学联合会(IAU)302号环形山为特色的斜视图是阿波罗10号宇航员于1969年5月拍摄的。图片来源:美国国家航空航天局布朗大学学者本杰明-博特莱特(Benjamin Boatwright)和詹姆斯-海德(James Head)的研究成果于5月28日发表在《行星科学杂志》(Planetary Science Journal)上,介绍了一种名为"从阴影到形状"(shape-from-shading)的绘图技术的改进。该技术用于创建月球地形的详细模型,勾勒出环形山、山脊、斜坡和其他地表危险。通过分析光线照射月球不同表面的方式,研究人员可以从二维图像的合成图中估算出物体或表面的三维形状。 加强月球安全与探索精确的地图可以帮助月球任务规划人员确定安全着陆点和科学兴趣区,使任务操作更加顺利和成功。布朗大学地球、环境与行星科学系博士后研究员、新论文的第一作者博特莱特说:"它能帮助我们更好地了解那里到底有什么。"我们需要了解月球表面光照不足的地形,比如月球南极的阴影区,NASA的阿耳特弥斯(Artemis)任务就瞄准了那里。这将使自主着陆软件能够导航并避开可能危及任务的危险,如大石头和巨砾。因此需要尽可能高分辨率的地表地形图模型,因为细节越多越好。"伊纳不规则赤褐色斑块的现有模型(A、C、D)与研究中更详细、更清晰的阴影形状模型(B、E)的对比。资料来源:B.Boatwright,NASA/戈达德太空飞行中心/梅斯研究中心 简化绘图过程然而,精确地图的绘制过程是劳动密集型的,在涉及复杂的光照条件、不准确的阴影解释和处理地形变化时有其局限性。布朗大学的研究人员对"从阴影看形状"技术的改进主要集中在解决这些问题上。学者们在研究报告中概述了如何利用先进的计算机算法将大部分过程自动化,并显著提高模型的分辨率。研究人员说,新软件为月球科学家提供了工具,使他们能够以更快的速度绘制出包含更多细节的月球表面大图。 月球绘图的先进技术波特莱特说:"从阴影到形状要求你使用的图像彼此完全对齐,这样一张图像中的特征在另一张图像中的位置就完全相同,这样才能建立起这些信息层,但目前的工具还不能让你随便给它一堆图像,它就能吐出一个完美的产品。我们采用了一种图像对齐算法,它能在一张图像中找出特征,并试图在另一张图像中找到相同的特征,然后将它们对齐,这样你就不必坐在那里手动追踪多张图像中的兴趣点,这需要花费大量的时间和脑力。"研究人员还采用了质量控制算法和额外的过滤器来减少对齐过程中的异常值,这些工具可以确保对齐的图像匹配,并移除对齐效果不佳的图像。通过只选择最终可用的图像,这样可以提高质量,并将精度降低到亚米级分辨率。这样的速度还可以检查更大的表面区域,从而提高这些地图的制作水平。 对比与未来应用研究人员将他们绘制的地图与其他现有地形模型进行比较,寻找月球表面特征的差异或误差,以此评估地图的准确性。他们发现,与传统技术生成的地图相比,利用从阴影到形状的改进方法生成的地图更加精确,能显示月球表面地形更微妙的特征和变化。在这项研究中,研究人员主要使用了月球轨道激光高度计和月球勘测轨道相机的数据,这些数据来自美国宇航局月球勘测轨道器上的仪器。科学家们计划使用他们改进的"从阴影到形状"软件(shape-from-shading)制作月球地图,并希望其他人也能在建模工作中使用该软件。这也是他们使用开源算法制作该工具的原因。 对月球探测的影响曾参与阿波罗计划的布朗大学地质科学教授海德说:"这些新的地图产品大大优于我们在阿波罗任务期间的探索规划,它们将极大地改进阿耳特弥斯和机器人任务的任务规划和科学回报。"研究人员希望这一新工具能够提高美国国家航空航天局(NASA)和世界各地航天机构目前对月球科学和探索的兴趣。博特莱特说:"让所有人都能使用这类工具,可以获得大量信息。这是一种平等的科学方式"。编译自/scitechdaily ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人