全天候科技获悉,在火山引擎的一份产品资料中,豆包模型团队公布了一期内部测试结果:在MMLU、BBH、GSM8K、HumanEva

全天候科技获悉,在火山引擎的一份产品资料中,豆包模型团队公布了一期内部测试结果:在MMLU、BBH、GSM8K、HumanEval等11个业界主流的公开评测集上,Doubao-pro-4k的总分为76.8分,相比上一代模型云雀Skylark2的64.5分提升了19%,也优于同期测试的其他国产模型。此次评测在今年5月完成,主要包括豆包通用模型-pro、云雀Skylark2在内的九款国产大语言模型。除了云雀Skylark2以外,其他模型均为各家厂商最新发布的高级版本,通过API调用进行测试。据悉,豆包模型在5月15日刚刚推出,尚未加入到第三方机构测试中。预计未来一到两个月内,很多第三方评测机构将会陆续披露该模型的评测结果。

相关推荐

封面图片

华尔街见闻获悉,在火山引擎的一份产品资料中,豆包模型团队公布了一期内部测试结果:在 MMLU、BBH、GSM8K、HumanEv

华尔街见闻获悉,在火山引擎的一份产品资料中,豆包模型团队公布了一期内部测试结果:在MMLU、BBH、GSM8K、HumanEval等11个业界主流的公开评测集上,Doubao-pro-4k的总分为76.8分,相比上一代模型云雀Skylark2的64.5分提升了19%,也优于同期测试的其他国产模型。此次评测在今年5月完成,主要包括豆包通用模型-pro、云雀Skylark2在内的九款国产大语言模型。除了云雀Skylark2以外,其他模型均为各家厂商最新发布的高级版本,通过API调用进行测试。据悉,豆包模型在5月15日刚刚推出,尚未加入到第三方机构测试中。预计未来一到两个月内,很多第三方评测机构将会陆续披露该模型的评测结果。(全天候科技)

封面图片

豆包大模型披露评测成绩,较上一代 “云雀” 提升 19%

豆包大模型披露评测成绩,较上一代“云雀”提升19%在火山引擎的一份产品资料中,豆包模型团队公布了一期内部测试结果:在MMLU、BBH、GSM8K、HumanEval等11个业界主流的公开评测集上,Doubao-pro-4k的总分为76.8分,相比上一代模型云雀Skylark2的64.5分提升了19%,也优于同期测试的其他国产模型。此次评测在今年5月完成,主要包括豆包通用模型-pro、云雀Skylark2在内的九款国产大语言模型。除了云雀Skylark2以外,其他模型均为各家厂商最新发布的高级版本,通过API调用进行测试。据悉,豆包模型在5月15日刚刚推出,尚未加入到第三方机构测试中。预计未来一到两个月内,很多第三方评测机构将会陆续披露该模型的评测结果。(全天候科技)

封面图片

5 月 21 日,华尔街见闻获悉,近期火山引擎官网更新了豆包大模型的定价详情,全面展示豆包通用模型不同版本、不同规格的价格信息。

5月21日,华尔街见闻获悉,近期火山引擎官网更新了豆包大模型的定价详情,全面展示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的TPM(每分钟Tokens)、RPM(每分钟请求数)均达到国内最高标准。以豆包主力模型pro-32k为例,价格比行业低99%,TPM限额则高达同规格模型的2.7倍到8倍。官方信息显示:在按照Tokens实际使用量计算费用的“后付费”模式下,豆包通用模型-pro、豆包通用模型-lite的32k及以下窗口版本,模型限流为10KRPM和800KTPM(以RPM和TPM其中之一到达上限为准)。国内其他主流模型的TPM限额大多在100K到300K之间,RPM则是在60到120区间,轻量级模型的RPM限额相对较高,但仅仅在300到500之间。(全天候科技)

封面图片

豆包主力模型定价直降 99.3%,火山引擎开卷大模型 “价格战”

豆包主力模型定价直降99.3%,火山引擎开卷大模型“价格战”15日下午,字节跳动对外发布了自己的大模型产品家族,包含豆包通用模型Pro、豆包通用模型Lite两个通用模型以及7个细分领域模型。火山引擎总裁谭待同时在会上介绍,豆包大模型目前日均处理1200亿Tokens文本,生成3000万张图片。火山引擎总裁谭待在会上举例表示,豆包主力模型的定价比行业便宜了99.3%。对于击穿行业的定价,火山引擎相关负责人回应称,此次定价与OpenAI发布的免费使用的GPT-4o没有关系:“豆包模型家族里目前没有对标GPT-4o的同类型模型。”(每日经济新闻)

封面图片

iPhone 14 Pro全天候显示费电吗?实测每小时多消耗1%

iPhone14Pro全天候显示费电吗?实测每小时多消耗1%虽然明天iPhone14系列才正式首发上市,不过各路评测已经提前解禁,提前帮大家测试了很多新功能。对于以往从来没有实现过的全天候显示(息屏显示)功能,大家最关心的就是耗电问题。博主钟文泽在评测视频中对此专门进行了测试,实际对比iPhone13Pro下来,8小时全程处在息屏状态,耗电量增加了约9%。PC版:https://www.cnbeta.com/articles/soft/1316379.htm手机版:https://m.cnbeta.com/view/1316379.htm

封面图片

火山引擎旗下大模型服务平台火山方舟将向个人开发者开放

火山引擎旗下大模型服务平台火山方舟将向个人开发者开放火山引擎宣布,旗下一站式大模型服务平台火山方舟将正式面向个人开发者提供服务。据介绍,火山方舟上的豆包全系模型都将为个人用户提供50万tokens的免费推理额度,此外豆包通用模型pro和豆包通用模型lite的4K和32K版本,也为用户提供了1万RPM(每分钟请求数)和80万TPM(每分钟tokens数)的大流量额度。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人