RT 外汇交易员彭博发文介绍BloombergGPT,依托自身海量金融数据,构建了一个3630亿个标签的数据集,基于通用和金融业

RT 外汇交易员 彭博发文介绍BloombergGPT,依托自身海量金融数据,构建了一个3630亿个标签的数据集,基于通用和金融业务的场景进行了混合模型训练。 彭博称其在金融任务上超过了现有的模型(信息理解、情感分析、标注、实体命名等),而在通用场景上的表现则与之相当甚至优于现有模型。

相关推荐

封面图片

【彭博社发布专注金融界的大型语言模型 BloombergGPT 论文】

【彭博社发布专注金融界的大型语言模型 BloombergGPT 论文】 3月31日消息,彭博社发布为金融界构建的大型语言模型(LLM)BloombergGPT 论文,该模型依托彭博社的大量金融数据源,构建了一个 3630 亿个标签的数据集,支持金融行业内的各类任务。 在BloombergGPT相关论文中显示,BloombergGPT 的优势包括特定领域模型仍有其不可替代性且彭博数据来源可靠,金融相关任务上的性能明显优于现有模型等。

封面图片

【工商银行吕仲涛:AI大模型技术尚未成熟,全面落地金融业还需大数据、大算力、大合作、大创新】

【工商银行吕仲涛:AI大模型技术尚未成熟,全面落地金融业还需大数据、大算力、大合作、大创新】 工商银行首席技术官吕仲涛在 2023 服贸会期间接受专访时表示,大模型技术目前尚未完全成熟,而金融行业是一个强监管的行业。因此,大模型技术应用于金融场景下,仍然存在安全隐私、科技伦理、可信可解释等方面的风险。同时,大模型技术应用全面落地的过程还面临着数据、算力、算法、应用等诸多挑战。 快讯/广告 联系 @xingkong888885

封面图片

《金融八大通用实务技能》

《金融八大通用实务技能》 简介:涵盖金融从业者必备的核心能力,包括财务分析、风险管理、投资评估等模块,通过数据解读、工具运用与合规框架构建业务决策支撑体系,强调理论与实践结合的复合型知识结构。 亮点:融合量化模型与商业逻辑分析,包含Wind/Bloomberg等专业平台操作要点,突出风险预警机制设计与金融产品估值等实战场景应用,适配投行、资管等多领域岗位需求。 标签: #金融实务 #数据分析 #风险管理 #量化建模 #合规框架 #CFA体系 #FRM认证 #Wind终端 链接:

封面图片

4月12日,人民银行、银保监会、证监会、外汇局等金融管理部门再次联合约谈蚂蚁集团。

4月12日,人民银行、银保监会、证监会、外汇局等金融管理部门再次联合约谈蚂蚁集团。 中国人民银行副行长潘功胜表示,此次金融管理部门再次联合约谈蚂蚁集团有关人员,主要是要求蚂蚁集团必须正视金融业务活动中存在的严重问题和整改工作的严肃性,对标监管要求和拟定的整改方案,深入有效整改,确保实现依法经营、守正创新、健康发展;必须坚持服务实体经济和人民群众的本源,积极响应国家发展战略,在符合审慎监管要求的前提下,加大金融科技创新,提升金融科技领域的国际竞争力,在构建“双循环”新发展格局中发挥更大作用。 蚂蚁集团整改内容主要包括五个方面:一是纠正支付业务不正当竞争行为,在支付方式上给消费者更多选择权,断开支付宝与“花呗”“借呗”等其他金融产品的不当连接,纠正在支付链路中嵌套信贷业务等违规行为。二是打破信息垄断,严格落实《征信业管理条例》要求,依法持牌经营个人征信业务,遵循“合法、最低、必要”原则收集和使用个人信息,保障个人和国家信息安全。三是蚂蚁集团整体申设为金融控股公司,所有从事金融活动的机构全部纳入金融控股公司接受监管,健全风险隔离措施,规范关联交易。四是严格落实审慎监管要求,完善公司治理,认真整改违规信贷、保险、理财等金融活动,控制高杠杆和风险传染。五是管控重要基金产品流动性风险,主动压降余额宝余额。金融管理部门将督促蚂蚁集团切实落实整改方案,把握好工作节奏,保持业务连续性和企业正常经营,确保广大人民群众对金融服务的体验不下降,持续提升普惠金融服务水平。 下一步,金融管理部门将坚持公平监管和从严监管原则,着眼长远、兼顾当前,补齐短板、强化弱项,促进公平竞争,反对垄断,防止资本无序扩张。一是坚持“金融为本、科技赋能”。平台企业开展金融业务应以服务实体经济、防范金融风险为本,不能使科技成为违法违规行为的“保护色”。对于违规经营行为,依法严肃查处。二是坚持金融活动全部纳入金融监管。金融业务必须持牌经营;提升监管能力和水平,优化监管框架,防范监管套利。三是坚持发展和规范并重。依法加强监管,规范市场秩序,防止市场垄断,保障数据产权及个人隐私;同时把握好平台经济发展规律,提升金融服务体验,巩固和增强平台企业国际竞争力。金融管理部门将一如既往地坚持“两个毫不动摇”,营造公平竞争市场环境,继续支持民营资本依法开展金融科技活动,依法保护产权,弘扬企业家精神,激发民营资本的市场活力和科技创新能力。 潘功胜还表示,近年来,金融科技与平台经济快速发展,在提升金融服务效率和金融体系普惠性、降低交易成本方面发挥了重要作用。同时,由于其具有跨界、混业、跨区域经营等特征,风险传染速度更快、波及面更广、负面溢出效应更强,对金融监管形成了新挑战,成为世界各国监管部门共同面对的新问题。世界主要经济体监管部门对此高度关注,并已采取实际行动,作出监管调整和政策响应。在监管理念上,遵循“同样业务、同样监管”的原则,致力于在促进金融科技发展和防范金融风险之间取得平衡。在监管方法上,探索运用大数据、云计算、人工智能等科技成果,提升风险监测感知能力和穿透式监管能力。在监管内容上,强调个人信息保护及反垄断。例如,欧盟2018年实施了《通用数据保护条例》,并加快推进《数据治理法案》;美国近年来连续发起对大型科技公司的反垄断调查;德国在2020年通过《反对限制竞争法》第十次修正案等。中国金融管理部门愿进一步加强与国际金融组织和各国监管当局在反垄断、数据监管、运营管理、消费者保护等方面的合作,推动制定金融科技监管规范,加强监管协调,共同打造开放、包容、安全的金融科技生态环境,提升金融业创新能力,同时防范跨境监管套利和金融风险跨境传染。 (新华社)

封面图片

实测发现Gemini的数据分析能力并不像Google声称的那么好

实测发现Gemini的数据分析能力并不像Google声称的那么好 但新的研究表明,这些模型实际上并不擅长这些事情。两项不同的研究调查了Google的Gemini模型和其他模型如何从海量数据中获得意义想想"战争与和平"长度的作品。这两项研究都发现,Gemini 1.5 Pro 和 1.5 Flash 很难正确回答有关大型数据集的问题;在一系列基于文档的测试中,这些模型只有 40% 50% 的时间给出了正确答案。"虽然像 Gemini 1.5 Pro 这样的模型在技术上可以处理较长的上下文,但我们看到很多案例表明,这些模型实际上并不能'理解'内容,"马萨诸塞大学阿默斯特分校博士后、其中一项研究的合著者 Marzena Karpinska 说。Gemini缺少上下文窗口模型的上下文或上下文窗口指的是模型在生成输出(如附加文本)之前考虑的输入数据(如文本)。一个简单的问题"谁赢得了 2020 年美国总统大选?- 可以作为上下文,电影剧本、节目或音频片段也是如此。随着上下文窗口的增加,可容纳文件的大小也会随之增加。Gemini 的最新版本可以接收多达 200 万个标记作为上下文。(标记"是原始数据的细分位,如"梦幻"一词中的音节"fan"、"tas"和"tic")。这相当于大约 140 万个单词、2 个小时的视频或 22 个小时的音频这是所有商用模型中最大的语境。在今年早些时候的一次简报会上,Google展示了几个预先录制的演示,旨在说明Gemini长语境功能的潜力。其中一个演示让Gemini 1.5 Pro 搜索阿波罗 11 号登月电视直播的记录(约 402 页),查找包含笑话的引语,然后在电视直播中找到与铅笔素描相似的场景。Google DeepMind 研究副总裁 Oriol Vinyals 主持了这次简报会,他用"神奇"来形容这个模型。他说:"[1.5 Pro]可以在每一页、每一个单词上执行此类推理任务。"但这可能有点夸张。在上述对这些能力进行基准测试的一项研究中,卡平斯卡与来自艾伦人工智能研究所和普林斯顿大学的研究人员一起,要求模型评估有关英文小说的真/假语句。研究人员选择了近期的作品,这样模型就无法依靠预知来"作弊",而且他们还在语句中加入了具体细节和情节点,如果不阅读整本书,是无法理解这些细节和情节点的。Gemini 1.5 Pro 和 1.5 Flash 在阅读了相关书籍后,必须说出这句话的真假并说明理由。图片来源:UMass Amherst马萨诸塞大学阿默斯特分校研究人员对一本长度约为 26 万字(约 520 页)的书进行了测试,发现 1.5 Pro 在 46.7% 的时间内正确回答了真/假语句,而 Flash 仅在 20% 的时间内正确回答了真/假语句。这意味着硬币在回答有关这本书的问题时明显优于Google最新的机器学习模型。综合所有基准测试结果,两个模型的答题准确率都没有超过随机概率。卡平斯卡说:"我们注意到,与那些通过检索句子层面的证据就能解决的问题相比,模型在验证那些需要考虑书中较大部分甚至整本书内容的主张时会遇到更多困难。从质量上讲,我们还观察到,模型在验证有关隐含信息的主张时也很吃力,这些隐含信息对人类读者来说是明确的,但在文本中并没有明确说明。"两项研究中的第二项由加州大学圣巴巴拉分校的研究人员共同完成,测试了 Gemini 1.5 Flash(而非 1.5 Pro)"推理"视频的能力,即搜索并回答有关视频内容的问题。合著者创建了一个图像数据集(例如,一张生日蛋糕的照片),并配以问题让模型回答图像中描述的对象(例如,"这个蛋糕上有什么卡通人物?)为了对模型进行评估,他们随机挑选了其中一张图片,并在其前后插入"干扰"图片,以创建类似幻灯片的片段。Flash 的表现并不尽如人意。在一项让模型从 25 张图片的"幻灯片"中转录 6 位手写数字的测试中,Flash 的转录正确率约为 50%。八位数字的准确率下降到 30%。"在实际的图像问题解答任务中,我们测试的所有模型似乎都特别困难,"加州大学圣塔芭芭拉分校的博士生、该研究的共同作者之一迈克尔-萨克森(Michael Saxon)表示,"少量的推理识别出一个数字在一个框架中并读取它可能就是让模型失效的原因"。这两项研究都没有经过同行评议,也没有对 Gemini 1.5 Pro 和 1.5 Flash 的 200 万标记上下文版本进行测试(这两项研究都对 100 万标记上下文版本进行了测试)。(这两个版本都测试了 100 万标记上下文的版本)而且,Flash 在性能方面并不像 Pro 那样强大;Google 将其宣传为低成本的替代品。尽管如此,这两件事还是让人们更加确信,Google从一开始就对Gemini的承诺过高,而实际效果却不尽如人意。研究人员测试的所有模型,包括 OpenAI 的GPT-4o和 Anthropic 的Claude 3.5 Sonnet,都表现不佳。但Google是唯一一家在广告中将语境窗口放在首位的模型提供商。萨克森说:"根据客观的技术细节,简单地宣称'我们的模型可以接受 X 个词元'并没有错。但问题是,你能用它做什么有用的事情?"随着企业(和投资者)对生成式人工智能技术的局限性感到失望,这种技术正受到越来越多的关注。在波士顿咨询公司(Boston Consulting Group)最近进行的两项调查中,约有一半的受访者(均为 C-suite 高管)表示,他们并不指望人工智能生成技术能带来实质性的生产力提升,而且他们担心人工智能生成工具可能会导致错误和数据泄露。PitchBook 最近报告称,连续两个季度,生成式人工智能最早阶段的交易量出现下滑,从 2023 年第三季度的峰值骤降 76%。面对可以总结会议内容、虚构人物细节的聊天机器人,以及基本上等同于剽窃生成器的人工智能搜索平台,客户们正在寻找有前途的差异化产品。Google一直在追赶其人工智能生成器竞争对手,有时甚至是笨拙地追赶,它急切地想让Gemini的语境成为这些差异化因素之一。但现在看来,这个赌注还为时过早。卡平斯卡说:"我们还没有找到一种方法来真正证明对长文档的'推理'或'理解'正在发生,而且基本上每个发布这些模型的小组都在拼凑他们自己的临时验证来做出这些宣称。在不了解长上下文处理是如何实现的情况下而公司并不分享这些细节很难说这些说法有多现实。"Google没有回应置评请求。萨克森和卡平斯卡都认为,要消除生成式人工智能的夸大宣传,就必须制定更好的基准,同时更加重视第三方的批评意见。萨克森指出,Google在其营销材料中大量引用的"大海捞针"(need in the haystack)是一种更常见的长语境测试方法,它只能衡量模型从数据集中检索特定信息(如姓名和数字)的能力,而不能回答有关这些信息的复杂问题。"所有科学家和大多数使用这些模型的工程师基本上都认为,我们现有的基准文化已经崩溃,"萨克森说,"因此,重要的是公众要明白,对这些包含'跨基准的通用智能'等数字的巨型报告,要慎重对待。" ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人