2023年年末 AI翻译大比拼

2023年年末 AI翻译大比拼 参赛选手 ainiee GPT 3.5 16K 120行 ainiee GPT 4.0 1106 20行 ainiee GPT 4.0 32K 30行 ainiee 谷歌AI 20行 ainiee 樱花大模型 10行 寄 GPT4 10行带上一轮

相关推荐

封面图片

武德大比拼:2023年支那人屠了417个黑皮(),美国人屠了134个黑皮()。

武德大比拼: 2023年支那人屠了417个黑皮(),美国人屠了134个黑皮()。 支那人口是美国的4.17倍,因此美国民间在拥有数亿支突击步枪、狙击步枪、冲锋枪、手枪、列强、散弹枪、掷弹筒、迫击炮、退役火炮、退役坦克、退役装甲车等装备的情况下,人均屠警率却仅仅达到只能玩刀战和载具战的支那人的1.34倍 还有人敢说支那人是没有武德的顺民吗?汉族,崛起! 另:号称比内地支那人更有反抗精神的港猴,自2019年反送中开始,近5年时间内屠警纪录仅仅为可怜的1(),还是走私哥干的,不得不说港猴的废拉属实愧对了列祖列宗,不配当汉族

封面图片

Open AI终于发力了,今天更新了一堆新的内容,每个都很重磅:

Open AI终于发力了,今天更新了一堆新的内容,每个都很重磅: - 16k 上下文 3.5 Turbo 模型(今天向所有人提供) - 新的 GPT-4 和 3.5 Turbo 模型 - Chat Completions API 中的新函数调用功能 - V2 嵌入模型降价 75% - GPT-4的API权限将开放给更多的人 下面是详细介绍 首先是新的GPT-4的模型 `gpt-4-0613` 包括一个更新和改进的模型,带有函数调用。 `gpt-4-32k-0613` 包括与 `gpt-4-0613` 相同的改进,同时上下文长度再度扩展,以便更好地理解更大的文本。 未来几周内邀请候补名单中的更多人试用 GPT-4,直到完全删除候补名单 新的GPT-3.5 Turbo和16K模型 `gpt-3.5-turbo-0613` 包括与 GPT-4 相同的函数调用以及通过系统消息提供的更可靠的可控性。 `gpt-3.5-turbo-16k` 的16k 上下文意味着该模型现在可以在单个请求中支持约 20 页文本。 然后是Function calling 函数调用 开发人员现在可以向 `gpt-4-0613` 和 `gpt-3.5-turbo-0613` 描述函数,并让模型智能地选择输出包含调用这些函数的参数的 JSON 对象。这是一种更可靠地将 GPT 功能与外部工具和 API 连接的新方法。 最后是价格调整 `text-embedding-ada-002` 将成本降低 75% 至每 1K Token 0.0001 美元。 `gpt-3.5-turbo-16k` 的定价为每 1K 输入Token 0.003 美元,每 1K 输出Token 0.004 美元。 `gpt-3.5-turbo’s` 输入Token的成本降低了 25%

封面图片

【SuperCLUE发布中文大模型基准测评2023年度报告:国内外差距依然明显】

【SuperCLUE发布中文大模型基准测评2023年度报告:国内外差距依然明显】 12 月 28 日,国内中文模型评测机构 SuperCLUE 发布中文大模型基准测评 2023 年度报告。根据报告,过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,每个月都有稳定且巨大的提升,到 11 月份测评时已经完成总分上对 GPT3.5 的超越。据介绍,本次测评数据选取了 SuperCLUE-12 月测评结果,模型选取了国内外有代表性的 26 个大模型在 12 月份的版本。测评结果显示,国内外差距依然明显。GPT4-Turbo 总分 90.63 分遥遥领先,高于其他国内大模型及国外大模型。其中国内最好模型文心一言 4.0 (API)总分 79.02 分,距离 GPT4-Turbo 有 11.61 分,距离 GPT4(网页)有 4.9 分的差距。但过去 1 年国内大模型已经有了长足的进步。综合能力超过 GPT3.5 和 Gemini-Pro 的模型有 11 个,比如百度的文心一言 4.0、阿里云的通义千问 2.0 和 Qwen-72B-Chat、OPPO 的 AndesGPT、清华 & 智谱 AI 的智谱清言、字节跳动的云雀大模型等都有比较好的表现。另外国内开源模型在中文上表现要好于国外开源模型,如百川智能的 Baichuan2-13B-Chat、阿里云的 Qwen-72B、Yi-34B-Chat 均优于 Llama2-13B-Chat。 快讯/广告 联系 @xingkong888885

封面图片

360创始人周鸿祎谈Sora:中美AI差距可能还在加大

360创始人周鸿祎谈Sora:中美AI差距可能还在加大 人工智能ChatGPT母公司OpenAI星期四(2月15日)公布了一种新的人工智能系统Sora,该系统可以根据用户的文本提示创建逼真的视频。360创始人周鸿祎星期五(16日)发文说,OpenAI CEO是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的AI差距可能还在加大。” 周鸿祎在个人微博上发文说,科技竞争最终比拼的是让人才密度和深厚积累。AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。 周鸿祎还说,很多人担心Sora对影视工业的打击,但在他看来,机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意,至少需要人给提示词。一个视频或者电影是由无数个60秒组成的。Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败TikTok,更可能成为TikTok的创作工具。 他说,一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和 TikTok 的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,这就离AGI(通用人工智能)真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。 周鸿祎还认为,尽管中国大模型发展水平表面看已经接近GPT-3.5,但实际上跟4.0比还有一年半的差距。OpenAl手里应该还有一些秘密武器,无论是GPT-5,还是机器自我学习自动产生内容,“奥尔特曼(OpenAI CEO)是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的AI差距可能还在加大。” 周鸿祎提到,有了大模型技术作为基础,再加上人类知识的引导,可以创造各个领域的超级工具,例如在生物医学、蛋白质、基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。 2024年2月17日 8:39 AM

封面图片

OpenAI再次加塞砸场?谷歌展示自己才是AI灭霸

OpenAI再次加塞砸场?谷歌展示自己才是AI灭霸 他们上次这么做还是是2月份,谷歌发布了多模态大模型Gemini 1.5 Pro,直接将性能拉到支持百万Token的业界新高。但这并没有成为那天的焦点,因为OpenAI在同一天发布了文生视频工具Sora,诸多栩栩如生又极具想象力的AI视频随即成为了社交媒体上的爆款,抢尽了谷歌Gemini的几乎所有风头。这一次OpenAI又搞突然袭击。谷歌I/O大会的日期是提前数月就宣布的,但OpenAI上周突然宣布在谷歌大会前一天举办发布会,在昨天发布了最新大模型GPT-4o(o代表着Omnimodel全能模型),提前引爆了AI大模型的关注热度,再次打乱了谷歌即将发布AI新品的传播节奏。GPT-4o不仅是完全免费的,而且覆盖了桌面与移动App,不仅性能大幅提升,而且可以综合处理文本、图片和音频,人机交互更加自然简单。举例来说,可以让GPT-4o加入网络会议,给用户记录发言总结概要。GPT-4o具体有什么用?用户可以让GPT-4o处理眼前的问题,极大提升生产力,可以与AI实时语音对话,就像是与真人聊天一样自然流畅,AI处理反应已经达到人类的速度,甚至还可以理解用户的情绪,以相应的情感作出回应。那么,面对OpenAI的故意撞车和抢占风头,谷歌在今天的I/O大会上又拿出了怎样的AI产品,是否带来了足够的震撼与新意?Gemini 1.5 Pro支持两百万Token谷歌I/O开发者大会今年已经进入了第16个年头,AI早已成为I/O大会的绝对乃至唯一的主角。谷歌CEO皮查伊更是在结束时宣布,整场发布会一共说了121次AI,引发了全场大笑。(这个梗是因为去年媒体统计谷歌在I/O上一共说了143次AI,今年谷歌干脆自己公布统计数字)。虽然整场发布会都没有提及竞争对手,但谷歌CEO皮查伊从主题演讲一开始就开始秀谷歌的AI实力,宣布谷歌已经全面进入Gemini时代。他强调谷歌已经在AI领域投入了十多年时间,贯穿了AI的每一层:研究、产品、基础设施。虽然AI新贵OpenAI在产品发布方面抢占了先发优势,但谷歌在研究论文、用户规模、产品数量以及算力方面都占据着压倒性优势,这也是OpenAI必须与微软结盟的直接原因,因为两家公司都不可能单独与谷歌掰手腕。皮查伊还宣布,Gemini大模型已经覆盖了谷歌全平台的20亿用户产品,仅仅三个月时间就有100多万用户注册使用。而两个月前发布的原生多模型Gemini 1.5 Pro已经得到超过150万开发者的使用。在性能方面,谷歌就是AI业界的灭霸。Gemini 1.5 Pro此前直接将Token(上下文处理)性能提升到了百万级别,全面压倒了受困于性能变慢的GPT-4.0 Turbo。三个月后,谷歌在今天宣布改进版的Gemini 1.5 Pro全面开放给Gemini Advanced的用户,并且支持35种语言。更为残暴的是,谷歌还将Gemini 1.5 Pro的上下文窗口处理性能直接翻倍到了200万(暂时只面向开发者提供),在这方面OpenAI只能望尘莫及。皮查伊宣布,这是朝着无限上下文的最终目标迈出的重要一步。Gemini 1.5 Pro可以给用户带来怎样的实际体验?谷歌用Workspace办公组件展示了AI给生产力带来的巨大变化。举例来说,如果是通过Google Meets进行远程会议,哪怕用户无法参会,也可以让Gemini为自己录音并列出会议纪要。有了Gemini,Gmail邮箱就有了灵魂。代写邮件已经是基本操作了。用户可以让Gemini帮助自己整理和总结Gmail的海量邮件,根据最近的收据和信用卡账单邮件整理归纳出用户的消费支出,给出一份专业又具体的财务支出清单。在电商时代,Gemini还能扮演智能管家的角色。用户甚至可以让Gemini自动在邮件中找到收据邮件,并进入商家平台申请退货,还能让快递上门取货。这一切都只需要用户向Gemini下达指令。Gemini 1.5 Pro从今天开始全面入驻Workspace Labs。轻量AI模型FlashGemini模型家族的新品还不仅于此。谷歌DeepMind CEO哈撒比斯(Demis Hassabis)在主题演讲中介绍了Gemini的新成员:轻量、迅捷、高效的模型1.5 Flash,以及未来AI助手Project Astra。去年12月,谷歌发布了第一代原生多模型Gemini 1.0,包括了Ultra、Pro以及Nano三个版本。三个月后谷歌发布了百万Token处理能力的Gemini 1.5 Pro。今天谷歌将Gemini 1.5 Pro处理能力提升到200万级别之外,还推出了轻量模型Gemini 1.5 Flash。虽然Gemini 1.5 Flash的上下文处理能力同样达到了百万级别,但却比1.5 Pro更为轻便迅速,针对低延迟和专注成本的任务进行了优化,更适合规模化构建。Gemini 1.5 Flash今天就会在通过谷歌AI Studio和Vertex AI两大平台向开发者提供。Project Astra是谷歌DeepMind打造的未来通用智能AI助手,也是对标OpenAI GPT-4o的产品。Astra不仅具备多模态处理,可以无缝应对文本图片视频等多媒体内容,还能以更为智能实时的方式与用户进行对话。或许略微遗憾的是,OpenAI已经在昨天抢先发布了GPT-4o的类似功能,晚了一天亮相的Astra少了诸多惊喜和震撼,或许这就是OpenAI突然抢先发布的主要原因。因为谁先发布就占据了媒体报道的焦点。如果OpenAI在谷歌Astra之后发布GPT-4o,同样也会失去诸多传播魅力所在。搜索更加人性与个性从搜索到邮件,从地图到图片,再到办公组件,谷歌有着太多上亿乃至十亿用户级别的产品可以承载AI落地。横跨iOS与Android平台,移动与桌面两端的20亿+的用户规模,以及几乎覆盖所有领域的产品,更是谷歌AI技术落地的庞大产品军火库。生成式AI在搜索领域的应用显然是最直接的用户体验。即便微软借助OpenAI试图弯道超车,但过去一年市场份额也只涨了不到一个百分点(目前3.64%)。而谷歌虽然市场份额减少了两个百分点,但目前全球市场占有率依然接近91%。有了Gemini大模型的加持,谷歌搜索得以全面提升,提供一对一的解答。用户可以随心所欲的提问,无论是具体知识,还是寻求建议,谷歌搜索的AI Overviews都可以应答如流,不仅给出实际的回答,更提供信息来源。具体来说,用户搜索“如何清洗布质沙发”的问题,AI Overviews不仅会提供几种清洗沙发的方法,还会带来答案的信息来源,再附上清洗产品的链接(购买谷歌搜索广告的商家产品)。未来用户还可以根据自身需求,对AI Overview的回答进行个性化调整,提供更为简明扼要或者细节详尽的回答。实际上,此前已经有不少用户已经通过Search Labs的实验功能体验到了AI Overviews功能。AI Overviews今天正式在美国市场推出,未来会逐步扩展到其他国家市场。谷歌预计,单是本周时间就会有数亿用户使用到AI Overviews,今年年底用户规模或将突破10亿级别。AI功能全面落地手机端虽然I/O主题演讲开始78分钟之后,谷歌才开始介绍Android平台的AI新功能,但这并不意味着Android在谷歌AI战略的重要性降低。实际上,移动端才是用户体验谷歌AI功能的最直接平台。在今年年初三星手机推出谷歌AI技术加持的画圈搜索、全屏翻译等人性功能之后(三星国行版使用百度AI技术),半年时间全球已经有超过1亿设备搭载了谷歌画圈搜索功能。谷歌预计今年年底这一数字将翻一倍,达到两亿设备。而且,得益于谷歌LearnLM模型,画圈搜索功能还有了更多的实际运用。从今天开始,画圈搜索将帮助学生做家庭作业,替代家教作用,帮助他们更好了解如何做题,而不仅仅是给出直接答案。这也是昨天OpenAI GPT-4o所展示的使用场景。Gemini on Android是谷歌为Android平台推出的一系列人性化功能。有了这一功能,用户可以用对话的方式,在写邮件和发短信的过程中直接生成和发送个性化图片,可以在YouTube视频中直接寻找想要的内容,在PDF中迅速找到自己所需的内容,而不用再自己费力浏览搜索。在Android设备端上的Gemini Nano模型还带... PC版: 手机版:

封面图片

一年狂揽73亿美元投资 Anthropic点燃硅谷大模型“战火”

一年狂揽73亿美元投资 Anthropic点燃硅谷大模型“战火” Anthropic发布的跑分显示,Opus在多项基准测试中得分都超过了GPT-4 和Gemini 1.0 Ultra,拥有接近人类本科生水平的知识,“在数学、编程、多语言理解、视觉等多个维度树立了新的行业基准”。自去年3月GPT-4发布后,其一直是行业的最高标准以及追赶目标,此次Claude 3的出现,意味着其Top 1地位可能不保,不少人发出“GPT-4时代已过”的感叹。不过,天使投资人、资深人工智能专家郭涛对第一财经表示,这可能是一种过于过激的说法,GPT-4在许多应用中可能会比 Claude 3 更适合。开源大模型生态社区OpenCSG的创始人陈冉也并不认可“时代已过”,他表示,这是一个层级和另外一个层级比,毕竟GPT-4已经出来很长一段时间了。Claude 3之后,大家自然地将目光投向了OpenAI,GPT-5或许已经不远,这是“暴风雨前的宁静”。全面超越GPT-4?据Anthropic官方发布的跑分结果,Claude 3 Opus在本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K)等领域都超过了GPT-4在内的领先模型。事实真的如此吗?在Claude 3发布后,陈冉进行了试用和测评,在用他自己的一套方法测试了Opus的逻辑推理、代码等能力后,他认为,Claude 3的整体性能相比GPT-4平均提升了50%以上,包括“幻觉”、正确率和非正确率方面的表现等。从大模型胡乱回答问题的“幻觉”这一项来看,Claude3相比GPT-4要好很多,另外,在 GPT-4中,有些问题不会被回答,但在Claude 3中其回答的正确率提高了。在代码能力和推理上,陈冉测试了贪吃蛇游戏、扑克游戏等,他对第一财经表示,在这些方面GPT-4都失败了,但Claude 3 Opus做到了。在陈冉看来,此次Anthropic的发布策略很好,一次性推出三个不同性能的大模型,最出色的大模型打分都比GPT-4高,较小的模型打分也不低,而在成本上相对轻量的两个模型会比GPT-4便宜。Anthropic此次发布的Opus、Sonnet和Haiku分别针对不同的性能需求和成本效益。据官方介绍,Opus是最智能的模型,可以处理复杂的分析、具有多个步骤的较长任务以及高阶数学和编码任务;Sonnet是性能和速度的最佳组合,可实现高效、大体量的任务;Haiku是最快且最具成本效益的模型,可以执行轻量级操作,具有行业领先的速度。在成本上,能力最好的Claude 3 Opus比 GPT-4 Turbo 还要贵得多:GPT-4 Turbo 每百万token的输入/输出费用为 10/30 美元 ,而 Claude 3 Opus为 15/75 美元。不过,也有更具性价比的选择,Claude 3系列中,Sonnet的输入/输出定价是3 美元/15 美元,Haiku是0.25 美元/1.25 美元。值得一提的是,此次发布的Claude 3系列模型都支持 200k的上下文窗口, Anthropic还特别表示,在这个基础上,所有三个模型都能够接受超过 100 万tokens的输入,会提供给有特定需要的客户。作为对比,2023年更新的GPT-4窗口文本容量限制是32k,而2023年11月更新的GPT-4 turbo版能够接收128k的输入,相当于10万字的小说长度。对大模型来说,上下文窗口的文本长度越大,意味着其能更好地理解长篇文章或对话。此前,上海人工智能实验室领军科学家林达华对第一财经介绍,有了长语境交互,大模型能够读几百页的财报,将里面一些非常细致的信息精准提取出来形成摘要,或者听一场几个小时的会议转录,并将会议的关键信息摘取出来,对于大模型的落地很有用。基于Claude 3在多项能力上超越了GPT-4,行业这两天也出现了“GPT4时代已过”的声音,不过,郭涛认为,Claude 3 在某些基准测试中超过了 GPT-4,并不意味着 GPT-4 的时代已经过去,一方面基准测试并不能全面反映一个模型的全部能力,例如创造性写作、情感理解或特定领域知识方面的表现;另一方面,GPT-4在许多应用中可能会比 Claude 3 更适合,“而OpenAI也在不断研发新的技术和模型,很难说 GPT-4 的时代已经过去。”能与OpenAI一较高下吗对于Claude3这次的超越,在惊叹其表现之余,业界没有太多的意外,Anthropic过去一直被视为OpenAI最大的竞争对手之一。Anthropic的核心团队来自OpenAI,其创始人达里奥·阿莫迪(Dario Amodei)曾是OpenAI的研究副总裁,也是一位与高效利他主义社区有联系的研究员,因对OpenAI的未来方向有一些分歧而离开,并在2021年成立了Anthropic,计划以可信、安全可控的方式发展AI。Anthropic是目前除OpenAI外最被看好的大模型初创公司之一。在过去一年,Anthropic狂揽约73亿美元的投资,其中,亚马逊、Google作为最主要的投资者,分别投资了40亿美元和20亿美元,韩国电信巨头SK下注约1亿美元。就在过去一个月,Anthropic再次获得7.5亿美元的投资,来自硅谷风投机构Menlo Ventures。在未来与OpenAI的竞争中,陈冉认为Anthropic的胜面不小,一方面,其团队在算法上与OpenAI几乎没有差距,且Anthropic背后有亚马逊、Google这样的靠山,算力方面也并不缺,其次,作为背后投资者亚马逊拥有许多生态和场景,相应也能提供很多高质量的数据。陈冉认为,现在大模型竞争最关键的是数据,数据的质量越高越能训练好模型。“最终Claude有可能会赢。因为特色是合规和安全。”在Claude3发布后次日,陈冉在朋友圈表示。相比GPT-4等模型,Claude对安全的强调尤为明显。在技术文档中,Anthropic表示,Claude在训练过程中重点是有帮助、无害和诚实,Anthropic通过给模型一个想法来做到这一点,即一套伦理和行为原则,模型使用这些原则来指导其输出,以避免性别歧视、种族主义和有害的产出,以及避免帮助人类从事非法或不道德的活动。此外,Anthropic还会有安全评估,信任和安全团队会监控违反原则的有害、恶意用例的提示和输出。对于Anthropic未来是否能和 OpenAI 一较高下,郭涛认为这主要取决于几方面的因素。一方面,持续的研发和创新是保持竞争力的关键。如果 Anthropic 能够持续推出先进的技术和改进,它有可能在市场上与 OpenAI 竞争。另一方面,AI 大模型的成功不仅取决于核心技术,还取决于能够建立广泛的生态系统和合作伙伴关系,他认为,OpenAI 在这方面有着较强的影响力和网络效应。此外,如何在商业模式和市场策略上进行创新和调整,也是决定未来竞争格局的重要因素。“大家有共识目前Claude 3已经在部分能力上超越GPT-4,但具体未来能不能比GPT系列好,拭目以待。”陈冉说。Claude 3出现了,GPT-5还会远吗?在Claude 3发布后不久,英伟达高级科学家Jim Fan就在X上发文调侃,“正在等待几个小时后精心安排的GPT-5的发布”。Jim Fan随后表示,“我喜欢Claude在GPT和Gemini主导的竞技场上掀起热度。但请记住,GPT-4V这个每个人都迫切想要超越的高水位线,是在2022年完成训练的。这是暴风雨前的宁静。” ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人