近邻词汇检索新增了“英文”近邻词查询。

近邻词汇检索新增了“英文”近邻词查询。 对英语学习、写作、翻译有帮助,可以寻找英语的近似表达、发现概念拓展思路。 注意:中文和英文是两个独立集合。在英文中查找中文近邻词、或者反过来,都很可能没有结果 | #工具 #英语

相关推荐

封面图片

语言的基本单位是词,不是字。对学中文的外国人来说,只识字不学词,依然没用。学的主要障碍恰恰在于字太多,既要识字也要掌握词汇,而学

语言的基本单位是词,不是字。对学中文的外国人来说,只识字不学词,依然没用。学中文的主要障碍恰恰在于字太多,既要识字也要掌握词汇,而学英文只要掌握词汇。认为中文比英文容易的人,完全是无知,从来没接触过学中文的外国人就在那里意淫。

封面图片

由于 Telegram 的检索功能太烂,特别是中文,故专门为频道搭建了一个信息引索 bot,支持中英文检索。

由于 Telegram 的检索功能太烂,特别是中文,故专门为频道搭建了一个信息引索 bot,支持中英文检索。 使用方法: 私聊 @yummy_search_bot,发送内容,点击检索结果即可跳转频道对应消息 下面几条命令任何用户都可以使用: 1./search [keyword]: 搜索消息,同去掉 /search 的情形等价。 2./chats [keyword]: 列出所有被索引的,标题中包含 keyword 的会话列表。如果没有指定 keyword,则返回所有的会话。bot 会返回一列按钮,点击一个按钮之后这条消息就对应了一个会话。有一些指令包含 chat_id 作为参数,对于这些指令,如果没有指定 chat_id 参数,那么可以通过回复这条消息来把会话的 ID 当作参数。如果回复搜索的关键词,则只搜索这个会话中的消息。 3./random:返回一条随机的消息(暂不支持指定会话) 标签: #bot #中文搜索 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

:拓词 #英语 记忆算法和学习心理应用是一个专注记忆算法和学习心理研究,坚持“极简”设计思路,协助大家快速拓展词汇量,让背单词高

:拓词 #英语 记忆算法和学习心理应用是一个专注记忆算法和学习心理研究,坚持“极简”设计思路,协助大家快速拓展词汇量,让背单词高效、不痛苦,更容易坚持,为提高外语水平奠定基础。结合计算算法和记忆算法来帮助学子们更好的记住单词,并且推出iOS和Android应用。 ToWords:拓词英语记忆算法和学习心理应用其最大的两个主要特点: 1、基本上覆盖了四、六级、硕士入学考试、雅思、托福、GRE等单词面,用户可以根据需求选择其中的任何单词书进行背诵。 2、多种方式保证单词的记忆的效果。该应用会根据你的反应速度评估你对某个单词的记忆程度,然后不断的再次呈现该单词以巩固记忆。另外其还通过语音、词形、词义等来考察单词的记忆。 因此,通过“拓词”,你只需要选择好单词书然后每天坚持记忆就行了,其他的一切包括记忆进度、巩固程度等数据都可以在拓词里面看到。

封面图片

AI 大模型的语言不平等:英语最便宜,其它语言要贵得多

AI 大模型的语言不平等:英语最便宜,其它语言要贵得多 用户所使用的语言对于大型语言模型(LLM)的费用有很大的影响,可能造成英语使用者和其它语言使用者之间的人工智能鸿沟。 最近的一项研究显示,由于 OpenAI 等服务所采用的服务器成本衡量和计费的方式,英语输入和输出的费用要比其他语言低得多,其中简体中文的费用大约是英语的两倍,西班牙语是英语的 1.5 倍,而缅甸的掸语则是英语的 15 倍。 推特用户 Dylan Patel 分享了一张照片,展示了牛津大学进行的一项研究,该研究发现,让一个 LLM 处理一句缅甸语句子需要 198 个词元(tokens),而同样的句子用英语写只需要 17 个词元。词元代表了通过 API(如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2)访问 LLM 所需的计算力成本,这意味着缅甸语句子使用这种服务的成本比英语句子高出 11 倍。 词元化模型(即人工智能公司将用户输入转换为计算成本的方式)意味着,除了英语之外的其他语言使用和训练模型要贵得多。这是因为像中文这样的语言有着不同、更复杂的结构(无论是从语法还是字符数量上),导致它们需要更高的词元化率。例如,根据 OpenAI 的 GPT3 分词器 ,“你的爱意(your affection)”的词元,在英语中只需要两个词元,但在简体中文中需要八个词元。尽管简体中文文本只有 4 个字符(你的爱意),而英文有 14 个字符。 、

封面图片

咬文嚼字:词元是当今生成式人工智能失败的一个重要原因

咬文嚼字:词元是当今生成式人工智能失败的一个重要原因 因此,出于实用性和技术性的考虑,今天的转换器模型使用的文本已经被分解成更小、更小的片段,这些片段被称为标记这一过程被称为标记化。词元可以是单词,如"fantastic"。也可以是音节,如"fan"、"tas"和"tic"。根据标记化器(标记化模型)的不同,它们甚至可以是单词中的单个字符(例如,"f"、"a"、"n"、"t"、"a"、"s"、"t"、"i"、"c")。使用这种方法,转换器可以在达到称为上下文窗口的上限之前接收更多信息(语义意义上的)。但标记化也会带来偏差。有些标记符有奇特的间距,这会使转换器出错。例如,词元转换器可能会将"once upon a time"编码为"once"、"on"、"a"、"time",而将"once upon a"(有尾部空白)编码为"once"、"on"、"a"、"."。根据对模型的提示方式"once upon a"还是"once upon a ,"结果可能完全不同,因为模型并不能理解(就像人一样)意思是一样的。标记符号化器处理大小写的方式也不同。对模型来说,"Hello"并不一定等同于"HELLO";"hello"通常是一个标记(取决于标记化器),而"HELLO"可能有三个标记("HE"、"El"和"O")。这就是许多转换器无法通过大写字母测试的原因。东北大学研究大型语言模型可解释性的博士生 Sheridan Feucht 对此表示:"对于语言模型来说,'词'到底应该是什么,这个问题有点难以解决,即使我们让人类专家就完美的标记词汇达成一致,模型可能仍然会认为进一步'分块'是有用的。"我的猜测是,由于这种模糊性,不存在完美的标记符号生成器。"这种"模糊性"给英语以外的语言带来了更多问题。许多标记化方法都认为句子中的空格表示一个新词。这是因为它们是针对英语设计的。但并非所有语言都使用空格来分隔单词。汉语和日语不使用空格,韩语、泰语和高棉语也不使用。2023 年牛津大学的一项研究发现,由于非英语语言的标记化方式不同,转换器完成一项非英语语言任务所需的时间可能是英语任务的两倍。同一项研究和另一项研究发现,"标记效率"较低的语言的用户很可能会看到更差的模型性能,但却要支付更高的使用费用,因为许多人工智能供应商是按标记收费的。标记化器通常将逻各斯书写系统中的每个字符(在这种系统中,印刷符号代表单词,而与发音无关,如中文)视为一个独立的标记,从而导致标记数较高。同样,标记化器在处理凝集语(单词由称为词素的有意义的小词元组成,如土耳其语)时,往往会将每个词素变成一个标记,从而增加总体标记数。(在泰语中,"hello"的对应词สวัสดี有六个标记)。2023 年,Google DeepMind 人工智能研究员 Yennie Jun进行了一项分析,比较了不同语言的标记化及其下游效果。通过使用一个翻译成 52 种语言的平行文本数据集,Jun 发现有些语言需要多达 10 倍的标记才能表达英语中的相同含义。除了语言上的不平等,标记化也可以解释为什么今天的模型数学不好。数字标记化很少能保持一致。因为它们并不真正了解数字是什么,标记符号化器可能会将"380"视为一个标记符号,而将"381"表示为一对("38"和"1")这实际上破坏了数字之间的关系以及方程和公式中的结果。结果就是转换器混乱;最近的一篇论文表明,模型很难理解重复的数字模式和上下文,尤其是时间数据。(参见:GPT-4认为7735 大于 7926)。这也是模型不擅长解决变位问题或颠倒单词的原因。标记化显然给生成式人工智能带来了挑战。它们能被解决吗?也许吧。Feucht 指出,像MambaByte 这样的"字节级"状态空间模型,通过完全取消标记化,可以摄取比转换器多得多的数据,而不会影响性能。MambaByte 可直接处理代表文本和其他数据的原始字节,在语言分析任务方面可与某些转换器模型媲美,同时还能更好地处理"噪音",如带有交换字符、间距和大写字母的单词。不过,像 MambaByte 这样的模式还处于早期研究阶段。"最好的办法可能是让模型直接查看字符,而不强加标记化,但现在这对变换器来说在计算上是不可行的,"Feucht 说。"特别是对于变换器模型来说,计算量与序列长度成二次方关系,因此我们真的希望使用简短的文本表示"。如果不能在词元化方面取得突破,新的模型架构似乎将成为关键。 ... PC版: 手机版:

封面图片

Gemini Ultra每月19.9刀,前两月免费 网友实测:GPT-4不香了

Gemini Ultra每月19.9刀,前两月免费 网友实测:GPT-4不香了 新服务订阅价格为每月19.99美金 ,和ChatGPT Plus、Perplexity Pro等主流生成式AI应用每月20美金的价格差不多。不过为了显示诚意,Google会提供前两个月免费试用。Google最高阶多模态大模型,Gemini Ultra新时代开启据Google CEO 桑达尔·皮查伊称,Ultra 1.0是首个在 MMLU(大规模多任务语言理解)上超越人类专家的模型,使用了包括数学、物理、历史、法律、医学和伦理学在内的57个学科组合来测试知识和解决问题的能力。因此,Gemini Advanced在编码、逻辑推理、遵循微妙指令和协作创意项目等高度复杂的任务上将更加强大。不仅可以与用户进行更长、更详细的对话,还能更好地理解提示上下文。比如:Gemini Advanced可以成为个人导师,为你创建逐步说明、个性化测验或根据学习风格量身定制回答;解决更复杂的编码场景,并协助评估不同的编程思路;成为数字创作者的创意伙伴,生成新鲜内容,分析最新趋势,制定商业计划书。值得一提的是,Gemini Ultra内由Imagen 2生成的所有图像都应用了数字水印(虽然你看不到它)。随着新功能不断添加,用户将体验到更强的多模态能力、更多交互式编程功能以及更深入的数据分析。目前Gemini Advanced仅支持英语,可以在超过150个国家和地区使用,将逐步扩展到更多语言。Android和IOS手机端登场,Gmail、文档、表格可使用Gemini Advanced作为全新Google One AI高级计划的一部分,还会给用户提供2TB存储空间。此外,AI高级订阅者很快就能够在Gmail、Docs、Slides、Sheets等之前被集合为Duet AI的应用中指调用Gemini Ultra。为了实现手机端轻松访问,Google此次推出全新Gemini应用程序。你可以拍摄一张车胎的照片请求说明,为晚宴邀请函生成自定义图像,或者要求撰写一条复杂短信。Google称之为“构建真正的AI助手的重要第一步,一个具有对话性、多模态的新型实用助理。”Android手机用户可以下载Gemini应用程序,或按照平时激活Google助手的方式比如直接说“嘿,Google”来将它唤醒。Gemini 能为你刚拍摄的照片生成描述,回答阅读中文章的相关问题。许多Google助手的语音功能也将通过Gemini App可用,包括设置定时器、打电话和控制智能家居设备等。虽然iOS应用还在路上,但Google表示在接下来的几周里即会上架App Store。将Gemini 能力扩展至更多产品Gemini也将全面应用于个人和企业每天使用的产品,包括 Workspace 和Google云服务。Workspace:皮查伊表示,目前已经有超过100万人正在使用像 “Help me write ”这样的功能,通过 Duet AI 提高生产力和创造力。从今天起,Duet AI 将改为 Gemini for Workspace,并且很快, Google One AI 高级计划订阅者就能在 Gmail、Docs、Sheets、Slides 和 Meet 等Google办公全套件中使用 Gemini Ultra。Google云:对于云客户来说,Gemini 将帮助提高企业生产力,协助开发人员更高效编写代码,并保护组织免受网络攻击。开发者一直是每一次重大技术变革的基础,在 Gemini 生态系统中也扮演着同样重要的角色。现在已经有数十万技术人员和企业正在使用 Gemini 大模型进行开发。Google将在下周分享更多关于开发者和云客户未来权益的详细信息。皮查伊还透露,Google已经在积极训练下一代 Gemini 模型了。网友迫不及待,Gemini Ultra新鲜开测去年12月6日Google发布Gemini Pro时,对标的是GPT-3.5。由于取消了原定的线下亮相,Gemini系列被媒体渲染得阴影重重。于是没隔几天,中杯大杯忽然集体登场,还以一个震慑三观的“鸭子”视频demo引发热烈讨论和网络打假。当时Google曾预告说在32项LLM广泛使用的基准测试中,Gemini Ultra有30项都超越了 ChatGPT代表的业界最先进水平。究竟Ultra版本实力如何,现在终于可以上手一探究竟了。用写LinkedIn Post来测试内容生成。结论是Gemini Ultra凭借更多标题选项、更快响应速度和“没有愚蠢的emoji表情”击败GPT-4成为绝对胜者。网友 Alphabetting拿出一道逻辑推理题:Tabitha喜欢饼干但不喜欢蛋糕,喜欢羊肉但不喜欢羔羊肉,喜欢秋葵但不喜欢南瓜。它询问按照相同规则,Tabitha会喜欢樱桃还是梨。Gemini Ultra给出的建议是:“Tabitha喜欢发音两个音节的食物,不喜欢一个音节的食物。”它列出谜题中每种食物的音节数,由于“cherries”有两个音节,因此答案是樱桃。GPT-4认为Tabitha的偏好可能与单词最后一个字母有关。她喜欢的食物结尾是辅音,而她不喜欢的食物结尾是原因。这样的话,樱桃和梨都符合条件有些棘手,但一定要选一个的话,那就樱桃吧。他表示Gemini Ultra成功解决了被GPT-4搞到稀碎的逻辑测试。用户Brett Winton测试两者的文生图功能,提示词是“生成一个画家试图在火箭外部画静物的图像,让它幽默一些,一幅插画“。左边是GPT-4,右边是Gemini Ultra。AI模型的想象力见仁见智,不过Gemini图像里的画家比起绘画更像在吃东西,手部细节也有点问题。评论里都觉得GPT-4更好些。他又紧接着对比了Gemini Ultra、 Claude和GPT-3.5对于8年级数学题计算能力。题面是:Garcia正策划一个比萨派对,她需要确保30名学生每人至少得到3片,每个比萨有8片。为增加多样性, Garcia决定订购一半奶酪比萨和一半香肠比萨。然而有5名学生是素食者,只会吃奶酪比萨。请回答:1.Garcia需要订购多少个比萨,以确保每个学生至少3片?2.每种类型比萨各多少个?3.如果每个比萨12美元,总订单费用是多少?在之前的测试中, Gemini Pro把这道题搞砸了。此次Ultra答对了总数12个比萨和费用144美元。但第2题的正确答案应该是两种比萨各6个,Ultra没通过。Brett Winton表示,Gemini Ultra和Claude一样,数学计算都不如GPT-3.5准确。编码能力上,网友Mervin Praison在Gemini Ultra用Python成功创建了一个贪吃蛇游戏。更多更深入的用例,大家可以抓住两个月的免费试用福利,亲自上手玩一玩。OpenAI开辟AI代理新战场,Google 不甘落后Google副总裁兼Gemini体验和Google助手部门总经理Sissie Hsiao表示,“对Google来说,Gemini不仅仅是模型。它实际上是我们思考最先进技术,以及我们在其基础上构建的整个生态系统的转变,从影响数十亿用户的产品,到开发者和企业用来创新的API平台。”就在昨天,The Information发表题为《OpenAI正将AI竞争焦点转移到能操作设备和自动化任务的软件上》的报道。文中爆料,OpenAI正在开发一种代理软件,能有效接管手机和电脑,替用户执行复杂任务操作。你可以命令ChatGPT执行从文档到表格的数据转移,自动填写费用报告并输入到会计软件中,或者在特定预算下创建行程或预订机票等基于网络的任务。随着越来越多全新大模型的推出,OpenAI也深知今年可能不再拥有市场上最强大LLM的可能性。所以加紧开辟新战场早做准备。据知情人士称,这类请求将触发代理点击、光标移动、文本输入等其它人类动作。可能会将将ChatGPT变成Sam Altman私下称为“超智能个人工作助理”的工具,也将与微软Copilot和GoogleGemini for Workspace 展开更直接竞争。去年ChatGPT已经给OpenAI带来16亿美元收入,微软也靠生成式AI显著拉升了最新季度财报业绩。而AI业务却还没有给Google带来明朗的现金流。如今付费版本Gemini Advanced和Ultra 1.0的推出会带来怎样的市场回馈,那些已经花钱订阅GPT的用户们会不会转投Gemini,人工智能整合进Google生态的全新究极样貌是什么?这些都让人期待。今年,注定继续是高潮迭起的AI拉锯战。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人