离线中英文词典数据库 | ECDICT | #数据库 #词典

离线中英文词典数据库#数据库#词典这是一份英文->中文字典的双解词典数据库,根据各类考试大纲和语料库词频收录数十万条各类单词的英文和中文释义,并按照各类考试大纲和词频进行标注。​​​“最初开发看书软件时需要给软件添加一个内嵌字典,在网上找到了一份别人提供的EDictAZ.txt的文本文件,里面有差不多两万英文单词的释义,于是开始用这个文件来提供字典查询,用着用着不够用了,又找到一份四六级到GRE包含释义的词汇表,但是缺少音标,于是写了个爬虫从各种资料里面把音标给爬下来,外加自己补充了一些组成了一份三万基本词汇的数据库。其后数年根据各种资料和网友贡献词库增长到10万左右,又找到Linux下面的cdict-1.0-1.rpm这个开源字典数据(mdict的主词库也是根据cdict转换得到),并按照英国国家语料库的前16万单词进行校对,补全很多语料库里词频较高但是却没有收录的词条。”

相关推荐

封面图片

简明英汉必应版:全网收词量最多的离线词典,词频考纲标注(432万词条)内容包含:

简明英汉必应版:全网收词量最多的离线词典,词频考纲标注(432万词条)内容包含:MDX版本(及去音标版):支持GoldenDict/mdict/BlueDict欧陆Eudic版(及去音标版):欧陆词典(桌面,手机)Kindle版本MDXCSS美化版本:支持GoldenDict/mdict/BlueDictStarDict版本:支持StarDict,多看系统因作者能力有限,该词典追求的是快速查词和查得率,让你在最短的时间内掌握一个单词的基本含义。整合了市面上各类免费和开源资料,利用BNC/COCA语料库进行词频矫正,并使用NodeBox,WordNet等自然语言处理工具包对各类时态语态,派生词等进行补充和标注。再根据考试大纲和柯林斯星级还有牛津3000核心词进行标注,让你一眼就能看出这个单词的重要性。词典是在340万收词量的开源词典《简明英汉增强版》(支持GoldenDict,欧陆词典,BlueDict,mdict,edwin,Kindle等)的基础上,补充了更多短语、谚语、新词、俚语和专业术语,并对前20万基础词汇使用必应释义进行了校对并发布。词典制作使用的工具:开发语言用的Python,以及beautifulsoup4,lxml,requests等常用模块,自然语言处理用到了WordNet和NodeBox两个包。以及,作者自己写的开源的ECDICT项目(Python词典数据库及相关脚本)和其他包括自然语言处理,BNC/COCA的分析程序,十多个不同类型的爬虫,等大大小小几十个脚本程序。数据库使用SQLite,CSV等。#词典

封面图片

朗文 - 汉英中华文化图解词典 [扫描版电子书]

名称:朗文-汉英中华文化图解词典[扫描版电子书]描述:本词典属根据世界著名的三大语料库之一COBUILD中的英语语料库(TheBankofEnglish)编写的系列工具书之一,是对第一版进行全面修订后出版的第二版。词典中的例词和例句均取材于COBUILD英语语料库。故本词典收录了当代英语词目75000余条,其中4000余条为近年来进入英语的新词。本词典英语语料地道实用,版面新颖,语言信息特别详尽。链接:https://www.aliyundrive.com/s/xrhBaUxc2jN大小:31.99MB标签:#电子书#朗文#汉英词典来自:雷锋版权:频道:@shareAliyun群组:@aliyundriveShare投稿:@aliyun_share_bot

封面图片

朗文当代高级英语词典 第五版 双色pdf高清版本

资源名称:朗文当代高级英语词典第五版双色pdf高清版本描述:目前网络上流传的最好版本!收词全面:收录词条、短语和释义达230,000条,包含大量新词新义解读文化:涵盖各种文化词目,帮助读者学习英语国家文化例证地道:165,000条例证全部来自权威朗文语料库,原汁原味,自然真实释义简明:所有词条用2,000个基本单词解释,浅显易懂,避免循环查证详解难点:近700处“语法”专栏和“词语辨析”专栏,深入剖析语言疑点难点突出搭配:提供65,000项搭配信息,并设450余处“词语搭配”专栏,丰富表达,助力口语与写作注重语用:设置约400处“语体”专栏和“语用学”专页,详尽解析词汇使用语境,指导读者得体运用扩充词汇:提供18,000个同义词、反义词和相关词,方便联想记忆,有助积累词汇标注词频:显示口语和书面语中最常用的3,000词,便于读者优先掌握插图丰富:插图随处可见,形象展示词语之间的细微差别链接:https://www.aliyundrive.com/s/4FnKoM225q9

封面图片

史料RAG:用向量数据库基于RAG(检索增强生成)方式搭建一个中国历史问答应用,这个应用接受用户的询问,从历史语料库中检索相关的

:用向量数据库基于RAG(检索增强生成)方式搭建一个中国历史问答应用,这个应用接受用户的询问,从历史语料库中检索相关的历史资料片段,利用大语言模型给出较为可靠的回答。相比于直接询问大模型,这种方式具有回答准确率高,不容易产生大模型的“幻觉”问题等优点。本项目实现了两种使用方式:“Milvus方案“在本地启动一个Milvus向量数据库的Docker服务,使用LlamaIndex框架和本地BAAI/bge-base-zh-v1.5Embedding模型实现RAG的业务逻辑。“ZillizCloudPipelines方案”使用云上的知识库检索服务ZillizCloudPipelines,该服务包括了RAG流程的文档切片、向量化、向量检索等功能。两种方案均使用OpenAI的GPT4作为大语言模型。

封面图片

机械零部件名词术语图解词典 (中英文) (第二版) [EPUB 电子书]

名称:机械零部件名词术语图解词典(中英文)(第二版)[EPUB电子书]描述:本词典在内容安排上注重系统性和专业性,力求全面反映现代机械零部件的结构、功能和技术特点,并侧重对新结构和新技术的介绍。例如:对于通用零部件的螺栓,即详细介绍了常用螺栓,又对近年来新出现的特殊用途螺栓进行了图解说明。在选图上,采用实物照片和结构图相结合的方式,说明力求简明和准确。链接:https://www.aliyundrive.com/s/hUJMuoiZi3R大小:38.91MB标签:#机械#词典#电子书#epub来自:雷锋版权:频道:@shareAliyun群组:@aliyundriveShare投稿:@aliyun_share_bot

封面图片

QAnything:一个本地知识库问答系统,支持多种文件格式和数据库,允许离线安装和使用。

:一个本地知识库问答系统,支持多种文件格式和数据库,允许离线安装和使用。使用QAnything可以简单地删除本地存储的任何格式的文件,并获得准确、快速和可靠的答案。目前支持的格式包括:PDF、Word(doc/docx)、PPT、Markdown、Eml、TXT、图像(jpg、png等)、Web链接以及即将推出的更多格式...主要特征数据安全,支持全程不插网线安装使用。跨语言QA支持,中英文QA自由切换,无论文档语言如何。支持海量数据QA,两阶段检索排序,解决大规模数据检索的退化问题;数据越多,性能越好。高性能生产级系统,可直接部署用于企业应用。人性化,无需繁琐配置,一键安装部署,即用即用。多知识库QA支持选择多个知识库进行问答

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人