腾讯ailab的中英文词语料库。中英文都提供200维向量表征。很早之前就发布了,不过一直在更新,现在更新到了1200多万中文词和600多万英文词​​​#语料库

None

相关推荐

封面图片

DialogCorpus:用于训练中英文对话系统的语料库#趣站#Githubhttps://www.ahhhhfs.com/24361/

封面图片

离线中英文词典数据库 | ECDICT | #数据库 #词典

离线中英文词典数据库#数据库#词典这是一份英文->中文字典的双解词典数据库,根据各类考试大纲和语料库词频收录数十万条各类单词的英文和中文释义,并按照各类考试大纲和词频进行标注。​​​“最初开发看书软件时需要给软件添加一个内嵌字典,在网上找到了一份别人提供的EDictAZ.txt的文本文件,里面有差不多两万英文单词的释义,于是开始用这个文件来提供字典查询,用着用着不够用了,又找到一份四六级到GRE包含释义的词汇表,但是缺少音标,于是写了个爬虫从各种资料里面把音标给爬下来,外加自己补充了一些组成了一份三万基本词汇的数据库。其后数年根据各种资料和网友贡献词库增长到10万左右,又找到Linux下面的cdict-1.0-1.rpm这个开源字典数据(mdict的主词库也是根据cdict转换得到),并按照英国国家语料库的前16万单词进行校对,补全很多语料库里词频较高但是却没有收录的词条。”

封面图片

剑桥法律语料库:法律人工智能研究语料库。​​​#语料库

封面图片

#教育#语料库

封面图片

大规模信息提取语料库,用于训练和评估信息提取模型#语料库

封面图片

Telegram地下市场中文语料库-TUMCC#GitHub项目#趣站#语料库https://www.ahhhhfs.com/46429/

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人