https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg59/IRGN2551EisoFeedba
https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg59/IRGN2551EisoFeedback.pdf前面讨论了:不同的人会使用“生造字”“自造字”“自创字”这些用语来表达不同的东西,比如:-有人想表达的是“权威字典里找不到的字”-有人是“生僻字、罕用汉字、自己不认识的字”-有人是“错别字”-有人是“异体字、异写字”-有人是“用输入法打不出来的字”-有人是“笔画多、结构复杂的字”后面用比较严谨的学术语言尝试界定了汉字的范围以及能否编码:一、核心汉字,用于描述固有语素。应编码二、用于固有词的扩展汉字,很多的地名用字、汉语方言字、民族语用字、工尺谱都属于这一类。应编码三、用于借词的扩展汉字,比如古人翻译佛经时创造的字。应编码四、表示新概念的扩展汉字,比如化学、生物领域在近代造的字。应编码五、不属于2~4且只用于人名的扩展汉字。由于大陆和台湾都搞实名制,为了便利活人的生活,应编码六、不属于2~4的复杂汉字。可以把其中的部件编码,不应给整体编码(biang字算第二类,所以biang字有编码)七、用于人造语言的扩展汉字。没错,说的就是希顶语如果语言已经稳定并且被纳入了ISO639,应编码八、不指代任何语素和概念的伪汉字,比如余少镭《》、徐冰《》。不应编码
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人