简介:摘要汉语量词(quantifiers)从古至今广泛地应用于人们的日常生活、文学作品之中,它具有两个方面,即使用固定的一面,也有使用灵活的一面。英语中也有类似量词的修饰词(短语),掌握好汉语量词的翻译方法也有助于理解英美文学作品以及相关文化背景。本文将从汉语量词的不同类别方面来分析研究其汉语量词英译。
简介:汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语“切分单位”的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。
简介:21世纪是信息时代,人文学术研究要实现数字化,汉语信息处理有许多问题需要重新加以研究,汉语史研究的数字化是重要的基础工作,计算机辅助汉语史研究的进展将为数字化的学术研究积累宝贵的经验。
简介:汉语的重叠有两类,一是构词重叠,如妈妈、饽饽、蝈蝈儿等;二是句法重叠,如人人、看看、好好等。两类重叠的区别在于:前者叠前和叠后意义和句法功能都是一样的,其中有的只有重叠式才可以单用;后者基式和重叠式的意义和句法功能都很不一样,而且基式都是可以单用。本文只考察句法重叠。文章从所有可重叠的词类中归纳出重叠的共同语法意义是,使基式的意义定量化。定量化又引起了词语句法功能的稳固化,这有两层含义:一是词语-旦重叠,就只能担任本词类的角色,不能转换为其它词类;二是重叠式只能出现在某些特定的句法位置上。文章从稳固的语法意义、确定句法功能的作用、严格的语音表现形式等几个角度论证,句法重叠是汉语的一种典型形态(morphology)。这种形态的语音表现形式,是受制于汉语特有的音节结构。文章还从认知的角度说明了,重叠范围的限制以及数量范畴与形态表征之间的关系。