简介:汉语作为第二语言能力评估的理论与应用研究,在国内已开展了二十余年,成果颇丰,尤其是在开发应用研究领域,先后推出了不同系列、不同类别的汉语水平考试(HSK)以及《汉语水平等级标准》、《国际汉语能力标准》等汉语作为第二语言的能力评估依据,在国际汉语教学界产生了重大影响。但是由于语言学界关于语言能力的理论尚处于探索过程之中,国内关于汉语作为第二语言能力理论研究不足,汉语作为第二语言能力的评估在受测者的实际语言能力、评估界定能力和能力量表三者之间的关联度上存在着较大的提升空间。文章基于HSK在推广实施过程中暴露出的适应度问题,对汉语作为第二语言能力的评估现状加以分析,旨在发现问题,希冀通过总结HSK和汉语能力标准制订的经验与教训,取长补短,制订出准确、客观的的汉语能力量表,使之更好地满足汉语国际推广工作的需要。
简介:汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语“切分单位”的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。