简介:摘要:中国是一个历史文化十分悠久的国家,汉语的谚语闪烁着中国人的传统智慧。汉语谚语反映的是汉民族的生活习性、生存环境以及与之相关的价值观念和思维方式;英语文化也具有较为悠久的历史,谚语不仅有代表该文化传统的成分,还从许多民族语言中吸取了大量成分,使得英语谚语表现出丰富多彩的特色。英语谚语反映的是盎格鲁—撒克逊民族的生活习性、生存环境以及与之相关的价值观念和思维方式。
简介:自孔宪中先生开始“骂祖宗”以来,一直是“骂”声不绝。围绕中文的“骂其可骂”之处,语文界随之便有“帮骂”、“反骂”,继而又有“辩骂”。如果通过“骂”、“帮骂”、“反骂”和“辩骂”而凸显出汉语的精神来,孔先生功莫大焉。如果证明孔先生的观点都是错的,这也无损孔先生的威名,因为我们面对的是语言这一客观事实,对它的探究属于科学范畴,而科学的标准之一就是可证伪性(falsifiability)。孔先生对前人观点之否定是证伪,同仁对孔先生的否定之否定也是证伪。在科学史上证伪和证实有着同样的价值。如果孔先生的观点有1%是正确的,这便是孔先生贡献的又一体现了。孔先生并非故作惊人之语,而是拳拳的赤子之心的“善骂”,犹柏杨之“骂”矣。
简介:汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语“切分单位”的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。