简介:北京大学计算语言学研究所自2003年1月起承担了国家重点基础研究973项目《汉语高频词语法信息词典》的研制任务,至2003年9月已完成。本文详细介绍《汉语高频词语法信息词典》的研制过程以及存在的问题。
简介:本文介绍了的特点,论述了该词典需要改进的几个方面,这样可以进一步提高该词典的应用价值.
简介:语法研究所用经验证据有三个主要来源:自拟,真实出现的语言材料,包括口语和书面语,以及实验或调查。现代汉语语法研究始于黎锦熙1924出版的《新著国语文法》。1950年代之前的现代汉语语法著作,根据的几乎全部是书面语材料,包括早期白话文和现代白话文作品,并且大都标明出处,以示有书为证。这种做法延续到1950年代。从1955—1956年公布的普通话定义也可以看出,它代表了当时的共识。1960年代之后,尤其是近三四十年来,通过自拟获取例证的做法渐渐通行开来,更为重视口语,尤其是北京口语的研究,从书面语直接引用或改写的例句也可以不必注明出处。这些变化反映汉语语法研究者对自己语感的自信在不断增强,反映现代汉语语法学界对于什么是合语法或不合语法的用法有了越来越多的共识,也反映现代汉语标准化程度在不断提高。现代汉语语法研究应该如何获取证据,涉及许多同现代汉语标准语的起源与发展有关的问题,主要围绕如何看待作为语料的现代汉语标准语、口语和书面语这三者之间的关系,如何把握自拟、利用真实语料以及实验/调查这三种获取证据的方式各自的特点。本文的主要目的,是梳理有关问题的来龙去脉,并指出某些问题的症结所在。
简介:<正>0背景和材料公元十二世纪初到十三世纪中叶,中国北方大陆经历了一场重大的政治变迁。从金灭北宋到元灭金,社会发生深刻变化,异族语言也大量渗入北方汉语,从语音、词汇、乃至语法都有影响,从而形成了汉语发展史上一个非常特殊的阶段。陆放翁《剑南诗稿》卷四"得韩无咎书寄使虏时宴东都驿中所作四阙"说:"……上源驿中把画鼓,汉使作客胡作主,舞女不记宣和妆,庐儿尽能女真语。"范成大在《揽弓暂录》驿中载道:"至东京,金改为南京。……民亦久习胡俗,态度嗜好与之俱化,最甚至衣装之类,其制尽为胡矣。"范成大出使金国是金世宗大定十年,即公元1170年。当时淮河以北的汉族
简介:树库是一种记录每个句子句法分析结果的标注语料库。文章介绍的是美国宾州大学构建的中文树库(CTB)。描写句子的谓词一沦元结构是CTB标注的一个重要目标。因此,它在句法标注中刻意强调的是以下三个抽象的语法关系:中心语补足语关系、中心语一附加语关系和并列关系。在CTB中每个短语节点所支配的括号对或子树只表示上述的一种语法关系。此外,CTB在语法体系上也有很多特点,文章仅选取补足语、汉语的标句词“(DEC)”以及遵循语杠理论的词性标注准则等三个汉语语法问题来进行讨论。如果我们同意句子的谓词~论元结构描写是树库建设的一个重要目标,那么上述三个问题不仅同这个目标紧密关联,而且将影响到基于树库的自动词性标注和句法分析系统的性能及其后续应用的结果。
简介:传统小说多来自话本。作为讲述底本,话本在叙述程式和叙述视角上具有显著的现场性特点。从话语行为角度看,表现为故事讲述与言者评价交错;就叙述视角而言,表现为情节内人物视角与言者视角交错。这种叙事传统对后代叙事语体篇章的组织方式产生了重要影响。其影响主要表现在:(1)叙事语篇中有大量的为构建现场效应所采用的互动性表达。(2)体现叙述视角的语言形式不仅包括人称选择、元话语词汇选择,还包括一些具有人际互动功能的句式。(3)无论是情节的开启和转换,还是话题的建立、延续和转换,以及讲述行为与评价行为的切换等篇章框架标记,都大量来自以无主语形式呈现的小句,如言说动词小句、视觉动词小句和认识义动词小句,这种弱化的小句甚至可以理解为动词本身的虚化。