简介:曾祥芹是当代的文章学研究专家又是阅读学研究专家,其阅读学成就主要体现在以文章学视角来研究阅读学。区别文章阅读与文学阅读的差异,明确文章阅读能力的重要性,是曾先生文章阅读研究的一个创新点。曾先生提出的文章阅读也是"创造性阅读"、"个性化阅读"等论断,既是对文章阅读本体理论的深入揭示,也是对现代以来人们对文章阅读认识缺乏或理论探讨不足现状的纠谬。对文章阅读的技法与规律的归纳与揭示,对各种文章阅读理论进行发掘探研,对文章阅读研究体系的建构,均是曾先生合阅读学与文章学于一体的创新研究;通过《说文解章》,曾先生坚持文章学知识与阅读学知识相结合,做到相辅相成,由此开创了新型的文章解说模式。要之,曾先生的文章阅读学研究既是对文章学的开拓,也是对阅读学的开创。
简介:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.