简介:域估计是抽样调查的研究热点之一,其核心问题是样本量问题。在实践中,域包含计划域和非计划域,若为计划域,兼顾总体和域的估计精度的抽样设计方案更有效,其中关键是域样本量分配问题。域样本量的研究方法主要有5种,包含传统的比例、最优、内曼、等量分配方法和Power分配方法。通过使用中国家庭追踪调查数据对5种方法进行比较研究。研究表明,比例、最优、内曼分配方法有助于提高总体的估计精度,当总样本量较小时,无法兼顾域的估计精度;等量分配方法能提高域的估计精度,便于域之间的比较,但降低了总体的估计精度;Power分配方法虽然略微降低了总体的估计精度,却显著提高了域的估计精度,是兼顾总体和域的估计精度的样本分配方法。
简介:摘要结合人工神经网络领域的理论成果,量化描述大脑处理信息的过程,分析大脑各生化参数、生理机制对具体信息存储、信息提取的影响,将有助于进一步理解大脑的工作原理。本文介绍了一个量化描述大脑信息存储、信息提取的思路,并结合结构风险最小化原理,分析说明大脑在具体信息处理过程中存在样本量和网络规模匹配的问题。在量化模型的帮助下,可以看到,血液循环的时序控制作用、语言机制等能和大脑的生化参数相互配合,实现如下几点,从而使大脑能对不同信息处理组织起相对独立规模受控的子网络,降低结构风险,准确而高效的处理信息1在处理特定信息的时候,相关网络中细胞的兴奋程度足够大,并且能维持足够长的兴奋时间2在处理特定信息的时候,无关网络中细胞的兴奋程度足够小3兴奋程度大小和时间长短不同造成连接改变程度差异,改变程度差异参数和遗忘机制的参数能相互配合4在实现差异的基础上,又能保证生化环境的稳定,使信息提取时输入神经网络的样本不和训练样本差别过大5子网络的组织有一定的稳定性和灵活性。
简介:b值是研究地震活动的重要指标,其广泛应用于地震危险性分析和地震预测研究之中,与实际资料的完整性、样本量的大小、计算方法等因素有着重要的关系。常见的b值计算方法有最小二乘法和最大似然法,样本量的大小对这2种方法影响很大。本文利用蒙特卡罗模拟地震目录和汾渭地震带实际目录作为样本,从中抽取不同大小的样本量进行计算,研究不同样本量下这2种方法计算得到的b值与设定值或真实值之间的差别。结果表明,最小二乘法需要的最低样本量为1000,最大似然法为200;当样本量达不到要求时,计算出的b值是不可靠的;由于对样本量的要求不同,前者适用于计算区域的整体b值,而后者在研究某区域b值在时间轴上的变化方面更有优势。本研究为确定2种b值计算方法对样本量的最低要求提供了参考依据。
简介:随着巴塞尔新资本协议II、III的陆续出台,中国银监会也要求国内银行必须对操作风险计提监管资本。但计提监管资本需要准确度量风险,而中国学者因难以获得内部数据只好采用外部数据进行度量,每个研究团队搜集的外部数据是否充分?多少外部数据能够体现总体特征?最少需收集多少外部数据?至今尚无人回答这些问题。文章就此问题采用非参数变规模拔靴法,通过设定各分位数均值变化率截点值来选择样本规模,对每一样本规模多次模拟后拟合损失强度分布并模拟年度操作风险资本金,经过对比分析后,得出最小样本规模在800例(包含极端值),模拟结果比较稳定。与Wind数据库对中国银行业2013年的操作风险资本金判断相比,度量结果比较合理。这说明,不考虑所收集的外部数据是否能代表总体特征就计算,结果可能会产生一定偏差。