学科分类
/ 1
7 个结果
  • 简介:极端值亦称离群值或边远值,即在观测值中远远偏离数据主体部分的个别值,这些值不能服从假定的概率分布。如果将极端值和其它数据不加区别地等同对待,会使数据的离散程度加大,计算出的数字特征不能反映主体数据的特征。对极端值进行识别并加以处理,是探索性数据分析的一个重要问题。经过适当处理后的数据,具有较强的耐抗性,即对局部数据的不良行为具有不敏感性。在统计分析中,识别极端值的方法有以下几种:(一)四分展布法四分展布法是一种经验法,首先计算中位数和四分位数:设有数据X1,X2…Xn,将其从小到大排列,记为X(t),X(2)…X(n);当n为奇数时,n=2k+1,中位数=X(k),中位数位次为k+1;当n为偶

  • 标签: 极端值 SPSS统计分析软件 截断点 茎叶图 如何识别 中位数
  • 简介:模式识别是近年来迅速发展的一门学科,在工业、信息处理等领域有广泛应用。本文对模式识别、模式识别与统计学的关系进行了简单介绍,同时介绍了模式识别课程中两种基本的统计学方法:贝叶斯统计决策理论及概率密度估计理论。

  • 标签: 模式识别 模式识别课程 贝叶斯决策 概率密度估计
  • 简介:文章首先用多重双相关检验对上海证券市场的价格行为特征进行了实证检验,结果发现上海证券市场价格呈现出线性和非线性相关性共存的特征,进一步用窗口检验过程对这一行为特征结构进行识别,发现这种相关性特征结构又具有短暂的非稳定性。这种线性和非线性共存的短暂性价格行为特征真实地刻画了我国证券市场价格行为的特征结构。

  • 标签: 价格行为特征结构 线性相关 非线性相关 短暂性相关
  • 简介:近年来中国证劵市场的动荡,让人们更加关注金融时序数据中存在的影响点,因为影响点中往往隐藏着许多重要的信息,我们只有正确识别出存在的影响点,并深入分析其隐藏的信息,才更有利于我们做出正确合理的决策.

  • 标签: 影响点 GARCH模型 局部影响分析法 逐步影响分析法
  • 简介:在运用众数规则集成群组结论时,存在着两个缺陷:第一,忽视了集成是否有效的问题;第二,在存有多个众数时规则失效。基于此,在对众数集成结果的有效性指标的设计及指标的性质进行分析的同时,探讨如何利用辅助信息对众数规则进行补充的问题。

  • 标签: 分类评价 众数规则 集成
  • 简介:金融时间序列的长记忆性检验常采用标度分析法,但结果往往不令人满意。从分整特性的新视角,利用KPSS检验和LW检验对我国股市收益及其波动的记忆性特征进行了深入研究。研究结果表明,我国股市的波动序列中存在显著的长记忆性。而收益序列本身无明显的长记忆性。这与成熟股票市场有关长记忆性的研究结论基本一致.与新兴股票市场的研究结论有所不同。此项结论对股市的长期投资者具有重要的决策意义。

  • 标签: 长记忆性 分整 KPSS检验 LW检验
  • 简介:随着近年来汽车保有量的持续增加,道路交通安全形势显得尤为严峻,交通事故发生率居高不下、交通管制能力不足的现状,已经严重危害到人们的生命财产安全。如何通过对大数据的分析,有效地识别出事故多发路段,并通过对零伤亡愿景的解读提出道路改造措施,为相关政府提出政策建议,从而为降低交通事故发生率发挥积极作用。

  • 标签: 道路交通 事故多发路段识别 零伤亡愿景 改造措施政策建议