期刊网_中国期刊网

学科分类

经济管理
- 管理学
- 人力资源管理
- 政治经济学
- 世界经济
- 国民经济
- 会计学
- 企业管理
- 产业经济
- 市场营销
- 广告
- 旅游管理
- 国际贸易
- 财政学
- 金融学
- 保险
- 劳动经济
哲学宗教
- 哲学理论
- 马克思主义哲学
- 世界哲学
- 中国哲学
- 外国哲学
- 思维科学
- 逻辑学
- 伦理学
- 美学
- 宗教学
- 心理学
- 基础心理学
- 发展与教育心理学
- 应用心理学
生物学
- 普通生物学
- 细胞生物学
- 遗传学
- 生理学
- 生物化学
- 生物物理学
- 分子生物学
- 植物学
- 动物学
- 昆虫学
- 微生物学
- 生物工程
- 古生物学
- 人类学
- 生态学
- 水生生物学
- 神经生物学
天文地球
- 天文学
- 测绘科学与技术
- 地球物理学
- 大气科学及气象学
- 海洋科学
- 自然地理学
- 天体物理
- 天体测量
- 天体力学
- 大地测量学与测量工程
- 摄影测量与遥感
- 地图制图学与地理信息工程
- 固体地球物理学
- 地震学
- 水文科学
- 空间物理学
- 大气物理学与大气环境
- 地质学
- 矿物学
- 岩石学
- 矿床学
- 地质矿产勘探
- 工程地质学
- 地球化学
- 古生物学与地层学
- 构造地质学
- 第四纪地质学
- 物理海洋学
- 海洋化学
- 海洋生物学
- 海洋地质
化学工程
- 高温制品工业
- 无机化工
- 电化学工业
- 硅酸盐工业
- 有机化工
- 高聚物工业
- 化学肥料工业
- 农药化工
- 制药化工
- 煤化学工程
- 炸药化工
- 精细化工
- 玻璃工业
- 水泥工业
- 搪瓷工业
- 陶瓷工业
- 合成树脂塑料工业
- 橡胶工业
- 化纤工业
矿业工程
- 矿山地质测量
- 矿井建设
- 矿山机电
- 矿井通风与安全
- 矿山开采
- 煤矿开采
- 金属矿开采
- 非金属矿开采
- 选矿
石油与天然气工程
- 油气勘探
- 油气井工程
- 油气田开发工程
- 油气加工工程
- 油气储运工程
- 石油机械设备
冶金工程
- 冶金物理化学
- 粉末冶金
- 冶金机械及自动化
- 钢铁冶金
- 有色金属冶金
金属学及工艺
- 金属学
- 物理冶金
- 合金
- 热处理
- 金属表面处理
- 铸造
- 金属压力加工
- 焊接
- 金属切削加工及机床
- 刀具与模具
- 公差测量技术
- 钳工工艺
- 金属材料
机械工程
- 机械设计及理论
- 机械制造及自动化
- 仪器科学与技术
- 精密仪器及机械
- 测试计量技术及仪器
- 车辆工程
- 光学工程
动力工程及工程热物理
- 热能工程
- 工程热物理
- 动力机械及工程
- 生物能
- 流体机械及工程
电子电信
- 物理电子学
- 微电子学与固体电子学
- 电路与系统
- 信息与通信工程
- 通信与信息系统
- 信号与信息处理
电气工程
- 电工理论与新技术
- 电机
- 电力系统及自动化
- 高电压与绝缘技术
- 电力电子与电力传动
- 电器
自动化与计算机技术
- 控制科学与工程
- 控制理论与控制工程
- 检测技术与自动化装置
- 计算机科学与技术
- 计算机系统结构
- 计算机软件与理论
- 计算机应用技术
建筑科学
- 建筑理论
- 建筑设计及理论
- 建筑技术科学
- 土工工程
- 岩土工程
- 结构工程
- 城市规划与设计
- 市政工程
- 供热、供燃气、通风及空调工程
- 桥梁与隧道工程
水利工程
- 水文学及水资源
- 水力学及河流动力学
- 水工结构工程
- 水利水电工程
轻工技术与工程
- 纺织科学与工程
- 纺织工程
- 纺织材料与纺织品设计
- 纺织化学与染整工程
- 服装设计与工程
- 食品科学与工程
- 食品科学
- 粮食、油脂及植物蛋白工程
- 制糖工程
- 农产品加工及贮藏工程
- 水产品加工及贮藏工程
- 发酵工程
- 皮革化学与工程
- 制浆造纸工程
交通运输工程
- 道路与铁道工程
- 交通信息工程及控制
- 交通运输规划与管理
- 载运工具运用工程
- 船舶与海洋工程
- 船舶及航道工程
- 轮机工程
- 水声工程
- 港口、海岸及近海工程
航空宇航科学技术
- 飞行器设计
- 航空宇航推进理论与工程
- 航空宇航制造工程
- 人机与环境工程
环境科学与工程
- 环境科学
- 环境工程
- 灾害防治
- 安全科学
核科学技术
- 核能科学
- 核燃料循环与材料
- 核技术及应用
- 辐射防护及环境保护
医药卫生
- 公共卫生与预防医学
- 卫生毒理学
- 环境卫生学
- 劳动卫生
- 军事预防医学
- 营养与食品卫生学
- 妇幼卫生保健
- 流行病学
- 卫生事业管理
- 卫生统计学
- 中医学
- 中医基础理论
- 中医临床基础
- 中医诊断学
- 针灸推拿学
- 中医内科学
- 中医外科学
- 中医妇科学
- 中医儿科学
- 中医肿瘤科
- 中医骨伤科学
- 中医皮科
- 中医五官科学
- 中药学
- 方剂学
- 民族医学
- 中西医结合
- 基础医学
- 生物医学工程
- 人体解剖和组织胚胎学
- 人体生理学
- 病理学
- 病原生物学
- 医学寄生虫学
- 免疫学
- 医学遗传学
- 医学心理学
- 法医学
- 放射医学
- 航空、航天与航海医学
- 临床医学
- 诊断学
- 影像医学与核医学
- 治疗学
- 运动医学
- 护理学
- 康复医学
- 急诊医学
- 内科学
- 心血管疾病
- 血液循环系统疾病
- 呼吸系统
- 消化系统
- 内分泌
- 老年医学
- 外科学
- 麻醉学
- 整形外科
- 骨科学
- 泌尿科学
- 妇产科学
- 儿科
- 肿瘤
- 神经病学与精神病学
- 皮肤病学与性病学
- 耳鼻咽喉科
- 眼科
- 口腔医学
- 药学
- 药物化学
- 药物分析学
- 生药学
- 药剂学
- 药理学
- 药品
- 毒理学
- 微生物与生化药学
农业科学
- 农业基础科学
- 肥料学
- 土壤学
- 农业气象学
- 农业工程
- 农业机械化工程
- 农业电气化与自动化
- 农业水土工程
- 农艺学
- 作物栽培与耕作技术
- 作物遗传育种
- 农产品加工
- 植物保护
- 植物病理学
- 农业昆虫与害虫防治
- 农药学
- 作物学
- 茶叶生产加工
- 中草药栽培
- 烟草工业
- 园艺学
- 果树学
- 蔬菜学
- 观赏园艺
- 林学
- 林木遗传育种
- 森林经理学
- 森林保护学
- 森林工程
- 木材科学与技术
- 畜牧兽医
- 畜牧学
- 饲料科学
- 草业科学
- 兽医学
- 基础兽医学
- 预防兽医学
- 临床兽医学
- 野生动物驯养
- 特种经济动物饲养
- 水产科学
- 渔业资源
- 水产养殖
- 捕捞与储运
一般工业技术
- 工程设计测绘
- 材料科学与工程
- 工业设计
- 包装工程
- 制冷工程
- 真空技术
- 摄影技术
- 计量学
社会学
- 统计学
- 人口学
- 民族学
政治法律
- 政治学
- 国际共产主义运动
- 中共党史
- 国际政治
- 外交学
- 国际关系
- 中外政治制度
- 法学
- 法学理论
- 宪法学与行政法学
- 刑法学
- 民商法学
- 诉讼法学
- 经济法学
- 环境与资源保护法学
- 国际法学
- 军事法学
军事
- 军事理论
- 战略学
- 战役学
- 战术学
- 军队指挥学
- 军事通信学
- 军事情报学
- 军事装备学
- 军事工程
- 军事地形
文化科学
- 传播学
- 新闻学
- 图书馆学
- 档案学
- 情报学
- 教育学
- 教育技术学
- 教育学原理
- 课程与教学论
- 学前教育学
- 高等教育学
- 成人教育学
- 职业技术教育学
- 特殊教育学
- 体育学
- 运动人体科学
- 体育训练
- 民族体育
语言文字
- 语言学
- 汉语
- 少数民族语言
- 英语
- 法语
- 德语
- 西班牙语
- 俄语
- 日语
- 阿拉伯语
- 世界语
文学
- 文学理论
- 世界文学
- 中国文学
- 其他各国文学
艺术
- 艺术理论
- 美术
- 摄影艺术
- 艺术设计
- 音乐
- 舞蹈
- 戏剧戏曲
- 电影电视艺术
历史地理
- 历史学
- 中国史
- 世界史
- 考古学及博物馆学
- 民俗学
- 人文地理学
自然科学总论
- 系统科学
- 科学技术哲学
理学
- 数学
- 基础数学
- 计算数学
- 概率论与数理统计
- 应用数学
- 运筹学与控制论
- 力学
- 一般力学与力学基础
- 固体力学
- 流体力学
- 工程力学
- 物理
- 理论物理
- 声学
- 光学
- 电磁学
- 无线电物理
- 电子物理学
- 凝聚态物理
- 半导体物理
- 固体物理
- 低温物理
- 高压高温物理
- 等离子体物理
- 热学与物质分子运动论
- 原子与分子物理
- 粒子物理与原子核物理
- 应用物理
- 化学
- 无机化学
- 有机化学
- 高分子化学
- 物理化学
- 分析化学
- 晶体学
兵器科学与技术
- 兵器发射理论与技术
- 武器系统与运用工程
- 火炮、自动武器与弹药工程
- 军事化学与烟火技术

年份：

不限 2024 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 2012 更早

最新浏览↓

/ 25

共 500 个结果

数据挖掘经典算法研究

简介：数据挖掘是近年来计算机科学领域非常热门的研究方向之一,是由数据仓库技术和机器学习发展而来.数据挖掘是指从海量的数据中找出隐藏的关系,是数据分析的高级阶段.在对数据挖掘的算法研究中,涌现出了很多优秀的算法.本文选择了IEEE评选出的十大经典算法,对其中的每个算法的原理、背景、发展、优缺点、应用领域等做了深入浅出的介绍,为相关专业领域的学习及研究提供参考.
标签：数据挖掘大数据聚类分类预测关联规则

全文阅读

数据挖掘隐私保护算法研究

作者：张毅;周佩;许斌
学科：文化科学 > 教育学
创建时间：2017-10-20
出处：《数码世界》 2017年第10期

简介：目前,随着各领域的信息量暴涨,致使数据挖掘方面既存在机遇又存在挑战,并且这种爆破式的增长导致用户数据挖掘与储存的安全隐私产生了极大的隐患。因此,对数据挖掘隐私保护成为了当前亟待解决的问题。本文主要对数据挖掘隐私保护的算法进行研究,通过扰动算法以及关联规则隐藏算法两种算法进行对数据挖掘隐私保护算法进行研究,以期使问题得到解决。
标签：数据挖掘隐私保护算法研究关联规则隐藏算法

全文阅读

数据流频繁项挖掘算法——EC算法

作者：王威
学科：文化科学 > 职业技术教育学
创建时间：2009-01-11
出处：《武汉职业技术学院学报》 2009年第1期

简介：近几年，随着通信、网络等技术的飞速发展，在各个领域经常都会产生大量的信息数据。因此，如何使用有限存储空间进行快速准确地挖掘数据流近似的频繁项成为具有挑战的问题。本文介绍了一种新的挖掘算法——EC算法，使其空间复杂性为O（ε^-1），每个数据的平均处理时间为O（1）。
标签：数据流频繁项空间复杂性平均处理时间

全文阅读

关联规则下的数据挖掘算法分析

作者：陈阳
学科：文化科学 >
创建时间：2018-12-22
出处：《知识-力量》 2018年第12期
机构：（92493部队，辽宁省葫芦岛市125000）

简介：摘要当今信息化发展速度惊人，大数据、云计算、人工智能技术应用于各行各业，给社会的发展带来了很多便利，也为我国经济的快速发展注入了新的血液。因此，根据实际情况研发出科学而有效的数据挖掘算法，对于整个信息行业来说都有不可估量的意义，在进行大规模数据信息处理的时候，在关联规则下的数据挖掘算法就体现出了它本身重要的优势。因此，本文将对关联规则下的数据挖掘算法进行详细的分析，以供参考。
标签：数据挖掘算法关联规则分析

全文阅读

C4．5数据挖掘算法的改进

作者：谢秋华
学科：文化科学 > 高等教育学
创建时间：2013-02-12
出处：《三明学院学报》 2013年第2期

简介：介绍了一种一般情况下的C4．5数据挖掘算法的优化方法。原来的C4．5算法在计算属性信息增益率时需要大量用到对数运算，而优化后的C4．5算法计算属性信息增益率时只需用到加减乘除运算，在实现时不用频繁调用时数函数，优化后的算法不会改变属性信息增益率的排序，不改变生成的决策树。改进后的算法能做到在不改变准确率和不增加空间复杂度的情况下，减少时间复杂度，提高了决策树生成效率。
标签：数据挖掘算法优化

全文阅读

基于混合遗传算法的数据挖掘

简介：随着数据库应用的不断深化，数据库的规模急剧膨胀，人们需要对这些数据进行分析，从中发现有价值的信息。但是数据库管理系统本身却没有提供有效的工具和方法来利用这些数据，因此数据挖掘成为当今研究的热点。本文即以混合遗传算法为基础对数据挖掘中的算法问题进行系统研究。
标签：数据挖掘遗传算法模拟退火算法混合遗传算法

全文阅读

数据挖掘技术中“One—R”算法的改进

作者：孙荣林
学科：文化科学 > 职业技术教育学
创建时间：2003-02-12
出处：《青岛职业技术学院学报》 2003年第2期

简介：以我们在现实生活当中处理数据库的经验来看,为了从数据库中使用限制性的信息抽取方法得到有用的数据和信息,我们有必要使用"特点子集选择"的方法(FeatureSubsetSelection).而这种方法需要从多个相关的属性当中进行多次的试验从而找到某种特定的子集.在这种情况下,如何能够找到快速的、准确的同时又是简便的选择算法变得越来越关键.这篇文章对由Dr.RobertHoltes提出的"One-R"算法进行了适当的改进,通过"Chi"氏独立性检验和拜亚(BayesDecisionTheory)公式推导出的新方法,在试验的基础上表明,这种新的算法在某种程度上比原来的"One-R"算法要准确.
标签：数据挖掘技术 “One-R”算法独立性检验贝叶斯公式数据表

全文阅读

数据挖掘算法在电力云数据分析平台的应用

作者：张天辰
学科：建筑科学 > 建筑技术科学
创建时间：2019-12-05
出处：《科学与技术》 2019年第12期
机构：国网山西省电力公司汾西县供电公司山西省临汾市 031500

简介：摘要：电力系统与人们的生活、工业的生产息息相关 , 电力系统的稳定运行关系到了国家工业领域的正常生产 , 国民的正常生活 , 随着信息化、数字化时代的到来 , 电力系统中各种智能终端设备的投入 , 智能电网、智能能源系统的建设 , 使得电力系统涌现出了大量电力数据 , 这些大量电力数据的背后隐藏着许多电力系统运行的宝贵信息 , 如何挖掘出这些宝贵的信息成为了电力系统亟待解决的问题。数据挖掘是利用数学的方法挖掘出隐藏在信息背后的价值 , 完成从知识到价值的转变 , 因此使用数据挖掘的方法来分析电力数据。
标签：数据挖掘云计算算法云数据分析平台

全文阅读

数据挖掘算法在电力云数据分析平台的应用

作者：张天辰
学科：社会学
创建时间：2019-11-22
出处：《科学与技术（学术版）》 2019年第12期

简介：电力系统与人们的生活、工业的生产息息相关,电力系统的稳定运行关系到了国家工业领域的正常生产,国民的正常生活,随着信息化、数字化时代的到来,电力系统中各种智能终端设备的投入,智能电网、智能能源系统的建设,使得电力系统涌现出了大量电力数据,这些大量电力数据的背后隐藏着许多电力系统运行的宝贵信息,如何挖掘出这些宝贵的信息成为了电力系统亟待解决的问题。数据挖掘是利用数学的方法挖掘出隐藏在信息背后的价值,完成从知识到价值的转变,因此使用数据挖掘的方法来分析电力数据。
标签：数据挖掘云计算算法云数据分析平台

全文阅读

基于电力营销聚类分析的数据挖掘算法研究

作者：申世红
学科：
创建时间：2020-06-01
机构：国网山西省电力公司晋城供电公司山西省晋城市

简介：摘要：近年来，社会的发展迅速，我国的电力行业的发展也有了很大的改善。中国已进入经济新常态时代，电力公司需要回归企业经营的本质。中国电力企业联合会发布的《 2015年 1-6月份电力工业运行简况》中指出，今年上半年，全国全社会用电量同比增长 1.3%，创 35年来新低。公司售电量增幅下降，电费回收难度增大，当前公司面临的经营风险和压力加大。未来，电力公司需要更进一步回归企业经营的本质，电力营销在强化市场拓展、维系大客户关系、提升自身竞争力等方面的工作将成为当前及未来的重点任务之一。因此在互联网时代，客户对服务的质量、服务的便捷性、服务的效率、信息的透明、服务的精准等均提出了更高的要求。因此本文主要从营销大数据客户服务监控这个角度出发，针对客户的所需所求所关心的要点，通过大数据进行分析，从而为客户提供精准的需求，避免资源重叠浪费。
标签：电力营销聚类分析数据挖掘算法研究

全文阅读

数据挖掘中聚类算法的分析与实践

作者：史超
学科：电子电信 > 通信与信息系统
创建时间：2009-05-15
出处：《电脑与电信》 2009年第5期

简介：聚类分析是数据挖掘的一个重要的研究方向。本文在介绍了数据挖掘的基本概念之后，详细分析了常用的聚类算法。最后，使用weka数据挖掘软件对K—means算法进行了实践，实验结果证明了K—means算法的有效性。
标签： K-均值聚类有效性

全文阅读

用数据挖掘算法实现企业异常客户分析

作者：佚名
学科：自动化与计算机技术
创建时间：2019-09-09

简介：以基于其拟合直线中的斜率来识别异常客户的性质,　　[关键词]最小二乘法拟合直线斜率异常客户性质　　　　一、引言　　异常客户是在一段考察时期内与客户的一般行为模式不一致的对象,它反映了用直线y=ax+b来描述(xi
标签：企业异常实现企业客户分析

全文阅读

基于电力营销聚类分析的数据挖掘算法研究

作者：申世红
学科：经济管理 > 产业经济
创建时间：2020-06-02
出处：《中国电业》 2020年第04期
机构：国网山西省电力公司晋城供电公司山西省晋城市

简介：摘要：近年来，社会的发展迅速，我国的电力行业的发展也有了很大的改善。中国已进入经济新常态时代，电力公司需要回归企业经营的本质。中国电力企业联合会发布的《 2015年 1-6月份电力工业运行简况》中指出，今年上半年，全国全社会用电量同比增长 1.3%，创 35年来新低。公司售电量增幅下降，电费回收难度增大，当前公司面临的经营风险和压力加大。未来，电力公司需要更进一步回归企业经营的本质，电力营销在强化市场拓展、维系大客户关系、提升自身竞争力等方面的工作将成为当前及未来的重点任务之一。因此在互联网时代，客户对服务的质量、服务的便捷性、服务的效率、信息的透明、服务的精准等均提出了更高的要求。因此本文主要从营销大数据客户服务监控这个角度出发，针对客户的所需所求所关心的要点，通过大数据进行分析，从而为客户提供精准的需求，避免资源重叠浪费。
标签：电力营销聚类分析数据挖掘算法研究

全文阅读

基于网格的并行数据挖掘算法的实现

作者：郑晶
学科：文化科学 > 高等教育学
创建时间：2010-01-11
出处：《福建工程学院学报》 2010年第1期

简介：随着信息技术的发展，大量的数据不断被收集和存储，对数据的挖掘规模越来越大，传统的数据挖掘已经无法解决海量数据挖掘问题。网格技术的发展，使得广域分布的海量数据的挖掘问题得到解决。文章根据现实中海量数据挖掘的需求和网格的本质，把并行关联规则挖掘算法应用于网格数据挖掘中，并建立了一个并行数据挖掘模型，验证了并行数据挖掘系统在网格环境的可行性与合理性。
标签：网格数据挖掘并行算法

全文阅读

基于数据挖掘算法的弧圈球技术研究

作者：罗红
学科：文化科学 > 职业技术教育学
创建时间：2018-03-13
出处：《阜阳职业技术学院学报》 2018年第3期

简介：弧圈球在乒乓球技术中是比较关键的技术之一,正确使用弧圈球技术能够让运动员在比赛过程中获得最佳战绩,能够充分地发挥出弧圈球的威力.在分析弧圈球技术层面以及战术方面特点的基础上,综合数据挖掘技术基本理论分析了关联规则的数学模型和算法流程;最后对某省乒乓球运动员的弧圈球技术使用情况进行了数据挖掘,剖析了使用不同弧圈球技术后的得分和失分情况,从而为教练员在训练和比赛中提出决策提供了理论依据.
标签：弧圈球乒乓球数据挖掘关联规则

全文阅读

基于Hadoop的电梯安全大数据挖掘算法研究

作者：常姗
学科：文化科学 > 教育学
创建时间：2018-08-18
出处：《渭南师范学院学报：综合版》 2018年第8期

简介：为了实现电梯安全事故的预警预报,研究了电梯安全大数据的挖掘方法.以电梯安全远程监管系统数据库中的电梯状态数据、基础数据、日常维保数据、故障数据以及违章数据作为数据源构建电梯安全大数据平台,包括数据采集模块、预处理模块、数据挖掘模块和数据展示模块.着重研究了改进的K-Means聚类算法和Apriori关联算法.实验表明：两种改进算法的加速比与可扩展性更好.利用聚类算法分析了各小区、不同品牌电梯的电梯故障情况以及各维保公司的故障修复率,利用关联算法分析了各小区及不同品牌电梯的特定频发故障,对电梯安全管理具有指导意义.
标签：电梯安全数据挖掘 HADOOP平台 K-MEANS算法 APRIORI算法

全文阅读

数据挖掘决策树算法的改进与实现

作者：夏琰，周晓红，王东
学科：自动化与计算机技术 > 计算机软件与理论
创建时间：2010-04-14
出处：《计算机光盘软件与应用》 2010年第4期
机构：夏琰，周晓红，王东（长春职业技术学院，长春130033）

简介：本文作者从实际应用出发，对现存数据挖掘决策树分类方法进行了研究，并应用到系统当中，实现了决策支持模块。关键词数掘挖掘；决策树算法；改进；实现中图分类号TP301.6文献标识码A文章编号1007-9599(2010)04-0000-02DataMiningDecisionTreeImprovement&ImplementationXiaYan,ZhouXiaohong,WangDong（ChangchunTechnologyCollege,Changchun130033,China）AbstractTheauthorstudiedonexistingDataMiningdecisiontreeclassificationmethodbasedonthepracticalapplication,andappliedtothesystem,achievedadecisionsupportmodule.KeywordsDataMining;Decisiontreealgorithm;Improve;Achieve随着数据库技术的不断发展及数据库管理系统的广泛应用，数据库中存储的数据量急剧增大，在大量的数据背后隐藏着许多重要的信息，如果能把这些信息从数据库中抽取出来，将会产生重要的作用。因此，数据挖掘涉及的学科领域逐渐扩大，数据挖掘的方法也在不断地改进和提高。分类在数据挖掘中是一项非常重要的任务，分类算法可以分为决策树分类算法、遗传算法、神经网络方法、K-最近邻分类算法等。这里，以疾病防控与儿童免疫管理系统中决策支持子系统的开发过程为例，对决策树分类算法的改进及在实际中的应用进行阐述。一、数据选取和数据预处理在本系统中，以预防接种中遇到异常反应后记录的“异常反应调查表”中的数据为例进行说明。具体实现过程详细说明首先输入训练集，由于在真实的SQLServer数据库当中，为了降低存储要求和减少存储时间，并非真正存储每个数据项的属性值，而是用存储数字来对应相应的意义，如在数据库的数据表中，“性别”字段中“1”代表“男”、“2”代表“女”，反应到程序页面时再映射回原来的值，为了说理清晰又限于篇幅，这里只将所有数据集中有代表性的十几组数据作为分类模型创建的输入训练集。表1判断是否需要计划外加强免疫的属性表儿童编号月龄出生状态常住地上次注射后反应是否需要计划外加强免疫0405102<=2正常产城市无不良反应否0405495<=2正常产农村无不良反应否0401342>5正常产城市无不良反应是04054352…5正常产城市轻度反应是04065342…5非正常产城市重度反应是04072342…5非正常产农村重度反应否0401544>5非正常产农村重度反应是0408519<=2正常产城市轻度反应否0404566<=2非正常产城市重度反应是04035472…5非正常产城市轻度反应是0401534<=2非正常产农村轻度反应是0405856>5正常产农村轻度反应是0409533>5非正常产城市无不良反应是04053442…5正常产农村轻度反应否二、生成决策树对训练集的每一个属性，计算其信息增益。以“月龄”属性为例，每个结点中的正反例的个数分别为［2，3］、3，2、4，0，分别计算如下info2，3==0.971；info3，2==0.971；info4，0=0；计算信息熵E(月龄)＝＝0.693；计算该属性的信息增益量，选取信息增益最大的属性为节点，按该属性的值划分数据集合Gain(月龄)=Info(9，5)-E(月龄)=0.940-0.693=0.247；同理，对“注射反应”属性、“出生状态”属性、“常住地”属性都可计算每个结点的正反例的个数（由于篇幅有限，不作计算）。通过对各属性信息增益的计算结果，选择“月龄”属性作为根节点，然后划分“月龄<=2”的所有可能性。计算当“月龄<=2”时，“注射反应”、“出生状态”、“常住地”的信息增益值Gain(注射反应)=Info(2，3)-E(注射反应)=0.971-0.4=0.571；Gain(出生状态)=Info(2，3)-E(出生状态)=0.971-0=0.971；Gain(常住地)=Info(2，3)-E(常住地)=0.972-0.951=0.020；同理考虑“月龄>5”的情况，由于“月龄>5”时，各个节点都是纯节点，所以不再划分。三、产生决策规则遍历决策树，输出叶结点类属性值，用IF—THEN形式表达为IF(月龄2…5AND注射反应=无)THEN(类别＝是)IF(月龄2…5AND注射反应=轻)THEN(类别＝是)IF(月龄2…5AND注射反应=重AND出生状态＝正常产)THEN(类别＝是)IF(月龄2…5AND注射反应=重AND出生状态＝非正常产AND常住地=城市)THEN(类别＝否)IF(月龄2…5AND注射反应=重AND出生状态＝非正常产AND常住地=农村)THEN(类别＝是)……依此类推，共可产生十三条规则。四、决策支持子系统的分析用上述基于决策树的分类算法所得到的模型生成的规则来预测测试集中的未知数据属于哪一类，并通过该模型的测试结果与实际情况相吻合的准确率来判断该决策树是否有效。首先，用整个数据集中2/3的数据作为训练集按照基于决策树的分类算法来建立模型，生成一棵决策树。然后，用余下的1/3的数据作为测试集，通过创建的模型进行预测，并将预测结果和实际值进行比较。如果准确率达到或超过事先确定的阈值，则可以认定该模型对于数据分类是有效的，能够在实际中应用；反之，则认定该模型的分类效果不好，需要按以上步骤来重新判断，直到分类准确率达到预定的阈值为止。在本系统中，经过测试预测准确率已达到87%，在可以接受的范围内，所以算法是有效、可行的。参考文献1陈文伟,黄金才.数据仓库与数据挖掘.人民邮电出版社,20042王万森.人工智能原理及应用.电子工业出版社,20003范明,孟小峰.数据挖掘——概念与技术.机械工业出版社,2001作者简介夏琰（1980-），女，吉林长春人。长春职业技术学院信息技术分院，教师，讲师，硕士，研究方向为计算机应用。
标签：

全文阅读

数据挖掘中关联规则算法的研究与应用

作者：孙慧强
学科：文化科学 > 教育学
创建时间：2016-08-18
出处：《数码世界》 2016年第8期

简介：随着“互联网＋”技术的不断发展,人们在大数据时代所产生的数据量也呈现出急速发展的趋势,面对如此复杂的、海量的数据,如何进行有用信息和数据的提取成为重要的问题,数据挖掘便成为关键,而关联规则则是数据挖掘中的重要组成部分,主要用于对数据集中项等之间联系的发现,对于从大数据中通过关联规则来进行挖掘已是最成熟且最活跃的研究方向之一。
标签：数据挖掘关联规则算法研究

全文阅读

基于机器学习的数据挖掘和预测算法

作者：麻天郎宁史腾飞李威张奔
学科：
创建时间：2023-10-18
机构：北方自动控制技术研究所山西太原 030006

简介：摘要：信息技术的快速发展使我们进入了大数据时代，而知识、技术、人才和资金等的时空交换加速，使得城市生产与居民活动范围持续扩大，类型更加复杂，并促进了产业重构和空间重组，进而改变着区域和城市的空间格局。在此背景下，大数据在城市规划实践和研究中也得到越来越多的应用。
标签：云计算IaaS 大数据技术机器学习