学科分类
/ 25
500 个结果
  • 简介:搜索在计算机上是多种操作的基本运算,其主要目的是从大量数据当中找出所想要的部分,而一般数据的存放,常设有键值(Key)以利搜索,例如在数据库中,要取得数据一定要配合许多键值的使用,方能有效而快速地存取。

  • 标签: 搜索方法 聚类技术 计算机 数据库 键值 存取
  • 简介:传统的Markov链模型是一种简单而有效的预测模型,该模型存在着预测准确率低,存储复杂度高等缺点。改进的基于的Markov链预测模型,利用用户访问特征和人们浏览网页与时间高度相关的思想来改善模型,建立了基于用户访问特征和时间段的Markov预测模型并进行了模拟实验和结果分析。

  • 标签: 聚类 预测模型
  • 简介:以白桦240个家系的胸径、树高、材积和纤维素含量数据为依据,采用马氏距离计算家系间距离、10%的取样比例和优先取样法,研究了最短距离法、最长距离法、中间距离法、重心法、平均法、加权配对算术平均法、可变法和离差平方和法建构的核心种质与原种质的遗传参数、性状相关性及分布格局。结果表明,最短距离法构建白桦初级核心种质均值差异百分率、极差符合率、方差差异百分率和极差符合率分别为0、100%、75%和143%,4个性状相关性显著、相关系数均超过0.5,保持了原种质资源的空间分布格局,是构建白桦核心种质最佳方法。

  • 标签: 白桦 原种质 核心种质 聚类方法
  • 简介:随着低资费套餐的快速普及,LTE高负荷问题日渐突出,高负荷小区整治成为网络运维的重要任务。本文提出LTE高负荷小区优化方法,将问题小区至5大13小,并对各类问题提出针对性的优化处理建议,形成系统的高负荷小区整治方法。

  • 标签: LTE 高负荷 聚类 优化
  • 简介:文档在Web文本挖掘中占有重要地位.是聚类分析在文本处理领域的应用。文章介绍了基于向量空间模型的文本表示方法,分析并优化了向量空间模型中特征词条权重的评价函数,使基于距离的相似性度量更为准确。重点分析了Web文档中普遍使用的基于划分的k-means算法.对于k-means算法随机选取初始中心的缺陷.详细介绍了采用基于最大最小距离法的原则,结合抽样技术思想,来稳定初始中心的选取,改善结果。

  • 标签: 文档聚类 K-MEANS算法 向量空间模型 权重评价函数 最大最小距离
  • 简介:摘要:“拍照赚钱”是互联网下的一种自助式服务模式,这种基于移动互联网的自助式劳务众包平台,为企业提供了各种商业检查和信息搜集,相比传统的市场调查方式能大大节约成本,并有效地保证了调查数据真实性,缩短了调查周期,于是APP任务定价的合理性变的很重要,定价与任务不合理的完成任务就少或信息不准确,影响市场调查结果。本文通过对项目任务定价规律的研究,利用Matlab绘制了任务经纬度坐标与定价数据三维拟合图并对城市内会员分布进行聚类分析,得到任务定价规律。

  • 标签: 聚类算法 任务定价
  • 简介:关系数据的算法对于传播研究意义重大,首先运用迭代系统隐喻个体结构的变化,用输出与状态的包含距离表示关系的非对称同时也确定拥有最高结构等级序列的节点来代表簇;再将Hausdorff距离引入DBSCAN算法,使得同结构节点进行合并的加和算子和层次上卷的并算子变得可压缩。运用复杂网络研究人员的数据对算法的有效性进行了评估,分层后的人员合作网具有不同的网络结构特征;关键词在层次2网络中的传播效率高;互惠关系在知识传播中的作用最大。新的发现证明算法通过引入Hutchinson算子的可压缩测度Hausdorff距离使得网络结构对传播效果的影响得以体现,该算法的设计思路是正确的。

  • 标签: 关系的非对称性 HAUSDORFF距离 并算子 凝聚层次聚类
  • 简介:摘要:智能电网是集数字信息技术、通信技术、计算机技术和电力设施为一体的现代化电网,智能电网可以提高能源效率、电源的安全性和可靠性。为满足越来越多的数据共享开放的要求,以及日渐增加的内外部数据灵活查询分析需要,需从数据服务模式全领域思考,规范数据服务的不同形式,通过统一的数据服务平台,推动基于全业务领域数据资产的数据服务能力,实现数据的可见、可用、可管的目标,从而促进数据价值全面释放,支撑“数字南网”建设,真正实现企业数据为企业运营赋能。

  • 标签: 大数据 电力服务 系统应用
  • 简介:摘要:以当前航迹数据应用现状及未来对平均航迹的需求作为研究背景,通过对雷达数据的航迹特征分析,采用FastDTW算法以及平均距离度量方法对航迹距离进行计算,建立航迹相似性度量模型,并运用改进的经典层次算法对航迹进行,最后提出平均航迹构造算法,完成平均航迹的构造。

  • 标签: 航迹数据 FastDTW算法 层次聚类 平均航迹
  • 简介:摘要:为了克服Chameleon算法无法有效的处理混合属性数据的缺点,本文提出一种改进的Chameleon算法。该算法首先采用一种新的两阶段整合算法,适用于处理大规模数据集;其次对聚类分析中计算相似性的欧式距离进行拓广,使新算法能够处理混合属性数据。通过实例验证该算法可以很好的解决含有混合属性的大规模数据集问题。

  • 标签: Chameleon 大规模数据集 混合属性数据
  • 简介:摘要:随着我国基础建设的持续推进,隧道工程的重心逐渐由建设转为运维,客观且高效地诊断衬砌健康状态是隧道安全运维的关键。本研究提出了一种基于算法的隧道衬砌健康诊断方法。首先以固定长度的衬砌为单位,通过裂缝的最大宽度、总长度构建病害空间样本;利用K-means++实现样本的客观与分级;通过偏最小二乘法量化样本的相对欧氏距离,提出了客观的隧道风险指标TRI。结果表明该方法能有效诊断隧道运营状态,有助于隧道健康的智能分析和客观诊断,对既有隧道的安全维护具有重要的参考价值。

  • 标签: 隧道衬砌健康评估 K-means++ 聚类 病害诊断
  • 简介:摘要:在双减政策背景下,小学语文课堂需要以减负增效为导向,创新设计单元主题框架下的跨学科分层作业任务。在小学语文学科的教学活动中,单元主题与作业任务息息相关,语文教师会在设置分层标准、分层教学目标的基础上,协助学生从跨学科的综合实践活动中汲取语用经验,才能回归到语文学科的课堂教学模式层面上。本文将着重探究以减负增效为目标的小学语文单元跨学科作业分层设计策略。

  • 标签: 小学语文 减负增效 跨学科 作业 分层设计
  • 简介:摘要:在双减政策背景下,小学语文课堂需要以减负增效为导向,创新设计单元主题框架下的跨学科分层作业任务。在小学语文学科的教学活动中,单元主题与作业任务息息相关,语文教师会在设置分层标准、分层教学目标的基础上,协助学生从跨学科的综合实践活动中汲取语用经验,才能回归到语文学科的课堂教学模式层面上。本文将着重探究以减负增效为目标的小学语文单元跨学科作业分层设计策略。

  • 标签: 小学语文 减负增效 跨学科 作业 分层设计
  • 简介:目的:探讨常用健脾中成药组方规律。方法:收录《新编国家中成药》中的健脾中成药处方,采用关联规则Apriori算法和复杂系统熵等方法,确定处方中药物的使用频次及药物之间的关联规则等。结果:高频次药物包括茯苓、白术、甘草、党参、陈皮等;高频次药物组合包括"白术、茯苓""甘草、茯苓""甘草、白术"等;置信度较高的关联规则包括"陈皮-〉白扁豆""陈皮-〉半夏"等。结论:处方用药中除常见的健脾中药外,尚包括具有健脾作用的部分理气药、消食药及其他类药物。

  • 标签: 健脾药 关联规则 熵聚类
  • 简介:针对相机运动引起的图像序列运动的问题,提出了一种基于的相位相关块匹配运动估计算法。利用Harris算子分别在相邻帧图像上检测角点,以参考图像角点为中心选取一个矩形块,将块匹配法与相位相关相结合来计算图像间的运动矢量。最后,对获得的多个块的平移量,进行空间从而选取运动估计比较准确的点。实验结果表明:该算法配准精度能达到亚像素,稳定性较好。

  • 标签: 图像配准 特征点 相位相关 聚类
  • 简介:摘要准确把握区域耕地数量、质量现状以及未来变化,对实现耕地保护由数量平衡与管理向数量-质量综合平衡与管理具有重要意义。本文通过对2013年海伦市各乡镇关于耕地质量的数据进行研究,分析海伦市各乡镇耕地质量的差异性。

  • 标签: 耕地质量 聚类分析 分等定级
  • 简介:实验以这148位说话人语音训练的SI模型作为基线系统,GMM)是基于模型距离说话人常用的模型,基于说话人的说话人自适应是说话人自适应技术的一种[2]

  • 标签: 聚说话 说话聚 说话自适应
  • 简介:摘要在移动“互联网+”的时代,为了更加方便快捷的进行信息搜集和商业检查,一种自助式劳务众包平台服务模式“拍照赚钱”应运而生。

  • 标签:
  • 简介:聚类分析是数据挖掘的一个重要的研究方向。本文在介绍了数据挖掘的基本概念之后,详细分析了常用的算法。最后,使用weka数据挖掘软件对K—means算法进行了实践,实验结果证明了K—means算法的有效性。

  • 标签: K-均值 聚类 有效性