基于数据挖掘对黄河水沙的监测与治理

(整期优先)网络出版时间:2023-11-08
/ 2

基于数据挖掘对黄河水沙的监测与治理

范温珺1, 贾佳2, 付光泽3  指导教师:刘焱4

   1.山东协和学院 商学院,山东 济南250109

2.山东协和学院 商学院,山东 济南250109

 3.山东协和学院 医学院,山东 济南250109

4.山东协和学院 基础部,山东 济南 250109

摘要本文利用黄河某水文站相关数据,分析了与影响含沙量有关的因素,监测了水沙通量随时间变动的变化情况,预测调水调沙对河底高程的实际影响,有地解决了黄河水沙的监测与治理问题

 关键词:岭回归 mann-kendall检验[1] 时间序列分析 ARIMA模型FFT分析

一、问题重述

(1)问题一需利用附件1中的有关数据,判断出近6年黄河水含沙量与时间、水位、水流量之间存在的关系并选择合适模型拟合函数,最后估算该水文站近6年的年总水流量以及年总排沙量。

(2)问题二需对附件1、2中的数据进行处理,针对题目已知不同特性建立相应模型以观察水沙通量的变化规律。

(3)问题三需根据水沙通量的变化规律,预测其随时间节点变动的影响,从而更加精准的对其做出监测,制定最优的采样监测方案,实现效率的最大化与成本的最小化。

二、问题分析

问题一,观察附件1中的数据,得出规律,将相关数据进行汇总求和,判断其关系。

问题二,利用Excel软件,求出每天水的径流量与输沙量,对水与沙的单位统一再计算,得出每日水的径流量与输沙量。利用mann-kendall检验观察每年的

水沙通量的突变性,再利用spsspro中的图像法观察其季节性下水沙通量的变化规律。最后利用FFT 分析对其周期性下的水沙通量。

问题三,第一问对经过数据预处理后的附件1进行分析,将已知年份数据以

月和以天分别整合,判断自2016年起所经过的72个月与2192天区间下的水沙

论文来源:2023年高教社杯全国大学生数学建模竞赛

通量的数值变化;第二问根据所求出的两年水沙通量的变化趋势,对前365天与后365天按年划分、按月求和,计算出预测的24个月的数据,对其行系统聚类分析。结合丰水期,枯水期和平水期的水沙通量的特点,求出不同时间阶段下所包含的月份。最后利用“多水多监测、少水少监测”的要求设定各个时期对应的检测次数和时间。

三、模型的建立与求解

3.1问题一模型的建立与求解

3.1.1问题一模型的建立、求解与分析

3.1.1.1问题一第一小问模型的建立与求解

1时间与含沙量数据的处理与分析

利用Excel软件分析时间与含沙量之间的关系,虽时间跨度选择不同,但结合每天、每月、每季的含沙数量观察出了黄河流域含沙量在7月整体偏高。

2水位与含沙量数据的处理与分析

利用spsspro软件对选择时间节点下的水位和含沙量进行散点图分析,得出水位与含沙量符合正态分布且呈线性关系。结果如下:

IMG_271

(1)

Q表示的是含沙量,w表示的是水位。2016表示年份。

2017-2021年的模型求解步骤同理2016年。结合spsspro软件检验可知,模型建立良好。

3水流量与含沙量数据的处理与分析

对附件一中的数据进行处理,利用spsspro软件探求水流量与含沙量之间的关系,抛去外界因素,6年间的水流量与含沙量基本满足线性关系,结果如下:

IMG_283

(7)

2017-2021年的模型求解步骤同理2016年。

4含沙量与时间、水位、水流量数据的处理与分析

利用pearson相关性分析对指标间的关联度进行相关性检验,因线性回归时共线性明显,岭回归能解决共线性问题,所以本文利用岭回归得出6年内月份(时间)、水位、水流量与含沙量之间的关系如下:

IMG_290

(13)

2017-2021年的模型做法同理2016年。

Q表示含沙量,右下标表示年份,m表示月份(时间),w表示水位,e表示水流量。

3.1.1.2问题一第小问模型的建立与求解

1水流量数据的处理与分析

用Excel软件对附件1中所有时间节点的水流量进行处理,计算日均流量(附件1中所有时间节点水流量之和/所有时间节点的个数),建立模型并得出近6年总水流量为2314.2亿立方米的结果。

2排沙量数据的处理与分析

根据“每日8:00这一时间节点的含沙量*该时刻的水流量”求出该时刻的瞬时排沙量,“表示六年里以每日8:00这一时间节点排沙量之和/六年总天数”求出日均排沙量,最后利用“日均排沙量*年总秒数”求出年总排沙量。得出近六年年排沙总量累计约12.17亿吨的结果。

3.2问题二模型的建立与求解

3.2.1.问题二的水沙通量的计算

对附件1中的数据进行处理,建立模型:

IMG_300

(23)

IMG_301

(24)

K表示输沙量,Q表示含沙量,J表示日均径流量,r表示日均水流量。

利用上述公式求出每天的径流量与含沙量(已统一量纲),将其相加即可求得所需的水沙通量。

3.2.2问题二中分析水沙通量的突变性

1mann-kendall检验:

本文利用Excel将水沙通量按照年份进行求和汇总,再利用mann-kendall检验(下述简称M-K检验),观察图像交叉点得出2018年与2019年为突变点的结果。

2)有序聚类分析法[2]

本文利用聚类分析法求出的变异年份同M-K检验下的结果—2018年与2019年。

3.2.3问题二中分析水沙通量的季节性

因季节性特征明显,本文对数据进行整合处理,利用spsspro软件对近6年水沙通量的数据进行图像法观察、分析,得出了每年年际变化特征及2021年比2016年总的水沙通量变化了331.1×108kg的结果。

3.2.4问题二中分析水沙通量的周期性

针对同一断面,为分析其近6年水沙通量的周期性对其产生的影响,本文采用自2016年起,2192天(2016-2019年)的水沙通量的数据进行观测,利用MATLAB软件中的FFT 分析法,分析2192天的水沙通量,发现其天数(近似以5天为一周期)与水沙通量呈现周期性的结果。

3.3问题三模型的建立与求解

本文利用Spsspro中的季节性ARIMA模型与时间序列分析ARIMA两种方法对该水文站未来两年水沙通量的变化趋势进行预测,方法如下:

方法一:以月为单位建立的预测模型

1季节性ARIMA模型利用季节性ARIMA模型算法,以月为单位,得到的拟合优度为R2=0.548。

2时间序列分析ARIMA

以月为单位,通过时间序列分析预测,得到的拟合优度R2=0.452,比使用季节性ARIMA模型做出的结果更差,因此在此条件下,选择季节性ARIMA模型预测出的数值相对更为精准。

方法二:以天为单位建立的预测模型

因季节性ARIMA模型的适用条件有限,本文选择用时间序列分析ARIMA。得到的模型的拟合优度R²为0.974,模型表现优秀,模型基本满足要求。因此以日为单位的水沙通量可以更好的预测未来两年水沙通量的变化趋势。

参考文献

[1]王玉新. 嫩江流域径流演变规律及其归因分析[D].吉林大学,2012.

[2]陈远中,陆宝宏,张育德,等.改进的有序聚类分析法提取时间序列转折点[J].水文, 2011, 31(1):4.DOI:10.3969/j.issn.1000-0852.2011.01.009.