基于ML的金融投资智能决策系统

(整期优先)网络出版时间:2024-03-13
/ 2

基于ML的金融投资智能决策系统

作者:Muhammad Usman

摘要:该技术成果开发完成日期为20220115日,首次发表日期为20220118

背景技术:

目前在金融投资领域,主要由金融机构的工作人员作出投资决策。金融机构的工作人员进行投资决策有以下局限:

1、对信息的处理速度慢,无法迅速阅读并理解大量信息。

2、难免于情绪波动、心态变化,这些状况容易带来决策失误。

3、投资决策依赖于个人的经验、经济金融知识、数学知识,高质量的投资决策实质上成为少数人专有的特权。

计算机的信息处理速度远超人类,可于短时间内充分获取历史经验;计算机没有感情,不受情感和心理因素影响。利用人工智能,结合计算机的运算能力进行投资决策,是一项大有可为的技术。而人工智能中又以神经网络和机器学习为重要的技术方向。目前获得广泛应用的,比较接近于计算机投资决策的技术是“量化投资”(Quantitative investment)。量化投资的实质是由人类预先设置好数学模型,由计算机根据此数学模型进行决策。此技术由于决策模型仍是由人类制定,需要投资决策人具有深厚的数学背景,而且此模型是静态的,不会根据市场情况的变化而自动进化,只能由人去修改模型。

本技术利用神经网络和机器学习技术,实现了金融投资领域的人工智能化,投资人不需要具备任何的数学知识或经济金融知识,不需要任何投资经验,决策过程可以完全对投资人黑箱。而且人工智能随着市场状况的变化,不断自我学习、自我调整、自我进化以适应变化的市场。

技术实现方法

针对人类进行投资决策的各种局限性,本技术提供了基于ML的金融投资智能决策系统。

数据采集模块:用于持续采集A股市场的交易历史数据、企业经营数据,经济运行宏观指标,并把采集的信息储存至MySql数据库数据预处理和归一化模块;

归一化模块:用于对离群值偏离数据密集区太远的变量进行log变换,然后进行归一化;

神经网络模型搭建模块:用于搭建50个结构不同、参数各异的神经网络模型;

神经网络模型训练和筛选模块:用于训练神经网络模型,淘汰掉误差高的模型,留下误差低的模型;

各模型独立决策模块:用于令各个神经网络模型独立作出投资决策;

各模型投票模块:用于把投票权重应用于各个模型,然后让各个模型拿它们各自的投资决策来投票,得出最终的投资决策;

各模型决策质量评估模块:用于评估各个模型的投资决策质量,并据此修改它们的投票权权重;

各模型继续训练模块:用于以最新的数据继续训练各个模型,准备在下一投资周期中进行决策;

输出模块:用于输出投资决策。

技术实现步骤:

步骤1:持续采集金融市场的交易历史数据、经济运行数据、企业经营数据。

步骤2:对步骤1中获得的数据进行归一化处理。归一化处理前,先对离群值(Outlier)偏离数据密集区太远的变量进行区间变换,缩小其离群值与数据密集区之间的距离。

步骤3:在计算机上,用不同的模型结构和不同的参数,搭建多个基于神经网络(Neural Networks)的模型。

步骤4:利用步骤2中获得的数据,以机器学习(Machine Learning)的方法,在计算机上训练步骤3中创建的多个模型,摒弃误差高的模型,留下误差低的。

步骤5:步骤4中筛选出来的各个模型,分别独立地对当下和未来的金融产品走势进行预测并据此作出投资决策。

步骤6:步骤5中各个模型分别把自己的投资决策拿出来进行“投票”,综合各模型的投票结果,得出最终投资决策。

步骤7:在下一个投资周期,用步骤1、2中更新过的数据,对步骤4中筛选出来的各个模型进行补充训练。然后重复步骤5、6,如此循环不息。

所述方法步骤2中,对于从步骤1中获得的原始数据,若某些变量的离群值(outlier)偏离数据密集区很远,将对其后的数据应用产生不利影响,此时先对这些变量进行对数(log)或开n次方根变换,变换后可使数据分布较为均匀。

所述方法步骤2中的归一化,是把所有不同量纲、不同大小的变量通过区间变换,变换到[0,1](或[-1,1])的实数区间,以免绝对值小的变量被绝对值大的变量淹没而无法体现其特征。

所述方法步骤3中,利用卷积神经网络(Convolutional Neural Networks)、循环神经网络(Recurrent Neural Network)、长短期记忆网络(Long Short Term Memory Network)、前馈神经网络(feedforward neural network)通过不同的组合方式和网络参数,搭建成多个结构不同、参数各异的模型。所述方法步骤4中,模型的神经元(Neurons)数量若过少会导致欠拟合,过大又会导致过拟合。故本技术对神经网络的神经元数量进行自动调节。若某个模型欠拟合,自动增加神经元数量后重新训练;若某个模型过拟合,自动减少神经元数量后重新训练;直至拟合良好。

所述方法步骤4中,用不同时间跨度的数据训练不同的模型。短至数个月,长至数十年。在金融市场上,有时候丰富的历史经验是优势;但另一些时候,因为市场风格骤变,过多的历史经验可能反而导致误判。此时,只有短期经验的模型反而具有优势。

所述方法步骤6中,每个模型作出的决策并不一致,需由各模型进行投票,以投票结果为最终决策。各个模型的投票权权重也不一致,权重高的模型影响力更大。而各模型的权重由以下方法决定:每个模型每次的决策均被记录下来,与其后金融市场的真实走势相比照,以统计该模型的决策质量。

技术有益效果:

在金融投资领域可由计算机替代人类投资者进行数据阅读、数据分析和投资决策,可使金融知识匮乏的投资人亦可有效地进行投资决策;可克服人类投资者信息处理速度慢、会疲劳、情绪易波动等弱点,提高投资决策的质量,避免大量的决策失误;令计算机能通过不断的自我学习、自我进化,适应瞬息万变的市场,与时俱进地提供高质量的投资决策;令投资不再被少数专业人士垄断,缺乏投资经验、数学知识、经济金融知识的普通人也可作出高效的投资。