国赛必备:常用预测类数据分析方法汇总(附历届国赛真题和优秀论文) - 知乎

admin 游戏 2024-04-25 64 0

国赛必备:常用预测类数据分析方法汇总(附历届国赛真题和优秀论文) - 知乎

  数学建模比赛会用到大量数学模型,翻阅历届国赛美赛考题来看,常考模型可以分为四类:评价类、预测类、优化类以及机理分析类。

  这里我们汇总了预测类数据常用模型,详细介绍每个模型的适用范围对并演示操作过程。

  时间序列数据预测是指通过对过去一段时间内的数据进行分析和建模,来预测未来一段时间内的数据走势。时间序列数据是按时间顺序排列的数据集合,例如每天、每月、每年等时间间隔下的数据。

  ARIMA模型适用于时间序列数据具有一定稳定性和平稳性的情况。

  输入:特征序列为1个时间序列数据定量变量

  输出:未来N天的预测值

  操作演示:季节性ARIMA模型帮助文档

  灰色预测模型适用于小样本数据预测和非线性、非平稳数据预测场景。

  输入:1个时间序列定量变量

  输出:灰色预测的拟合预测结果

  操作演示:灰色预测模型GM帮助文档

  季节性预测适用于具有明显季节性(周期性)变化的时间序列数据。

  输入:1个时间序列数据定量变量

  输出:未来N天的预测值

  操作演示:季节性ARIMA模型帮助文档

  VAR模型用于对多个相关变量之间的动态关系进行建模和预测,要求变量之间存在稳定的关系。

  输入:两个或两个以上的定量变量。

  输出:变量之间的关系模型,以及脉冲响应分析、方差分解结果。

  操作演示:VAR向量自回归帮助文档

  回归分析是一种统计方法,用于建立自变量和因变量之间的关系,并通过该关系对未来的因变量进行预测。

  线性回归适用于预测和解释连续型变量之间的关系。

  输入:自变量 X 至少一项或以上的定量变量或二分类定类变量,因变量 Y 要求为定量变量(若为定类变量,请使用逻辑回归)。

  输出:模型检验优度的结果,自变量对因变量的线性关系等等

  操作演示:线性回归帮助文档

  Probit 回归解决二分类问题其中因变量通常用0和1表示不同的类别。

  输入:自变量 X 为1个或1个以上的定类或定量变量,因变量 Y 为一个定类变量。

  输出:模型输出的分析结果及模型的预测效果。

  操作演示:Probit帮助文档

  Deming's 回归用于处理因变量和自变量均存在测量误差的情况,适用于希望在两个变量之间找到最佳拟合线的场景。

  输入:因变量Y、自变量X各为一个定量变量。

  输出:Deming's回归的方程以及部分检验结果。

  操作演示:Deming's 回归帮助文档

  PLSR主要用于处理多变量之间的高度相关性,尤其在自变量较多时。

  输入:一组预测变量和一组响应变量。

  输出:偏最小二乘回归结果,包括自变量累计投影重要性、成分矩阵表和模型系数结果等。

  操作演示:偏最小二乘回归(PLSR)帮助文档

  有序逻辑回归用于处理有序分类数据的预测问题,即因变量有多个有序类别的情况。

  输入:自变量X可以为定量数据,也可以是定类数据,如果定类数据纳入模型,需要先将其设为哑变量, 因变量Y为有序定类变量。

  输出:有序逻辑回归系数估计以及分类预测的效果评价。

  操作演示:有序逻辑回归帮助文档机器学习预测

  机器学习预测是指利用机器学习算法对未知数据进行预测和推断的过程。它是机器学习的一个重要应用领域,旨在通过从历史数据中学习模式和规律,构建一个能够准确预测未来数据的模型。

  决策树适用于解决分类和回归问题,适用于数据具有离散特征的情况。

  输入:自变量 X 为 1 个或 1 个以上的定类或定量变量,因变量 Y 为一个定量变量。

  输出:模型输出的决策树结构图及模型的预测效果。

  操作演示:决策树回归帮助文档

  随机森林适用于解决分类和回归问题,处理离散型和连续型特征的数据。

  输入:自变量 X 为 1 个或 1 个以上的定类或定量变量,因变量 Y 为一个定量变量。

  输出:模型输出的结果值及模型预测效果。

  操作演示:随机森林回归帮助文档

  K邻近寻找与输入样本最相似的K个样本进行分类或回归预测。

  输入:自变量 X 为 1 个或 1 个以上的定类或定量变量,因变量 Y 为一个定量变量。

  输出:模型输出的结果值及模型预测效果。

  操作演示:K近邻(KNN)回归帮助文档

  支持向量机回归将数据映射到高维数据特征空间中进行分类或回归

  输入:自变量 X 为 1 个或 1 个以上的定类或定量变量,因变量 Y 为一个定量变量。

  输出:模型输出的结果值及模型预测效果。

  操作演示:支持向量机(SVR)回归帮助文档

  BP神经网络主要适用于处理连续型特征的数据,学习复杂的非线性关系。

  输入:自变量 X 为 1 个或 1 个以上的定类或定量变量,因变量 Y 为一个定量变量。

  输出:模型输出的结果值及模型预测效果。

  操作演示:bp神经网络回归帮助文档

  今天的分享就到这里啦,如果还想了解学习更多数据模型,点击SPSSPRO帮助文档。在操作过程中遇到问题,欢迎进入SPSSPRO社区提问,那里会有数据分析师为大家答疑。

  第一,打开SPSSPRO官网

  第二,进入社区

  第三,在动态中下载

  2022数模国赛C题:古代玻璃制品的成分分析与鉴别

  完整解题教程,对应代码及资料可到SPSSPRO社区免费获取跟着欢欢玩转数模:真题解析|2023数模国赛C题:古代玻璃制品的成分分析与鉴别

  相关推荐SPSSPRO:2022年国赛题型及算法模型预测(近五年国赛一等奖算法模型汇总)SPSSPRO-免费专业的在线数据分析平台

评论