数学建模数据缺失怎么处理

2024-05-18 22:22

1. 数学建模数据缺失怎么处理

数学建模数据缺失的处理也就是缺失值的处理,有以下的方法:
缺失太多,直接删除指标。
例如调查人口信息,发现“年龄”这一项缺失了40%,就直接把该项指标删除。后面做题时也压根不用管这一个变量。
因为当一个变量缺失的数据太多时,即使想办法补上,也可能与实际情况相差甚远,那么这些数据也就没什么价值了。
那么,到底缺多少算“多”呢?这并没有一个硬性的规定,显然要是缺了30%,40%那肯定是多了。而如果调查14亿人的数据中缺少了几千甚至几万,都不算多。所以要具体问题具体分析。
适用赛题:缺失数据“过多”的变量。
用均值、众数补上。
所谓均值就是平均数,众数就是出现次数最多的值。
定量数据,例如关于一群人的身高、年龄等数据,那么用整体的均值放到缺失数据的位置;
定性数据,例如关于一群人的性别、文化程度、某些事件调查的满意度,用出现次数最多的值也就是众数补缺失。
适用赛题:人口的数量年龄、经济产业情况等数据量大、且对个体精度要求不大的数据。
Newton插值法。
简单来说,牛顿插值法就是根据固定公式,构造近似函数,用近似函数的值来补上缺失值。
缺点:区间边缘处的不稳定震荡,即龙格现象。形象的来说就是插值次数高的时候,区间内函数看起来挺正常,但在区间边缘处却变得忽上忽下。

由于龙格现象,牛顿插值法不适合对导数有要求的题目。

数学建模数据缺失怎么处理