调整气象观察站问题评讲某地区内有 12个气象观察站(位置如图 ),有
10年各观察站的年降水量数据,为了节省开支,
想要适当减少气象站,
问题,减少哪些观察站可以使得到的降水量的 信息量 仍然足够大?
如何利用熵的概念解决此问题,给出解决问题的思路。
一,问题分析首先找出问题中的关键词,进行联想,
减少 站数删除原则保持 信息量各站关系降水数据足够大衡量指标衡量指标熵降水数据二,问题的分解初态,12个气象站的年降水数据。
(无日或月的降水数据,也无地理、气候等其它条件,)
目标态,减少气象站数,并保持降水量足够大的信息量,
过程,(将做的事情)
(1) 信息量的衡量(用熵);
(2) 给出删除气象站的条件及原则;
(3) 建立保持足够信息量的判别条件;
解决问题的惟一出发点
(1) 确定各气象站的年降水量:
的概率分布,并计算各个气象站降水量的熵值,
(2) 分析判断各站年降水量 (两两之间或多个变量间 )是否存在相关关系 (线性的或非线性的 ),并据此保留其中熵值较大的气象站,
随机变量另一种方法:用聚类分析法进行聚类,
三,解决问题的思路
(可由降水数据分析各个气象站的相似性,如同为干旱、湿润地区等,)
统计检验仍保留降水量的信息量较大的站。
1) 设定一个阈值,保留所有熵值大于阈值的气象站;
2) 使保留气象站的信息量总和占原信息量总和的一定比例,
可考虑各种判别条件,如,
(3) 建立保持足够信息量的判别条件注,阈值或比例值均需背景知识和经验来确定。