两个地震序列的相似性度量模型定义为

(1)X’和Y’分别是指定范围内X和Y的完整地震序列。且序列长度相同。
(2)W(x,y)是权重函数,定义为震级大比震级小的相似对实际产生意思的系数。
相似性匹配算法可以分为两个部分:一是粗相似匹配,即在查询地震源目录时找出地震条数差值在一定的阈值margin下的地震区域,简单的说,在一个时间段内,一个地区发生了一条地震项目,另一个地区发生了几万条地震项目,那么这两个地区有相似性的可能性就极小了。二是相似性匹配,在粗相似的基础上,查询的地震序列与地震数据仓库中的地震序列记录进行比较,找出具有较高相似度的地震序列。当具备较高的相似度时,必然会反映出两个地区的地震发生具有一定规律上的先后关系。对此我们给合了地震区域的相关知识,定义了地震的相似度定义和度量模型的基础上提出了一种基于给定阈值支持数的序列相似性匹配算法。下面给出算法的形式化描述。
输入:粗相似的差值margin;地震源目录M;经度范围latitude_r;纬度范围longitude_r。
输出:地震相似目录FreSubSeriesM;
算法:
Step1:DivideMwithdifferent(latitude_r&&longitude_r)
Step2:TransformMintoPrimaryM(EQS)
for(floati=70;i
for(floatj=0;j
{
blockk++;
}
Step3:for(floati=1;i
for(floatj=1;j
{
if((Numblock(i)-Numblock(j))
{
FindFreSubSeriesM;
}
}
Step4;Outputtheresult;//Num(EQS)将地震目录按空间划分区域的总数,在此为按地理位置分块后的总块数。
算法说明:
步骤:1:对中国地区按给定的经纬跨度latitude_r,longitude_r分块
2:统计中国地区的总块数
3:对地震源目录M按,进行处理,若两个块中对应的地震数目总数差值在margin值之间,定义为粗相似,对粗相似的目录进行时间相似度序列匹配处理FindFreSubSeriesM
4:对结果进行收集处理,用于后续处理
过程FindFreSubSeriesM算法如下:
for(inti=0;i
{
if((block(i.next)_year-block(i)_year)==(block(j.next)_year-block(j)_year))
{
countyear;
}
if((block(i)_degree-block(j)_degree)
{
countdegree;
}
}
if(((countyear/numblock(k))>=MthresholdYear)&&((countdegree/numblock(k))>=MthresholdDegree))
{
output(Ssub,SimilitudeYear,SimilitudeDegree)
}
过程算法说明:
从粗相似的两块记录中,依次对每块记录中的每条记录,进行统计。若对应的年份差值统计总数countyear大于MthresholdYear且对应的震级差值统计总数countdegree大于MthresholdDegree,认为是相似区域。
在此算法中对两个地震区域序列进行匹配时,需要逐条记录进行对比,本算法在设计对地震源目录进行出相似匹配,在利用粗相似匹配的结果进行相似性匹配,对非粗相似的区域不再进行处理,极大的提高了算法的效率。
2实验及讨论分析
2.1实验数据预处理
本文所采用的地震资料来源于安徽省滁州市地震局,包括1965年1月1日到2008年5月13日发生在中国境内的地震信息,地震目录共有记录349572条次地震。由于一定震级以上的地震做出预报才具有意义,所以本文选择3级以上的记录,共63165条记录。进行数据预处理的目的是为了使数据适应时间序列的相似性匹配算法,本文分别对空间窗口、时间窗口和震级进行预处理,如表1所示:
1)按照地震时间序列的空间窗口、震级标准(选取一定震级以上的地震)
2)由于地震目录数据的条数是相当的大,在存储过程中难免会出现数据不一致的现象,例如数据日期不符合现实生活中的日期,所以要将类似于这样的无效数据去掉,从而提高数据的质量,有利于数据挖掘的质量。
时间
|
日期
|
经度
|
纬度
|
震级
|
区域
|
19650126
|
023000
|
102.9
|
29.1
|
3
|
78
|
19650420
|
060000
|
102.65
|
29
|
3.4
|
78
|
19710324
|
215416
|
98.1
|
35.5
|
6.5
|
67
|
19710325
|
200850
|
79.42
|
41.42
|
3.3
|
21
|
19710523
|
040330
|
92.3
|
32.5
|
6.7
|
55
|
2.2实验结果分析
地震的时间序列相似性是指在一定时间空间范围内,两个地区发生的地震在时间,震级方面具有相似性。比如某区域A在1995,1997,1999,2003,2004…有一定震级以上的地震,而在区域B在1997,1999,2001,2005,2006…也发生了地震,则A和B两个区域在时间序列相似度上具有很大的相似性,本文针对这一特点,设计了3组实验,在进行粗相似的基础上分别从不同的时间差,时空差,粗细力度差等方面进行相似性序列分布分析。 2/3 首页 上一页 1 2 3 下一页 尾页 |