1. 서 론
지진 조기 경보는 신속한 정보 제공을 목적으로 발전하고 있으며, 이를 통해 사람들은 대비할 시간을 최대한 확보할 수 있다. 우리나라는 기상청에서 2015년에 대국민 지진 조기 경보 서비스를 처음으로 시행하였으며, 초기에는 지진 관측 후 발표까지 약 50초 이내에 통보하는 것이 목표였다. 이후 2016년 9월 12일 경주지진(규모 5.8) 당시 발표 시간을 26~27초로 단축하였으며, 2017년 포항지진(규모 5.4) 당시에는 19초로 더 줄였다. 2021년 8월부터는 규모 5.0 이상의 지진에 대해서는 관측 후 5~10초 사이에 지진 조기 경보를 발표하고 있다[1]. 이러한 발전은 경보 소요 시간을 줄여 피해를 최소화하고 대응 시간을 확보하는 데 크게 기여하고 있다. 현재 기술 수준에서는 광역 지진 조기 경보(Regional EEW) 발령을 위해 최소 3개 이상의 지진 관측자료가 필요하며[2,3], 이를 분석하는 시간 동안 오경보를 피하기 위한 추가 기준을 충족해야 한다. 그 결과, 진앙 근처에서는 지진 조기 경보 공백역(Blind Zone)이 발생한다. 광역 지진 조기 경보의 공백역(Blind Zone)을 줄이기 위한 대안으로 현장 지진 조기 경보(On site, local EEW) 가 있다. 현장 지진 조기 경보는 광역 지진 조기 경보에 비해 오경보와 누락 경보의 가능성이 크다는 단점이 있다. 하지만 단일 관측소에서 초기 P파를 관측한 후 이를 기반으로 수초 내에 지진의 규모와 관측지점의 진도 등을 추정하여 경보를 발령하기 때문에, 광역 지진 조기 경보에 비해 경보 발령 시간이 빠르고 공백역(Blind Zone)이 좁다는 장점이 있다.
현장 지진 조기경보는 신속하고 정확한 정보를 제공하기 위해 다양한 연구를 통해 계속해서 발전하고 있다. Kanamori[4]는 P파의 수직 성분에 대한 초기 주기와 최대 변위를 조합하여 일정 크기 이상의 피해를 유발할 수 있는 지진을 식별하는 새로운 방법을 제안하였다. Wu and Kanamori[5]는 초기 P파의 평균 주기를 기반으로 지진의 규모를 결정하고, 초기 P파의 최대 변위(Pd)값으로부터 PGV(Peak Ground Velocity)를 추정하는 기술로, 타이완과 캘리포니아 등에서 사용하고 있다. Zollo et al.[6]은 일본, 타이완, 이탈리아의 지진 파형을 분석하여 Pd값과 기타 파라미터를 결합하여 경보를 발령하는 방법을 제안하였다. Böse et al.[7]는 가속도, 속도 및 변위 파형을 사용하여 지진 규모, 진앙 거리 및 PGV를 추정하였다. 또한, 이호준 등[8,9] 은 국내에서 발생한 지진 파형 자료를 이용하여 적합한 P파 탐지 시간창 (P-wave Time Window, PTW)을 결정하고, 단일 관측소에서 관측한 초기 P파로부터 PGV 값을 예측하기 위한 경험적 예측식을 제시하였다.
현장 지진 조기경보를 위한 연구가 진행되고 있지만, 여전히 오경보와 누락 경보의 가능성이 존재하므로, 정확한 P파 탐지, 지진 식별, 그리고 지진 규모 예측의 정확성 향상이 필요한 상황이다. 이 연구에서는 지진 진도 예측의 정확성을 향상하기 위해 경주 지역의 지진 자료를 특성 자료로 변환하여 활용 가능한 P파 파라미터를 개발하고 이를 통해 한반도 동남권 지역의 최대지 반가속도를 예측하였다.
2. 연구 방법 및 절차
이 연구에서는 임인섭 등[10]이 제시한 QSCD20(Quick Seismic Characteristic Data from 20sps data) 규약에 따라 초당 20 샘플 원시 자료에서 최대값을 계산하여 추출하는 방법을 적용하였다. 이는 인위적인 진동 잡음을 제거하고 지진에 의한 가속도만을 추출하기 위한 것으로[11], 추출된 최대값을 포락선 파형으로 변환하였다. 변환 과정에서는 원시 자료의 평균값과 선형 성분을 제거한 후, 최대값과 최소값 중 절대값이 가장 큰 값을 추출하여 물리적 단위(g)로 변환하였다. 포락선 파형을 지진동 예측 연구에 활용할 가능성을 평가하기 위해, Fig. 1과 같이 동일한 지역에서 발생한 규모가 다른 지진을 포락선 파형으로 변환하여 비교 분석하였다. 포락선 파형의 비교 분석을 위해 지진 이벤트 시간을 동기화하였다. Fig. 1은 3개의 다른 진앙 거리에서 규모별 지진 포락선 파형을 비교하고 P파 탐지 후 3초 이내의 포락선 파형(작은 사각형)을 규모별로 비교하였다. 규모에 따라 지진 포락선 파형에 차이가 나타나며, P파 탐지 후 3초 이내의 포락선 파형에도 차이가 관찰되었다. 또한, 진앙 거리와 관측소에 따라 포락선 파형의 형태가 달라지며, 진원과 부지 특성으로 인해 진앙에서 거리가 멀어져도 지반가속도(Ground Acceleration, GA)가 점진적으로 감소하는 경향이 나타나지 않았다. P파 탐지 후 3초 이내의 포락선 파형에서도 이러한 특성이 확인되었다. 전체적으로 포락선 파형은 규모, 진앙 거리, 진원, 관측 조건에 따라 다르게 나타나고 있다. 이는 Odaka et al.[12]이 규모, 깊이, 진앙 거리에 따라 각기 다른 진원 및 관측 조건에서 고유한 포락선 파형을 가질 수 있다고 설명한 내용과 일치 한다.
이 연구에서는 포락선 파형의 초기 P파 정보(3초 이내)를 활용하여 최대 지반가속도를 예측하였다. 포락선 파형의 지반가속도뿐만 아니라 자동차, 로봇, 의료, 건축 및 토목공학 등 다양한 분야에서 활용 중인 Jerk를 고려하였다. Jerk는 가속도가 변하는 정도를 나타내는 물리량이다. Mostafa et al.[13]은 지진파가 구조 요소에 미치는 영향을 조사할 때, 힘의 변화율이 중요한 요소이므로 Jerk의 활용을 제안하였다. Fig. 2는 P파 탐지 후 3초 이내의 지반가 속도와 Jerk의 관계를 보여준다. 0초에서 1초 사이에는 지반가속도가 증가함에 따라 Jerk도 증가한다. 1초에서 2초 사이에는 지반가속도가 일정하거나 약간 감소할 때 Jerk은 확실하게 감소하고 있다. 또한, 2초에서 3초 사이에 지반가속도가 감소할 때, Jerk도 함께 감소한다. 이처럼 Jerk는 지반 진동 시 가속도의 시간에 따른 변화를 잘 반영하며, 관측소 배경 잡음 수준을 배제하고 정확한 가속도의 물리적 값을 계산할 수 있는 장점이 있다[14,15].
이 연구에서는 현장 지진 조기 경보에 Jerk을 적용하기 위해 Fig. 3에 제시된 방법을 사용하여 계산을 수행하였다. Jerk은 포락선 파형에서 지진 탐지 후 1초, 2초, 3초의 지반가속도(GA) 값의 기울기를 각도로 계산하였으며, 이를 Pθ(단위: 라디안)로 표기하였다.
포락선 파형에서 개발된 P파 파라미터를 활용하여, 규모와 진앙 거리의 정보 없이 최대지반가속도(Peak Ground Acceleration, PGA) 예측 가능성을 평가하였다. 이를 위해 GA와 Pθ, 그리고 최대지반가속도 간의 상관관계를 분석하고, 세 변수의 특성을 기반으로 유의미한 경향과 통찰을 도출하였다.
본 연구는 Fig. 4 Procedure에 도시된 절차에 따라 수행하였다. 인위적인 배경 잡음을 제거하고 지진에 의한 가속도만을 추출하기 위해 20 샘플 가속도 자료를 사용하였다. 원시 자료를 특성 자료로 변환한 후, P파 탐지를 수행하였다. 탐지 후 3초 이내의 GA와 Pθ을 계산하였으며, 이 값들과 최대지 반가속도 간의 상관성을 분석하여 최대지반가속도 예측 가능성을 평가하였다. 또한, 머신러닝을 활용하여 최대지반가속도 예측 모델을 개발하고, 이를 다른 지역 지진에 적용하여 관측소별 최대지반가속도를 예측하였다. 최종적으로, 예측 결과를 다른 연구 결과 및 관측 최대지반가속도와 비교하여 모델의 가용성을 평가하였다.
3. 연구자료 선정
이 연구는 3초 이내의 초기 P파 정보(PTW: 3초 이내)가 규모와 거리에 따라 포락선 파형에 차이가 있음을 확인하기 위해, 동일 지역에서 발생한 규모가 다른 지진들을 선정하였다. 이를 위해 2016년 경주에서 발생한 ML 3 이상의 지진 3건을 선정하였다. Table 1은 연구에 사용된 지진에 대한 정보를 제공하고, Fig. 5는 지진의 규모별 진앙 위치를 나타내었다. ML3.3과 ML5.8과의 진앙 거리는 약 1 km이고 ML3.3과 ML4.5의 진앙 거리는 약 2 km로, 각 지진의 진앙이 매우 가까운 위치에 있다.
4. 상관성 분석
GA와 Pθ의 특징과 관측된 최대지반가속도 간의 상관성을 분석하기 위해 Fig. 6와 같이 산점도와 국소 회귀분석(loess)을 통해 추정된 회귀곡선 분석을 수행하였다. 모든 P파 탐지 시간과 규모에서, 진앙 거리에 따라 GA 와 Pθ의 산점도는 조밀하게 분포하여 강한 상관관계를 나타낸다. 또한, 회귀 곡선은 PTW 3초를 제외하고 규모, 거리, P파 탐지 시간에 따라 두 변수 모두 유사한 경향을 보인다. PTW 3초의 경우, 규모에 따라 진앙 거리 9 km 에서 25 km 구간까지 차이를 보이나, 이후에는 유사한 경향을 나타낸다. 이는 진앙으로부터 9 km 떨어진 관측소에서 P파 탐지 시간 3초 시점부터 S 파 간섭이 시작되어 회귀 곡선에 영향을 미쳤다. 또한, 두 파라미터와 관측된 최대지반가속도 간의 상관성은 P파 탐지 시간 3초를 제외하고 유사한 경향을 보인다.
5. 최대지반가속도 예측
5.1 모델 설계 및 자료 전처리
이 연구에서 머신러닝 모델 개발에 사용된 학습 자료 수는 446개이다. 최대지반가속도 예측을 위해 31개의 독립변수(Feature)와 1개의 종속변수(Target)로 구성된 학습 자료를 사용하여 머신러닝 모델을 구축하였다. 독립변수는 진앙 거리, 성분별 지반가속도(1초, 2초, 3초), 성분별 Pθ(1초, 2초, 3초)로 구성되었으며, 종속변수는 최대지반가속도이다. 머신러닝 모델 검증을 위해 전체 자료를 학습 자료와 테스트 자료로 나누었으며, 학습 자료는 전체 자료의 80%로 설정하고 테스트 자료는 전체 자료의 20%로 설정하였다.
5.2 머신러닝 모델 학습 및 적용
최대지반가속도 예측에 가장 적합한 모델을 개발하기 위해 두 가지 머신러닝 알고리즘을 사용하였다.
-
1) Random Forest : 여러 결정 트리를 앙상블하여 예측 성능을 향상시키는 강력한 머신러닝 알고리즘으로, 과적합을 방지하고 자료 노이즈에 강하며 다양한 문제에 널리 적용 가능한 기법
-
2) AdaBoost: 여러 약한 학습기를 결합해 높은 성능의 강한 학습기를 만드는 알고리즘으로, 학습기의 오류를 줄이고, 오분류된 샘플에 더 많은 주의를 기울여 성능을 향상시키며, 다양한 머신러닝 문제에서 효과적인 결과 제공하는 기법
머신러닝 모델의 성능을 평가하기 위해 회귀분석에서 일반적으로 사용되는 MAE(평균 절대 오차), MSE(평균 제곱 오차), RMSE(평균 제곱근 오차), R²(결정 계수)를 성능지표로 사용하였다. 모델의 복잡성, 자료 품질, 지진 특성의 복잡성, 측정 오류 등 여러 요인으로 인해 개발된 모델 성능평가 (Table 2)가 높지 않았다.
5.3 연구 결과
경주 지역의 규모별 지진 자료를 두 가지 알고리즘에 적용해 최대지반가속도를 예측하는 머신러닝 모델을 개발하였다. 이 모델을 이용해 한반도 동남권 지역에서 발생한 지진(Table 3)의 인근 지역에 대한 최대지반가속도를 예측하였다.
Fig. 7과 Fig. 8은 경주와 포항 지역에서 발생한 지진들의 관측 최대지반 가속도를 Jo and Baag(2001) 예측식과 개발된 두 가지 모델의 예측 최대지 반가속도와 각각 비교하였다[16]. 경주 지역 지진(ML3.3, ML4.5, ML5.1) 의 경우, 개발된 모델들의 예측 최대지반가속도는 관측 최대지반가속도와 다소 차이는 있지만, 전체적으로 유사한 경향을 보인다. Jo and Baag 예측 식에 의한 최대지반가속도는 ML3.3과 ML4.5에서 두 모델보다 높은 값을 나타내고 ML5.1에서는 비슷한 경향을 보인다. 이는 Jo and Baag의 예측식이 100 샘플 지진 자료를 기반으로 개발되었기 때문에 근거리 작은 규모 지진파의 에너지가 상대적으로 많이 고려된 것으로 생각된다. 포항 지역 지진 (ML 3.5, ML 4.6, ML 5.4)의 경우, 개발된 모델들의 예측 최대지반가속도는 관측 최대지반가속도와 약간의 차이는 있지만 전체적으로 유사한 경향을 보인다. Jo and Baag의 예측식에 따른 최대지반가속도는 진앙으로부터 거리가 멀어질수록 감소하는 반면, 개발된 두 모델과 관측된 최대지반가속도는 일정 구간까지 감소하지 않고 값을 유지하고 있다.
Fig. 9는 경주 및 포항 지역의 지진에 대해 각각 개발된 모델들이 예측한 최대지반가속도와 각 관측소에서 관측된 최대지반가속도의 분포를 비교한 결과이다. Fig. 9(a)는 경주 지역에서 발생한 ML 3.3, ML 4.0, ML 5.1 지진에 대해 개발된 모델들이 예측한 최대지반가속도가 대부분 ±2 시그마 내에 분포하고 표준편차가 0.29로 높은 정확도를 나타내고 있다. 이 중 Random Forest 모델은 관측된 최대 지반가속도 라인(Ideal line) 기준으로 0.0001 g 에서 0.1 g까지 고르게 분포하는 반면, AdaBoost 모델은 0.0005 g에서 0.1 g까지 고르게 분포하지만 0.0001 g에서 0.0005 g까지 과대 예측하는 경향을 보인다. Fig. 9(b)는 포항 지역에서 발생한 ML 3.5, ML 4.6, ML 5.4 지진에 대해 개발된 모델들이 예측한 최대 지반가속도가 대부분 ±2 시그마 내에 분포하고 표준편차가 0.30로 높은 정확도를 나타내고 있다. 하지만 두 모델은 관측된 최대지반가속도 라인(Ideal line)을 기준으로 전 구간에 고르게 분포하지 않고 수직으로 분포하는 경향을 보인다. 이는 개발된 모델이 경주 지역 지진 자료로 훈련되었기 때문에 다른 지역 지진에 대한 예측 정확도가 낮음을 의미한다. 또한, 포항 지역의 최대지반가속도 분포 구간이 경주 지역에 비해 짧게 나타나, 거리가 가까운 지역임에도 불구하고 두 지역이 지진의 다른 특성을 보여 주고 있다.
6. 결 론
이 연구에서는 현장 지진 조기경보의 오경보와 누락 경보를 줄이기 위해, 특성 자료를 활용하여 최대지반가속도 예측을 수행하였다. 이를 위해 2016년 경주 지진(ML 3.3, ML 4.5, ML 5.8)의 가속도 자료를 특성 자료로 변환 하고, GA와 Pθ을 계산하여 최대지반가속도와의 거리별 특성과 상관성을 분석하였다. 또한, 두 파라미터를 이용해 경주 지역의 최대지반가속도를 예측 하는 머신러닝 모델을 개발하고, 이를 바탕으로 경주 지역과 포항 지역의 지진에 대한 최대지반가속도를 예측하였다. 두 모델에 의해 예측된 최대지반 가속도는 관측소에서 관측된 최대지반가속도 및 Jo and Baag 예측식의 최대지반가속도와 비교하였으며, 그 결과는 아래와 같이 요약하였다.
-
(1) 특성 자료 파형 비교
-
(2) 상관성 분석
-
1) P파 탐지 시간과 규모에 따라 진앙 거리에 따른 GA와 Pθ의 산점도는 조밀하게 분포하며 강한 상관관계를 나타낸다.
-
2) 회귀 곡선은 P파 탐지 시간 3초를 제외하고, 규모와 거리, P파 탐지 시간에 따라 GA와 Pθ는 유사한 경향을 보인다.
-
3) PTW 3초의 경우, 규모별로 진앙 거리 9 km부터 25 km 구간까지 차이를 보였으나 그 이후에는 다른 P파 탐지 시간과 유사한 경향을 나타냈다. 이는 진앙으로부터 9 km 떨어진 관측소에서 P파 탐지 시간 3초 시점부터 S파 간섭이 시작되어 회귀 곡선에 영향을 미쳤다.
-
4) GA와 Pθ,관측된 최대지반가속도의 회귀 곡선은 유사한 경향을 보여 준다.
-
-
(3) 최대지반가속도 예측
-
1) 경주 지역과 포항 지역 지진의 경우, 개발된 모델들이 예측한 최대지 반가속도는 관측된 최대지반가속도와 다소 차이가 있지만 전체적으로 유사한 경향을 보인다. 이들 모델이 예측한 최대지반가속도는 대부분 ±2 시그마 내에 분포하며, 각각의 표준편차는 0.29와 0.30으로 나타나 높은 정확도를 확인할 수 있었다.
-
2) 포항 지역 지진의 경우, 경주지진에 대한 Jo and Baag의 예측식에 따른 최대지반가속도는 진앙으로부터 거리가 멀어질수록 감소하는 반면, 개발된 두 모델과 관측된 최대지반가속도는 일정 구간까지 감소하지 않고 값을 유지하고 있다.
-
3) Fig. 9(b)의 포항 지역 지진의 경우, 두 모델은 관측된 최대지반가속도 라인(Ideal line)을 기준으로 전 구간에 고르게 분포하지 않고 수직으로 분포하는 경향을 보인다. 이는 개발된 모델이 경주 지역 지진 자료로 훈련되었기 때문에 다른 지역 지진에 대한 예측 정확도가 낮음을 의미한다.
-
이 연구에서는 특성 자료를 기반으로 관측소 인근의 최대지반가속도 예측 가능성을 평가하고, 현장 지진 조기경보의 가용성을 확인하였다. 특히, GA와 Pθ를 이용한 예측 결과, 경주 지역은 지진 예측 표준편차 0.29, 포항 지역은 0.30으로 높은 정확도를 보였다. 그러나 특정 지진 발생 지역을 대상으로 개발된 모델을 다른 지역에 적용했을 때, 예측 정확도가 떨어지는 한계가 드러났다. 따라서 지역별로 관측소 인근의 지진 자료를 보충하여 최대지 반가속도 예측 모델을 개선하면 더 신뢰할 수 있는 결과를 도출할 수 있을 것으로 판단된다.