1. 서 론
1.1 지진조기경보의 속도와 정확도
역사지진 연구를 통해 우리나라에서도 규모6.0의 지진 발생 가능성이 제기되었으며[1], 국가 발전에 따른 대도시의 확장, 고도화된 산업과 교통 인프라 등 지진에 취약한 요소가 증가되는 상황에서 2016년 경주 9.12지 진, 2017년 포항지진 이후 지진위험에 대한 우려가 더욱 높아지고 있다.
지진에 대응하기 위한 방향은 지진의 발생을 예측하는 것과 지진 발생 후 빠르게 대응하는 것으로 구분할 수 있다.
지진 예측은 장기와 단기로 나눌 수 있으며, 장기 예측은 수십 년 이상의 예측으로 지진 발생 주기성을 기초로 과거 지진 발생 데이터와 관련된 지구 물리학적 데이터를 기반으로 확률을 예측하여[2], 건물의 내진설계기준과 지진재해대책 수립에 활용된다. 단기 예측은 수 주에서 수 년 이내의 예측으 로 다양한 지진 전조현상에 대한 연구가 진행 중이지만, 충분한 인과관계 입 증 부족 등으로 현재로서는 실용화에 어려움이 있다[3].
지진의 단기 예측이 어려움에 따라 여러 국가에서 사용되는 방법이 지진 발생 후 빠른 대응과 대피를 통해 인명과 재산의 손실을 최소화하는 지진조 기경보이다[4]. 지진조기경보는 실제 피해를 유발하는 S파가 도달하기 전 에 상대적으로 빠른 전파속도의 P파를 탐지하여 지진의 발생을 경보하는 것이다.
성공적인 지진조기경보(Earthquake Early Warning, EEW)를 위해서 는 경보의 속도와 정확도가 핵심이다[5]. 경보의 속도가 빨라지면 진앙에 더 가까운 곳에서 피해를 유발하는 진동의 도달 전에 경보를 받을 수 있게 되고, 대응을 위한 시간적 여유도 증가한다. 경보의 정확도가 높은 경우에 는 적절한 대응에 유리하고, 오경보 위험의 감소에 따른 자동화된 대응체계 구축이 가능해진다 . 반면 정확도가 충분하지 않은 경우에는 미경보가 발생 하거나, 오경보로 인해 사회적 혼란과 손실이 발생하고, 반복될 경우 점차 국민들로부터 경보에 대한 신뢰를 잃을 수 있다.
경보의 속도는 관측, 수집, 분석, 전파, 대응의 각 단계마다 지연요소가 존재한다. 관측 단계에서는 지진 발생 후 P파가 분석을 위해 필요한 수의 관측소에 모두 도달하기 위한 시간이 필요하고, 이는 발생 위치 및 관측망 의 밀도 등과 관련 있다. 수집 단계에서는 기록계에서 수집서버로의 관측 자료 패킷 전송주기 및 네트워크 전송속도 등에 관련한 전송지연이 존재한 다. 분석 단계에서는 수집된 관측자료에서 P파를 탐지하고, 지진의 발생 위치, 시각, 규모, 예상진도 등의 추정, 경보 결정을 위한 알고리즘 연산시 간이 소요된다. 또한, 특정 관측소의 배경잡음의 수준이 높은 경우에는 탐 지(picking) 알고리즘이 상대적으로 더 큰 에너지가 도달한 시점에 P파를 결정할 수 있으므로, 이에 따른 지연이 존재할 수 있다[6]. 전파 단계에서는 경보 메시지의 구성과 전송, 각 매체별 특성 및 경로에 따른 경보 전파 소요 시간이 존재한다. 최종적으로 대응 단계의 속도는 홍보/교육/훈련을 통한 인원의 지진대응요령 숙달과 자동화된 대응의 적용 여부에 연관된다.
경보의 정확도는 오경보(false alarm) 발생과 예측값의 정확도가 중요 한 요소이다. 오경보는 낙뢰, 발파 등 주변 잡음, 전기 잡음 등에서 발생되는 오탐지 및 원거리 지진, 이벤트 스플릿(split), 여진(aftershock) 등으로 정 확한 위상의 결정이 어려워짐에 따라 발생된다[7-9]. 예측값의 정확도는 위 치, 규모, 진도 등 알고리즘 추정 결과의 정확도이며, 이에 관련하여 과잉경 보 또는 미경보가 발생할 수 있다.
경보의 속도와 정확도는 트레이드 오프(trade-off) 관계로서 일반적으 로 속도를 높이기 위해 경보 시점을 앞당기면 정확도가 낮아지며, 오경보 발 생이 증가하게 된다[5, 10]. 오경보 위험은 분석결과에서 경보를 결정하는 기준 설정에 중요한 고려사항이며, 만약 새로운 방법으로 오경보를 발생시 키는 오탐지를 식별하고 차단할 수 있다면 경보 시점을 앞당길 수 있다.
Fig. 1과 같이 현재 국내에 지진조기경보를 제공하는 네트워크 기반의 지진조기경보 시스템(Network Based Earthquake Early Warning System) 은 전국에 분포한 지진관측망을 기반으로 지진이 발생한 뒤 가장 가까운 3~4개의 관측소에 P파가 도달하게 되면, 이를 탐지(picking)하고, 연관 (association) 알고리즘을 통해 동일한 지진의 것을 식별하고, 위치추정 (location) 알고리즘으로 위치를 추정한 뒤, 규모(magnitude)를 추정한다 [11]. 하지만, 이러한 분석의 초기버전은 오경보의 불확실성이 높기 때문에 정확도를 높이기 위해 새로운 탐지가 추가될 때마다 분석을 반복하여, 8개 의 관측소에 P파가 도달한 시점에 결정 단계(Early Decision Module, EDM)에서 위치, 규모, 발생시간 등의 분석 결과의 경보 기준 충족과 함께 오경보를 피하기 위해 진앙 근접 관측소의 가속도 관측값 크기 등의 추가 조 건을 충족할 경우 전 국민을 대상으로 경보하게 된다[12].
네트워크 기반의 지진조기경보의 속도를 높이기 위해서는 관측망의 밀 도를 높이거나 오경보를 제거할 수 있는 새로운 방법을 개발하여, 보다 적은 수의 P파 탐지를 이용한 분석 결과에 대해 오경보 위험을 충분히 줄일 수 있 어야 한다.
지진조기경보가 발령되는 시점에 이미 S파가 도달하여 사전에 경보할 수 없는 진앙에 가까운 영역을 경보공백역(blind zone)이라고 하는데, Fig. 2와 같이 진앙에서 가까울수록 더 큰 에너지가 도달하고, 그에 따라 피해가 증가하기 때문에 보다 신속한 조기경보를 통해 경보공백역을 줄이게 되면 더 큰 피해의 감소를 기대할 수 있다[13].
네트워크 기반의 지진조기경보에서 내륙지진의 경우 8개의 관측소에 P 파가 도달하여 경보가 발령되는 시점은 대략 최초 관측 후 7초 내외이며, 이 는 지진 발생 기준 10초 내외가 된다. 그 시점에 S파는 진앙으로부터 대략 35 km까지 도달하게 되어, 반경 35 km가 경보공백역이 된다.
Fig. 3과 같이 온사이트 지진조기경보(Onsite Earthquake Early Warning System)는 경보 수요자의 위치에 설치된 1~2개의 지진계에서 측정된 지진 관측자료에서 P파를 탐지하고, 탐지된 P파의 진폭 정보로부터 P파보다 느 린 속도로 도달하여 피해를 발생시키는 S파의 최대 진동 크기에 대한 예측 값을 산출하여 S파가 도달하기 전에 현장(관측 지점)을 대상으로 신속하게 경보한다[14]. 이는 필요한 관측의 수를 진앙에 가까운 1~2개로 감소하고, 지진 기록계와 경보장치를 통합하는 등 수집 단계의 전송지연을 최소화하 고, 현장에 대한 직접 연계 및 경보 전파로 경보의 속도를 높임으로써 경보 공백역을 20 km 이하로 축소할 수 있다.
하지만, 앞서 언급된 경보의 속도와 정확도의 트레이드 오프(trade-off) 관 계와 같이 온사이트 지진조기경보의 크게 향상된 경보 속도는 곧 정확도의 문 제를 발생시키게 된다. 단지 1~2개의 관측만으로 경보를 결정하면 경보 기준 을 넘는 크기의 오탐지가 발생할 경우 이는 그대로 오경보로 이어질 수 있다.
1.2 지진조기경보의 오탐지 발생
지진조기경보의 전통적인 탐지 방법에서 오경보를 유발할 수 있는 오탐 지의 발생량을 파악하기 위해 기상청 지진조기경보 2단계 서비스 기반 구 축에서 테스트한 결과 여러 위상탐지(picker) 모듈 가운데 가장 뛰어난 성 능을 보여주었던 Pick_FP[15, 16]를 개선하고, 한반도 지진조기분석용으 로 최적화한 pick_ffp를 이용하여 지진조기분석 관측망의 2019년 연간 관 측자료에 대해 P파를 탐지한 뒤, 이 가운데 기상청 국내지진 카탈로그와 연 관되지 않는 오탐지를 분석하였다.
분석 결과 Table 1과 같이 연간 130만건 이상의 오탐지가 발생하였고, 이 오탐지에서 산출된 Pa, Pv, Pd 값을 Onsite 예측식[17]을 통해 추정한 최대지반속도(PGV) 값을 기상청 진도서비스의 지진동-진도변환식(GMICE) [18]을 이용하여 진도로 환산한 결과, 진도V 이상(MMI≥4.5)인 경우도 연간 9,600여건을 넘었다.
만약 오탐지 제거를 위한 별도의 방법이 없이, 각 기상청 관측소에 독립 적으로 온사이트 지진조기경보를 적용할 경우, 전국적으로 매 시간당 1회 의 오경보가 발생할 수 있으며, 특히 이 가운데 절반 이상은 예측값이 진도 VII 이상으로 경주 9.12지진 본진이나 포항지진 본진 규모의 지진이 유발 하는 진도에 해당하므로, 사용이 불가능하게 된다.
이처럼 오탐지를 제거하는 것은 온사이트 지진조기경보 기술의 실용화 에 가장 중요한 장벽이며, 기존의 전통적인 P파 탐지 방법만으로는 해결하 지 못한다. 하지만, 최근 빠르게 발전하고 있는 딥러닝 기술은 이러한 문제 에 적합한 해결 방법을 제공할 수 있다.
1.3 딥러닝을 이용한 지진분석
인공지능은 기계가 주변 환경과 상황에 따라 적절히 기능하도록 하는 기 술을 포괄적으로 지칭하는 용어이다. 인공지능 내에 명시적으로 프로그래 밍하지 않아도 기계가 스스로 배울 수 있는 방법을 연구하는 분야가 기계학 습이고[19], 이 가운데 인공신경망이 포함된다. 본 연구에서 사용한 딥러닝 기술은 대규모 인공신경망을 활용한 기계학습 기술이다.
지진분야에 딥러닝 적용을 위한 노력은 최근 수년간 전세계적으로 활발 히 이루어지고 있다: 지진 신호 탐지 및 분류[20], 지진 데이터 보간[21], 지 진 파라미터 예측[22], 지진 잡음 분석 및 저감[23], 지하구조 이미지[24], 복합신호/모델 시각화 등이 최근 시도되는 분야이다. 대규모 데이터를 기반 으로 학습된 딥러닝과 같은 최첨단 기술은 뛰어난 결과를 제공할 잠재력을 지니고 있다[25].
대만 국립 응용 연구소(National Applied Research Laboratories, NARLabs) 지진 공학 연구센터는 2017년 12월 대만에서 열린 ‘Future Tech 2017’ 전시회에서 인공지능 기반 지진조기경보 시스템을 선보였으 며, 이 시스템은 딥러닝 기술을 사용하여, 축적된 지진 데이터를 바탕으로 지진 예측의 정확성을 높였다[26, 27].
Zachary E. Ross는 2018년에 합성곱신경망(Convolutional Neural Network, CNN)을 기반으로 총 1,742,763개의 파라미터를 포함한 GPD (Generalized Phase Detection)을 이용해 P파와 S파를 구분하였다. 수작 업으로 분류한 4백만 건의 Southern California Seismic Network의 4초 구간의 3축 파형 데이터를 이용하여 훈련 및 테스트를 진행하였고, 검증세 트에 대한 P파 및 S파의 식별 능력은 99%이상이었다[28].
2019년에 Weiqiang Zhu는 합성곱신경망의 일종인 변형된 U-net[29] 을 기반으로 한 모델을 이용하여 P파와 S파의 도달시점과 종류를 식별하였 다. 이 연구는 Northern California Earthquake Data Center의 30년 동안 의 지진 기록에서 전문가에 의해 분류된 7백만 건의 3축 파형 데이터를 전 처리 및 정규화를 거쳐 사용하였으며, 전통적인 STA/LTA 방식의 AR picker와 비교할 때 모든 면에서 좋은 성능을 거두었다[30].
또한, 국내에서는 기상청 기상/지진 See-At 기술개발연구 사업의 일환 으로 김승일 등이 지진 신호에서 추출한 멜 스펙트럼에 대해서 각각 필터를 적용하여 서로 다른 주파수 대역(저/중/고 주파수)의 신호를 추출하고 이를 각각 합성곱신경망 기반 분류를 수행하고 그 결과를 융합하여 지진 이벤트 를 식별하는 연구를 진행하였다[31].
기존의 지진조기분석 기술은 전문가들이 연구한 규칙을 전통적 프로그 래밍을 통해 위상탐지(picker), 연관(association), 위치추정(location), 규 모산출, 결정(decision) 등의 모듈로 구현하고, 실시간 데이터를 이 모듈에 입력하여 그 출력 결과에 따라 경보하는 구조를 가진다. 이와 달리 기계학습 방법은 정답이 포함된 과거 데이터를 이용하여 기계학습 모델을 훈련시키 고, 이렇게 학습된 모델에 실시간 데이터를 입력하여 산출된 예측 결과를 경 보에 활용하는 구조를 가지고 있다. 기계학습 방법은 전통적 방식으로는 너 무 많은 수동 조정과 규칙이 필요한 문제나 전혀 해결 방법이 없는 복잡한 문제에 적합하며[32], 탐지된 P파 가운데 오탐지를 분류하는 문제가 이러 한 경우에 해당된다.
앞에서 살펴본 바와 같이 지진조기경보는 실용적인 지진예보 기술이 등 장하기 전까지 지진 피해를 경감시키기 위한 현실적인 대안이다. 또한, 전 통적인 지진조기경보 기술의 경우 P파에 대한 오탐지가 많기 때문에 효율 성이 떨어지는 측면이 있었다. 본 논문은 지진조기경보를 최적화하기 위해 전통적 방법과 딥러닝 방법을 결합한 기술을 이용하여 지진의 P파에 대한 오탐지가 제거 가능함을 보이기 위한 타당성 실험(feasibility test)의 결과 를 설명한다. 이를 이용해 궁극적으로 온사이트 지진조기경보 기술을 활용 한 지역대상 지진조기경보 방법을 제시할 수 있을 것으로 기대한다.
2장에서는 딥러닝 학습을 위한 데이터를 확보하고 가공한 방법과 결과 에 대해 설명하고, 3장에서는 딥러닝을 활용하여 오탐지를 제거하기 위한 방법과 모델의 구조에 대해 설명한다. 4장에서는 이러한 딥러닝 모델을 이 용한 오탐지 분류 성능을 확인하고, 연구 결과물의 실제 활용에 대한 이해를 돕기 위해 부가적으로 본 연구에서 개발된 오탐지 제거 기술이 지진조기경 보 전체 틀 내에서 어떻게 적용되는지 간단하게 설명한다. 마지막으로 5장 에서는 결론과 연구의 한계 및 후속 연구의 필요성을 제시한다.
2. 데이터
기계학습 알고리즘이 잘 작동하려면 충분한 양의 데이터가 필요하고, 많 은 경우 알고리즘 자체보다 데이터가 모델의 성능에 더 중요한 영향을 준다 [32]. 본 연구는 실시간 지진조기경보 시스템을 구성하기 위한 실용적인 목 적을 위해 진행되었으며, 이에 따라 데이터는 실제 사용될 모듈과의 조합된 성능을 최적화할 수 있도록 구성하였다.
이 연구를 위해 2015년에서 2020년 3월까지 발생한 규모 2.0 이상의 국 내 이벤트 727개, 국내관측 국외 이벤트 103개, 대만기상청(CWB)에서 제 공받은 화롄지진이 발생했던 2018년 2월 미소지진 포함 대만 이벤트 1,734 개의 이벤트 구간 관측자료에서 81,394 샘플의 학습데이터와 2018년에서 2020년 3월까지 27개월의 국내 연속자료에서 3,108,189 샘플의 학습데이 터를 만들었으며, 이를 Table 2와 같이 훈련세트와 테스트세트로 분할하였 다. Fig. 4는 이벤트 데이터의 이벤트 분포를 보여준다.
각 샘플들은 과거 관측자료에 대한 시뮬레이션을 통해 본 연구에서 개선 한 pick_ffp 모듈로 Filter Picker[15, 16]를 이용하여 P파를 탐지하고, 탐 지시점을 중심으로 4초 구간의 파형신호에서 가속도, 속도, 변위 등의 특성 값들을 추출하였으며, 이후 이벤트 카탈로그와의 비교를 통해 레이블 (label)을 부여하여 작성하였다. 이때, 관측자료의 샘플링 주파수는 100 Hz, 탐지 및 특징 추출에서 0.3 Hz의 하이패스 필터(high-pass filter)를 적 용하였다. pick_ffp에서 탐지한 P파에는 실제 P파와 오탐지가 섞여 있으며, 각 샘플은 기상청 지진 이벤트 카탈로그와 IASP91[34] 전지구 속도모델을 이용하여 예상 도달시간과의 오차를 기준으로 P파, S파, 노이즈로 레이블 을 부여하였다.
근거리 발생 지진의 P파를 탐지하여 경보하는 지진조기경보의 목적에 최 적화되도록 P파로 레이블된 샘플은 진앙으로부터 200 km이내 만을 사용하 였고, 그 이상의 먼 거리에서 탐지된 것은 폐기하였다. 노이즈로 레이블된 샘 플의 경우 이벤트 발생 시점부터 120초 이내에 존재하는 샘플은 지진파가 혼입될 우려가 있으므로 폐기하였다. 기타, 매 초 단위로 분할하여 전달되는 패킷에 유실이 존재하는 등 기준에 맞지 않는 샘플들도 폐기하였다.
동일한 이벤트에서 발생하여 서로 다른 관측소에 도달하여 탐지된 샘플들 은 단층 파열면에 대한 방향, 전파거리 및 전파경로의 매질에 따른 감쇠와 변 형 등으로 서로 차이가 존재하지만, 동일한 발생 단계의 특징을 공유함으로 써 다른 이벤트에 속한 샘플 간의 유사성과 비교할 때 패턴 유사성이 높을 가 능성을 배제하기 어렵다. 이에 따라 국내에서 발생된 큰 규모의 이벤트 수가 많지 않은 상황에서 만약 동일한 이벤트에서 발생한 샘플들을 훈련 세트와 테 스트 세트에 무작위로 분배할 경우, 동일 이벤트 샘플 간에 존재하는 고유 특 성에 대한 편향이 발생하여, 향후 실시간 운용시 새로운 이벤트에 대한 일반 화 성능이 기대보다 저하될 우려가 있다. 이에 따라, 가급적 동일 이벤트의 샘 플들이 훈련 세트와 테스트 세트에 분산되는 것을 최소화할 수 있도록 훈련 및 테스트 세트 분할 기준을 이벤트 발생 시기 및 지역으로 설정하였다. Table 2의 내용과 같이 훈련 세트는 2019년과 포항지진 본진을 제외한 국내 이벤 트, 국내관측 국외 이벤트, 대만 이벤트, 2018년과 2020년의 연속자료의 샘 플로 구성했고, 테스트 세트는 2019년 발생 국내 이벤트와 포항지진 본진, 2019년 연속자료의 샘플로 구성했다. 이에 따라 훈련세트는 1,826,357개의 샘플, 테스트세트는 1,363,226개의 샘플을 포함하였다(Table 2).
또한, 학습 데이터에는 이벤트 발생 구간 관측자료에서 생성된 샘플 수 (81,394)와 연속자료 샘플 수(3,108,189), 연속자료 내에서 Onsite 예측식 [17] 산출값이 오경보를 유발할 수 있는 큰(≧MMI 4.5) 노이즈 샘플 수 (24,348)와 작은(<MMI 4.5) 노이즈 샘플 수(3,044,708)에 있어 클래스 불균형(class imbalance) 문제가 존재한다. 이대로 모델을 학습하게 되면 다수를 차지하는 작은 노이즈 특성에 최적화되므로, P파, S파, 큰 노이즈 샘 플에 대한 학습 비중을 강화할 필요가 있다. 이를 해결하기 위해 학습 데이 터와 테스트 데이터에 각기 P파, S파, 큰 노이즈 샘플들을 반복하여 추가하 는 균형 조정을 하였다. 이러한 균형 조정을 통해 최종적으로 모델의 훈련에 사용된 훈련세트는 4,063,907개 샘플, 테스트세트는 2,865,106개 샘플로 크기가 확대되었다.
1) 훈련 데이터 균형 조정
-
∙ 국내 이벤트(2015~2018, 2020, 포항 본진 제외) + 원거리 이벤트 + 대만 이벤트 + 국내 연속(2018, 2020)으로 기본 훈련 데이터셋 구성 → 이후 다음의 데이터를 반복 추가
-
∙ 2018, 2020 국내 이벤트, 대만 이벤트 데이터의 P와 S파 샘플 : 30회 (총 31회 : 기본 1 + 추가 30)
-
∙ 2018, 2020 연속자료 가운데 예측 MMI 3.5이상의 노이즈 샘플 : 10 회 (총 11회 : 기본 1 + 추가 10)
-
∙ 2018, 2020 연속자료 가운데 예측 MMI 5.5이상의 노이즈 샘플 : 30 회 (총 41회 : 기본 1 + 추가 10 + 추가 30)
2) 테스트 데이터 균형 조정
-
∙ 국내 이벤트(2019, 포항 본진) + 국내 연속(2019)로 기본 테스트 데이 터셋 구성 → 이후 다음의 데이터를 반복 추가
-
∙ 국내 이벤트 데이터의 P와 S파 샘플 : 200회 (총 201회 : 기본 1 + 추가 200)
-
∙ 2019 연속자료 가운데 예측값 Level 4.5이상의 노이즈 샘플 : 40회 (총 41회 : 기본 1 + 추가 40)
3. 모 델
본 논문에서 제시하는 새로운 실시간 오탐지 제거 방법은 전통적인 P파 탐지 방법과 딥러닝 분류 방법을 결합한 것이 특징이다. 딥러닝 분류 방법만 으로도 오탐지를 최소화하며 P파를 탐지하는 것이 가능하지만, 관측자료 의 모든 구간에 대해 특징 추출 및 딥러닝 연산을 하기 위해서는 계산 비용 이 지나치게 증가될 수 있다. 전통적 기술에 의해 선택된 구간에 대해서만 딥러닝 기술을 적용함으로써 많은 연산이 필요한 특징 추출 방법 및 깊은 층 의 신경망을 사용하더라도 시스템의 부담이 최소화되도록 하였다. 또한, 전 통적인 방법의 탐지 성능과 새로운 방법의 분류 성능을 모두 적용함으로써 오탐지 제거 성능을 극대화할 수 있었다.
딥러닝 모델은 구글 Tensorflow[35]의 C API를 기반으로 구현하였고, 또한 특징 추출 및 딥러닝 분류를 포함한 모든 부분을 C언어를 사용한 USGS Earthworm의 모듈로 개발하여, 수백 개의 기상청 지진조기경보 관 측소를 대상으로 하는 실시간 운용 및 라즈베리파이(Raspberry Pi)와 같은 소형 장치에서 소규모 운용이 모두 가능하도록 하였다.
딥러닝 기반 실시간 오탐지 제거를 사용하기 위한 기본적인 온사이트 지 진조기경보 분석 프로세스는 Fig. 5와 같다. 먼저 실시간 관측신호에서 전 통적 방식으로 P파를 탐지하고, 탐지시점을 중심으로 일정 구간의 관측값 에서 특징을 추출한 다음, 이를 합성곱신경망(Convolutional Neural Network, CNN)[36] 기반 모델을 통한 분류를 거쳐 오탐지를 제거한다. 이 후 P파의 특성값에서 앞으로 도달할 S파의 크기를 추정하여 지진의 발생을 경보하는 흐름을 갖는다.
3.1 P파 탐지
전통적인 P파 탐지 기술은 긴 시간 구간의 신호 크기 평균(Long-Term Average, LTA)에서 짧은 시간 구간의 신호 크기 평균(Short-Term Average, STA)을 전체 또는 주파수별로 비교하여 일정한 기준을 초과할 경우에 P파 의 탐지를 결정하는 방식을 응용한다[37]. 이러한 방법은 오랜 기간 활용을 통해 충분히 검증되었고, 연산의 처리속도가 빠르며, 검출시점에 대해 일관 적이므로, 기계학습 입력용 특징을 추출하기 위한 일관된 시간구간을 결정 하는데 유용하다[15, 16]. 하지만, 관측자료에는 다양한 원인과 형태의 임 펄스 노이즈(impulse noise)가 포함되는데, 이들 역시 긴 시간 구간에 대해 짧은 시간 구간의 신호 크기가 증가하는 형태를 갖기 때문에 일부는 P파 탐 지를 위한 기준을 충족하여 오탐지를 발생시키게 된다.
본 연구에서는 이러한 전통적 P파 탐지 방법인 FilterPicker[15, 16] 알 고리즘을 사용하는 pick_ffp 모듈을 이용하여 P파를 최초 탐지하였다. pick_ffp는 기상청 지진조기경보 2단계 서비스 기반 구축에서 위상탐지 (picking) 알고리즘 4종에 대한 테스트 결과 최종 선택된 pick_FP[15, 16] 모듈을 기반으로 과거 국내 이벤트 대상 매개변수 조합 테스트를 통해 한반 도 지역에 최적화한 것이다. pick_ffp는 본 연구에서 각기 별도로 전송되는 3축 채널의 전송 패킷들을 실시간 결합하고, 3축 특성값(속도, 가속도, 변위 등)들을 산출하여, 오탐지 식별을 위한 딥러닝 추론(inference) 모듈 및 예 상진도 추정에 대한 입력값으로 제공할 수 있도록 하였다.
3.2 오탐지 식별
본 연구에서는 신호의 수직 성분 크기 변화를 기준으로 하는 전통적인 방법에서 발생한 오탐지를 제거하기 위해, P파와 오탐지 간의 3축 성분 주 파수 분포의 패턴이 가지는 차이를 딥러닝 모델에 학습시켜 분류하는 방법 을 사용하였다.
EEWNet Part 1 ‘False-Pick Filter’는 Fig. 6과 같이 pick_ffp에서 산출 된 3축 성분의 특성값에서 P파 도달시점 기준 전후 각 2초씩, 총 4초의 관측 자료에 대한 1초 단위 로그-멜 파워 스펙트럼(Log-Mel Power Spectrum) 의 특징을 추출하고, 이를 합성곱신경망을 통해 실제 P파 및 오탐지로 분류 하는 모델이다.
합성곱신경망(Convolutional Neural Network, CNN)은 이미지 인식 분야에서 주로 사용되며, 기본적으로 합성곱층(convolutional layer)과 풀 링층(pooling layer)을 이용하여 이미지를 단순한 특징에서 복잡한 특징으 로 추상화하고, 마지막 완전연결층(fully connected layer)에서 분류를 수 행하는 구조를 갖고 있다[36]. 본 모델은 3축 성분의 특징벡터에 대한 합성 곱 연산을 수행할 수 있도록 구성되었다.
모델은 크게 특징추출(feature extraction)과 특징학습(feature learning), 분류(classification) 단계로 구성되어 있다.
특징추출 단계에서는 각 축별로 정규화된 4초 길이의 파형으로부터 1초 단위로 패딩(padding), 파워스펙트럼(power spectrum) 변환, 멜 필터뱅크 (mel-filterbank) 적용, 로그스케일(log-scale) 변환을 거쳐 256 길이의 로 그-멜 파워 스펙트럼 벡터를 생성한다. Fig. 7은 특징추출 단계에서 산출한 P파, 노이즈, S파의 특징벡터들을 시각화한 예시이다.
특징학습 단계에서는 3축의 로그-멜 파워 스펙트럼 벡터를 합친 3x256 크기의 입력벡터에 대해 5번의 합성곱(convolution)과 맥스풀링(maxpooling) 연산을 통해 핵심 특징들을 학습한다. 일반적으로 합성곱신경망 은 단계별로 필터(filter)의 개수를 증가하지만, 본 모델은 첫 합성곱층부터 필터의 갯수를 26개로 구성하고 마지막 합성곱층까지 동일하게 유지함으 로써 세밀한 특징의 정보가 최종 단계에 전달될 수 있도록 한 것이 특징이 다. 각 합성곱층에는 3x3 크기의 2차원 필터를 사용하였고, 1x1의 스트라 이드(strid)를 적용하였다. 풀링층은 최초 4번은 (1, 3), 마지막은 (3, 3) 크 기의 맥스풀링을 적용하였다. 이때 활성함수는 ReLu(Rectified Linear Unit)를 사용하였다[38]. 또한, 과적합을 줄이기 위해 평탄화(flatten) 레이 어와 완전연결층(fully connected layer) 사이에 확률 0.4의 드롭아웃 (dropout) 레이어를 구성하였다[39, 40].
분류 단계에서는 완전연결층을 거쳐 최종적으로 P파와 P파가 아닌 것으 로 이진분류(binary classification)를 수행한다. 마지막 층의 활성함수는 소프트맥스(softmax)를 사용하였다[40].
이 모델은 1,826,357개의 훈련 데이터의 양에 비해 충분히 작은 24,934 개의 파라미터를 가지고 있어, 과적합을 최소화할 수 있도록 하였다.
지진조기경보에 적용하기 위한 모델의 개발에서 P파 도달시점을 기준 으로 몇 초의 시간구간에 대한 특징을 사용할 것인지 결정하는 것은 중요한 요소이며, 이는 지진조기경보의 속도와 정확도에 크게 영향을 미친다. 만약 이 시간구간을 1초로 줄일 경우에는 경보의 속도를 최대한 신속하게 할 수 있지만, 분류의 정확도가 상당히 낮아진다. 3초 이상으로 늘일 경우에는 전 체적인 정확도는 약간 상승하지만 지진조기경보에 있어서 가장 중요한 진 앙에 가까운 지점에서는 S파의 혼입이 발생하여 진앙 인근에서 오히려 성 능이 떨어질 우려가 있으며, 경보의 속도가 지나치게 늦어진다. 이에 따라 본 모델은 시간구간을 P파 도달 이후 2초까지로 결정하였다.
3.3 훈 련
모델은 균형 조정을 거친 훈련 세트를 이용하여 훈련하였다. 모델의 훈 련 과정에는 가중치 초기화(weight initialization)에 무작위(random)값이 포함되므로 각 결과마다 성능의 차이가 존재하며[41], 여러 결과 가운데 균 형 조정을 거친 테스트 세트에 대한 정확도(accuracy)와 2019년 국내 연속 자료에서 오경보를 발생시키는 오탐지에 대한 차단 성능을 종합적으로 관 찰하여 최종적으로 결과를 선택하였다.
4. 결 과
모델의 성능 평가는 테스트 샘플의 특징벡터를 모델에 입력하여 예측된 레이블을 정답과 비교한 결과에 대한 정확도(accuracy)를 지표로 사용하 였으며, 이는 P파를 P파로 예측한 샘플과 P파가 아닌 것을 P파가 아닌 것으 로 예측한 샘플의 수를 전체 테스트 샘플의 수로 나눈 값이다. 이러한 성능 평가의 결과는 pick_ffp가 P파로 탐지한 샘플 내의 실제 P파와 오탐지를 대 상으로 한 식별 성능이기 때문에 pick_ffp가 이미 대부분의 노이즈 및 S파 를 차단한 것을 감안하여야 한다.
Table 3과 같이 균형 조정을 거친 테스트 세트에 대하여 테스트한 결과 정확도는 97.58%였다.
Table 4와 같이 2019년 국내 연속자료의 샘플을 대상으로 한 테스트 결 과의 정확도는 98.95%였다. 이 결과는 균형 조정을 거치지 않은 연간 연속 자료를 대상으로 하였기 때문에 규모 2.0 이하의 미소지진의 샘플 비율이 높고, 균형 조정을 거친 테스트 세트에 대한 결과와 비교할 때 오인차단이 4.42%에서 22.91%로 증가하였다. 하지만, 미소지진은 지진조기경보의 관심대상이 아니다.
Table 5는 2019년 발생한 연간 오탐지에 대한 테스트 결과이다. 노이즈 레벨은 경험식 추정을 통해 상응하는 진도 기준값으로 정의하였으며, 예상 진도 추정은 pick_ffp에서 산출한 특성값(속도, 가속도, 변위 등)에서 P파 도달 후 2초 구간의 수직성분 Pa, Pv, Pd 값을 산출하여 ‘한국형 지진현장 경보를 위한 예측 경험식’[17]에 입력하여 산출된 결과를 사용하였다. 테스 트 결과 1년간 발생된 오경보를 유발할 수 있는 크기의 오탐지 9,675개 가 운데 99%이상이 차단되었다. 차단에 실패한 극소수의 오경보를 유발할 수 있는 샘플들이 존재하였지만, 이들은 추가적으로 “기계학습을 이용한 지역 대상 지진조기경보를 위한 실시간 경보 결정 방법”[42]의 적용을 통해 최종 적으로 모두 차단되었다.
“기계학습을 이용한 지역대상 지진조기경보를 위한 실시간 경보 결정 방법”은 기계학습을 이용한 지역대상 지진조기경보 시스템의 실시간 지진 조기경보 발령 결정 과정에 있어 경보 시점을 최대한 앞당기고, 오경보를 최 소화하도록 결정하는 방법이다. Fig. 8과 같이 한 관측소에서 P파를 감지한 후 일정 시간의 추가 관측을 통해 오탐지 제거를 위한 분류와 경보를 위한 예측을 수행한 후, 기계학습을 이용한 분류 결과가 지진으로부터 발생한 P 파이고, 예측되는 최대 지진동이 경보 기준 이상일 때, 기준 거리 범위 내의 다른 관측소에서 기준 시간 범위 내에 P파를 감지하였을 경우, 오경보의 확 률을 최소화한 상태에서 지역대상 지진조기경보를 발령하는 방법이다[42].
본 연구의 결과를 기상청 지진조기분석 관측망에 “기계학습을 이용한 지역대상 지진조기경보를 위한 실시간 경보 결정 방법”과 함께 적용할 경 우 현재 네트워크 기반 지진조기경보가 8개 관측소의 탐지를 기다린 후 경 보하는 것에 비해 2개의 관측소 탐지 후 신속히 지역에 경보하는 것이 가 능하다. Fig. 9는 포항지진 본진(M5.4)에서 진원 인근 관측소에 대한 IASP91[34] 전지구 속도모델에 의한 P파 도달시점과 이 방법을 통해 이론 적으로 예상되는 경보시점을 보여준다. 그림에서 상단으로부터 진원에 가 까운 순서로 관측소가 나열되었으며, 우측 방향으로 진원시 이후 시간의 경 과를 보여준다. 먼저 진원에 가장 인접한 포항(PHA2)관측소가 최초로 지 진관측을 하고, 이후 2초 동안 딥러닝을 이용한 오탐지 차단 및 예측값 산출 을 한다. 이후 학계리(HAK)관측소가 두 번째 지진관측을 하고, 두 관측의 거리와 시간차를 확인한 다음, 전송 및 분석 등의 지연을 고려한 0.5초의 오 버헤드를 추가하여, 대략 5~6초에 경보가 결정될 것으로 추정하였다. 위의 방법을 구현한 실시간 프로토타입 시스템을 이용하여 과거지진 시뮬레이 션을 수행한 결과, 포항(PHA2)관측소의 최초 지진관측 후 2.2초에 학계리 (HAK)관측소가 두 번째 지진관측을 하였고, 최초 관측 3초 내외에 지역대 상 지진조기경보를 결정하였다. 과거 포항지진 본진(M5.4) 발생 시에 최초 지진관측은 발생 후 3초였으며, 지진조기경보는 최초 관측 후 19초에 발령 되었다[43]. 그리고, 훈련세트에 포함된 이벤트로 지진 관측망 외곽에서 발 생된 포항지진과는 달리 관측망 내부에 위치한 경주 9.12지진의 전진 (M5.1)과 본진(M5.8)에 대한 과거지진 시뮬레이션에서는 최초 관측 2초 내외에 경보가 결정되었다.
5. 결 론
본 연구는 딥러닝 기술을 이용하여 오경보를 유발할 수 있는 지진에 대 한 오탐지를 차단할 수 있음을 보여주고 이를 이용하여 지진조기경보의 속 도와 정확성을 높이기 위하여 진행되었다. 이를 위해 P파 도달시점 기준 전 후 각 2초씩, 총 4초의 관측자료에 대한 1초 단위 로그-멜 파워 스펙트럼의 특징을 추출하고, 이를 합성곱신경망을 통해 실제 P파 및 오탐지로 분류하 는 EEWNet Part 1 ‘False-Pick Filter’ 모델을 제시하였다.
이를 훈련하고 테스트하기 위해 국내 발생 이벤트, 국내 관측 국외 이벤 트, 대만 이벤트의 관측자료 및 27개월간의 국내 연속자료를 처리하여 3,189,583 샘플의 데이터를 만들었다.
최종적으로 2019년 연속자료에 대한 테스트 결과 1년간 발생된 오경보 를 유발할 수 있는 크기의 오탐지 9,675개 가운데 99%이상을 차단하였다. 차단되지 못한 소수의 오탐지는 “기계학습을 이용한 지역대상 지진조기경 보를 위한 실시간 경보 결정 방법”[42]의 적용을 통해 최종적으로 모두 차 단되었다.
연구 결과를 지진조기경보 관측망에 적용하여 지역경보로 활용하면, 기 존의 지진조기경보보다 빠른 경보가 가능하게 되며, 과거 포항지진 본진의 경우에는 경보시점을 진원시 기준 6초 내외로 단축할 수 있게 된다.
본 연구의 결과는 USGS Earthworm 기반의 모듈로 구현되었으며 일반 화된 성능의 검증을 위해 실시간 프로토타입 시스템을 구축하여 2020년 10 월부터 기상청에서 실시간 시험운용을 통해 성능과 안정성에 대한 검증을 진행 중이다.
본 연구의 한계로 진앙에 매우 근접한 관측소에서 2초의 특징추출 구간 내에 P파와 S파가 혼입될 경우, 이로 인한 오인차단이 발생할 수 있다. 향후 이를 개선하고, 경보의 시점을 앞당기기 위하여, 오탐지 차단성능을 유지하 며 특징추출 구간을 P파 도달시점 이후 2초에서 1초의 단축할 필요가 있다. 하지만, 이를 위하여 전 과정에 대한 최적화와 보조 센서를 활용하는 방법 등의 다양한 후속 연구가 필요하다.