Journal Search Engine

Volume/Issue :

Year(s) : to

Search :

Title :

Author :

Keyword :

Abstract :

Figure :

Table :

Reference :

Search Advanced Search

Adode Reader(link)

Download PDF Export Citation Korean Bibliography

ISSN : 1226-525X(Print)
ISSN : 2234-1099(Online)

Journal of the Earthquake Engineering Society of Korea Vol.30 No.3 pp.111-121
DOI : https://doi.org/10.5000/EESK.2026.30.3.111

Structural Type Classification of Domestic Reinforced Concrete Buildings Utilizing Machine-Learning Algorithms

Kim Taewan^1)*

¹⁾Professor, Department of Architectural Engineering, Kangwon National University

^*Corresponding author: Kim, Taewan E-mail: tkim@kangwon.ac.kr

Received March 6, 2026 Review April 6, 2026 Accepted April 6, 2026

Abstract

This study optimizes three machine learning models-Decision Tree, Random Forest (RF), and Gradient Boosting-to classify concrete structure types (C2, C3, C4, and C5) using information from a building register. Although the initial models achieved high overall accuracy, the minority class C5 exhibited relatively low performance due to class imbalance and inherent complexity. To address this, an exhaustive grid search over discrete parameter candidates was performed, and a class-weighting strategy was integrated into the RF model to prioritize accurate classification of the minority class. The optimized RF model preserved a high overall accuracy of 94% while markedly improving C5 recall from 0.81 to 0.86 and its F1-score from 0.85 to 0.87. These results demonstrate that strategic hyperparameter tuning with class weights can effectively enhance classification reliability for rare structural types. Future research should include feature importance analysis to refine data configurations and the expansion of minority class samples to further improve model robustness in practical applications.

Key Words : Concrete structure classification , Machine learning , Hyper-parameter tuning , Class imbalance , Random forest

기계 학습 알고리즘을 적용한 국내 철근콘크리트 건물의 구조 유형 분류

김태완^1)*

¹⁾강원대학교 건축공학과 교수

초록

키워드 :

This article has been cited by 0 article in crossref

Cited-By

Funding:

1. 서 론

2009년 소방방재청에서 개발한 지진취약도함수[1]에서 국내 철근콘크리트(RC) 구조 건물의 구조 유형을 C1에서 C5까지 5가지로 구분한 이래로 다양한 분야에 사용되고 있다[2-5]. 이들은 지진해일에 의한 건축물 피해 유형 분석[2], 지진피해 평가시스템의 학습데이터 구축[3], 인공지능 기반 지역 단위 건축물 내진 성능 데이터 생성[4]을 위한 연구에 지진취약도함수[1]의 구조 유형 분류를 사용하였으며, Hahn 외[5]에서도 유사한 구조 유형 분류 방식을 채택하였다.

지진취약도함수[1]는 지진 발생 시 국내 건축물의 손상 정도를 빠르게 추정하기 위한 것이므로, 대략 800만 동에 달하는 건물의 구조 유형을 단순하게 분류할 필요가 있다. 따라서, 지진취약도함수[1]에서는 국내 철근콘크리트구조의 유형을 미국 HAZUS[6]의 분류 방식을 기본으로 하면서, 필로티 형식을 추가하였다. 철근콘크리트구조의 5가지 형식은 Table 1과 같다. 분류는 국내 건축구조설계기준(KBC-2005)[7]에 정의된 지진력저항시스템을 기초로, 모멘트골조(C1, C2)가 주된 시스템인 경우와 전단벽(C3, C4, C5)인 경우로 구분하였다. 모멘트골조가 주된 시스템일 때는 모멘트골조만 있는 경우(C1)와 채움벽이 함께 있는 경우(C2)로 나뉘며, 전단벽이 주된 시스템인 경우는 전단벽만 있는 경우(C3), 모멘트골조와 함께 있는 경우(C4), 필로티(C5)인 경우도 나뉜다.

2009년에 개발한 구조 유형 분류 방식은 건축 HUB 공공 포탈 건축물대장표제부(이하 표제부)[8]에서 제공하는 허가 일자, 층수, 용도로 구성된 단순한 규칙을 사용하였다. 지진취약도함수의 목적이 개별 건축물의 내진 성능을 정확하게 파악하기보다는 지진이 발생했을 때 특정 지역의 피해 수준을 대략 판단하기 위한 것이기 때문이다. 그런데도 Kim[9]은 위 분류 규칙에 더 많은 용도를 추가하고 연면적도 함께 사용하여 이전보다 상세한 분류 규칙을 제시하였고, 국립재난안전연구원에서 수행한 ‘대규모 지진으로 인한 사회·경제적 영향분석 추정 기술 개발’ 연구[10]에서는 Kim[9]의 분류 규칙을 일 부 수정하여 제안하였다.

하지만 앞선 연구[2-5, 9-10]에서는 구조 유형 분류의 정확성을 확인한 사례는 Kim[9] 밖에 없으며, Kim[9]에서도 대표적인 12개 건물의 사례만을 제시하였다. Hong and Kim[11]에서는 표제부[8]의 자료를 사용한 구조 유형 분류 규칙의 정확도를 확인하고 개선하기 위해 1,821동의 건물을 사용하였다. 실제 구조 유형은 건축데이터 개방 서비스를 제공하는 건축 HUB 공공 포탈[12]의 “지도로 보는 건축정보”에서 로드뷰(Road view)를 저자가 맨눈으로 직접 확인한 결과를 사용하였는데, 로드뷰로 확인한 결과와 유형 분류 규칙을 적용한 결과의 정확도를 높이는 방향으로 규칙을 수정 및 보완하였다. 그것은 건물의 기타용도, 1층의 용도 및 바닥면적 등을 추가로 적용하고, 층수와 허가 일자의 기준도 일부 변경하는 것이다. Hong and Kim[11]에서 제시한 구조 유형 분류 규칙의 정확도는 이전[10]에 비해 매우 향상되었다.

하지만, Hong and Kim[11]을 포함한 이전 연구의 분류 규칙은 다양한 변수들의 적용 단계와 규칙을 연구자가 일일이 직접 만든 것이다. 정확도를 향상하기 위해 일부를 추가하거나 수정하고자 할 때. 그 과정은 지난하고 복잡할 것이다. 여기에 근래 활발히 적용되고 있는 기계학습이나 인공신경망 알고리즘을 사용하여 적절한 분류 규칙을 찾을 수 있다면, 개발뿐만 아니라 개선 과정도 연구자가 일일이 규칙을 만들 때보다 훨씬 수월해질 것이다. 따라서 이 연구에서는 Hong and Kim[11]을 포함한 이전 연구에서 사용한 표제부[8]에서 제공하는 자료를 기계학습(Machine Learning, ML) 알고리즘에 적용하여 구조 유형 분류의 정확도를 높이고자 하였다.

이 목적을 달성하기 위해 다음과 같은 과정으로 연구를 진행한다. 구조 유형 분류에 적절한 기계학습 알고리즘을 탐색하고, 표제부[8]에서 제공하는 자료를 분석한다. 필요한 경우 기계학습 알고리즘 적용에 맞게 표제부[8]에서 제공하는 자료를 가공한다. 다양한 기계학습 알고리즘과 자료를 교차 적용하여 정확도가 높은 조합을 찾는다. 최종적으로 최적화를 수행하여 기계학습 알고리즘의 정확도를 더욱 개선한다.

2. 구조 유형 분류를 위한 기계학습 알고리즘

이 연구에서는 표제부의 자료를 활용한 건축물 구조 유형 예측을 위한 지도 학습 알고리즘을 의사 결정 트리(Decision Tree, DT), 랜덤 포레스트(Random Forest, RF), 그래디언트 부스팅(Gradient Boosting, GB)의 3가지 방식을 적용하였다. 이 장에서는 이 3가지 알고리즘으로 결정하기까지 이론적 배경이 되는 기계학습(Machine Learning)과 딥러닝(Deep Learning)의 개념 및 차이점, 학습 방법을 고찰하고, 3가지 기계학습 알고리즘의 주요 특징과 장단점을 살펴보았다.

기계학습은 명시적인 프로그래밍 없이 데이터로부터 학습하여 예측 또는 결정을 내리는 인공지능의 하위 분야다. 딥러닝, 선형 회귀, 서포트 벡터 머신 등 다양한 알고리즘을 포함하며, 자료의 패턴을 학습하고 예측하는 데 광범위하게 사용된다. 반면, 딥러닝은 기계학습의 하위 분야로, 심층 신경망(Deep Neural Network, DNN)을 사용하여 복잡한 문제를 해결하는 데 특화된 기술이다. 기계학습과 딥러닝의 주요 차이점은 Table 2와 같다. 이 연구에서는 건축물대장표제부의 자료를 활용하여 건축물의 구조 유형을 분류하는 것이 목적이므로 딥러닝에 비해 기계학습이 더 적절해 보인다. 즉, Table 2에서 제시된 기계학습의 특징인 1) 사람이 직접 데이터의 특징을 추출, 2) 비교적 정형화된 데이터, 간단한 문제에 적합, 3) 상대적으로 단순한 알고리즘, 적은 계산 자원 요구, 4) 스팸 분류, 신용 평가, 상품 추천 등 단순 예측/분류 등이 연구의 특성에 더 맞기 때문이다.

기계학습 알고리즘은 학습 방식에 따라 크게 다음의 4가지로 분류할 수 있다.

•지도 학습 (Supervised Learning): 정답(레이블)이 있는 데이터를 사용하여 모델을 학습시키며, 예측(회귀) 또는 분류(Classification) 문제를 해결하는 데 사용 (예: 주택 가격 예측, 스팸 메일 분류)
•비지도 학습 (Unsupervised Learning): 정답(레이블)이 없는 데이터를 사용하여 데이터의 숨겨진 패턴이나 구조를 발견 (예: 클러스터링, 차원 축소)
•준지도 학습 (Semi-supervised Learning): 일부 레이블이 있는 데이터와 레이블이 없는 데이터를 함께 사용하여 학습 성능을 향상
•강화 학습 (Reinforcement Learning): 에이전트가 환경과의 상호작용을 통해 보상을 최대화하는 방향으로 학습하며, 복잡한 의사 결정 문제에 활용

건축물의 구조 유형을 예측하는 문제는 이산적인 범주를 예측하는 분류(Classification) 문제에 해당하며, 구조 유형 정답(레이블)을 알고 있는 건축물을 대상으로 하므로 지도 학습 방식이 가장 적합하다. 이 연구에서는 알고리즘 적용의 용이성과 결과 해석의 용이성을 고려하여 DT를 기본 모델로 채택하였다. DT는 자료를 특정 기준(피처, Feature)에 따라 분할 하며, 마치 나무의 가지처럼 구조를 형성하여 최종적으로 예측/분류를 수행한다(Fig. 1). Fig. 1의 형태는 기존 분류 규칙 차트[11]를 나타낸 Fig. 2와 Fig. 3의 형태와 유사하다. 또한 예측 성능 향상을 위해 앙상블 기법(Ensemble Method)인 RF와 GB를 추가로 적용하였다. 이 알고리즘들의 특성 및 장단점을 Table 3에 정리하였다.

DT는 자료 집합을 가장 잘 분리하는 분할 기준을 찾기 위해 정보 이득(Information Gain) 또는 지니 불순도(Gini Impurity)와 같은 불순도 지표를 사용한다. 이 과정은 자료가 순수한(Homogeneous) 노드가 될 때까지 재귀적으로 반복된다. RF는 여러 개의 결정 트리를 생성하고, 이들의 예측 결과를 취합하여 최종 결론을 도출하는 대표적인 포장(Bagging) 방식의 앙상블 알고리즘이다. 각 트리를 생성할 때 부트스트랩(Bootstrap) 샘플링을 통해 학습 자료의 일부를 무작위로 추출하고, 각 분할 단계에서 피처의 부분집합만을 무작위로 선택하여 트리의 다양성을 확보한다. 최종 분류 결과는 개별 트리의 투표를 통해 결정된다. GB는 여러 개의 약한 학습기(일반적으로 얕은 결정 트리)를 순차적으로 학습시키는 부스팅(Boosting) 방식의 앙상블 알고리즘이다. 이전 학습기가 예측한 잔차(Residual) 또는 오류에 초점을 맞추어 다음 학습기가 이를 보완하도록 학습한다. 이때 잔차를 줄이는 방향으로 모델을 업데이트하기 위해 경사 하강법(Gradient Descent)의 개념을 사용하며, 이를 통해 모델의 성능을 점진적으로 높인다.

이처럼 RF 및 GB는 DT의 단점을 보완하는 확장된 알고리즘이라고 볼 수 있다. RF는 DT의 주요 단점인 과적합을 방지하는 장점이 있으나, 다수 트리의 사용으로 계산량이 증가하는 단점이 있다. GB는 앞의 두 알고리즘에 비해 높은 예측 성능을 가지고 있으나 과적합에 취약하다는 단점이 있다. 이처럼 알고리즘 간에 장단점이 존재하므로, 이 연구에서는 위 3가지 알고리즘을 모두 적용하여 그 정확성을 비교하였다. 이 연구의 기계학습 모델 구축은 Google에서 제공하는 클라우드 기반 Python[13] 실행 환경인 Google Colaboratory[14]를 사용하여 수행되었음을 주지한다.

3. 기존 구조 유형 분류 규칙

Hong and Kim[11]의 구조 유형 분류 규칙은 이전 연구[10]의 기본 골격을 그대로 유지하면서 세부적인 변수와 기준을 단순하게 적용하였다. 또한 이전 연구[10]에서는 표제부[8]에서 제공하는 자료만을 사용하였으나, 필로티 유형(C5)을 더 잘 분류하기 위해 층별 자료를 추가하였다. 표제부[8]는 세움터[15]의 건축물대장을 대용량 제공 서비스를 통해 전국 건물의 정보를 하나의 파일로 획득할 수 있어 후처리가 편리하나, 층별 자료[16]는 대용량 서비스로 제공되지 않아 포탈 내에서 주소지별로 직접 받아야 한다. 표제부로부터는 건물의 주용도 및 기타용도, 층수, 및 허가 일자 자료를 사용하였고, 층별 자료는 층 용도와 용도별 면적을 사용하였다. 해당 구조 유형 분류 규칙을 Fig. 2와 Fig. 3에 나타내었다.

구조 유형 분류 과정은 먼저 주용도와 기타용도를 사용하여 총 6개의 용도로 분류하며, 자세한 정의는 다음과 같다[11].

•용도 1(단독주택) : 주용도가 단독주택이며, 기타용도에 근린생활시설(이하 근생)을 지칭하는 명칭이 없는 건물.
•용도 2(공동주택) : 주용도가 공동주택이며 기타용도에 도시형생활주택, 아파트, 근생을 지칭하는 명칭이 없는 건물.
•용도 3(도시형생활주택) : 주용도가 공동주택이며, 기타용도에 도시형생활주택이라고 명시되어 있는 건물.
•용도 4(아파트) : 주용도가 공동주택이며, 기타용도에 아파트로 명시되어 있는 건물.
•용도 5(주거 & 근생) : 주용도가 단독주택, 공동주택이면서 기타용도에 근생을 지칭하는 명칭이 있고, 주용도가 근생이면서 기타용도에 주택에 해당하는 단어를 포함하는 건물.
•용도 6(근생) : 주용도가 근생이며, 기타용도에 주택을 지칭하는 단어가 없는 건물.

그다음은 용도별로 층수에 따라 구분한 후, 허가 일자에 따라 구조 유형을 배정한다. 층수와 허가일자를 사용하여 구분하는 이유는 이들이 철근콘크리트 전단벽의 유무를 판별하는데 유용하기 때문이다. 용도에 따라 다르지만 오래된 건물이라도 5층 이상이면 엘리베이터가 설치된 경우가 있으며, 이는 C2와 C4를 구분하는 기준이 될 수 있다. 건축물의 내진설계대상의 변화도 같은 기준이 될 수 있는데, 국내 설계 관행에서는 지진력을 철근콘크리트 전단벽이 부담하도록 하기 때문이다. 즉, 내진설계대상에 포함되는 조건의 건물이면 철근콘크리트 전단벽이 존재할 가능성이 높으며, 이때 모멘트골조 건물이라면 철근콘크리트 전단벽이 함께 있는 C4일 가능성이 높다. 따라서, 용도로 나눈 후에 층수와 허가일자를 사용하여 구조 유형을 분류한 것이다. 물론 Hong and Kim[11]에서 언급했지만, 이 두 가지 조건이 항상 구조 유형과 맞지는 않다는 것을 유의할 필요가 있다.

Fig. 2와 Fig. 3에서 알 수 있듯이 대부분은 여기서 구조 유형 분류가 완료되나, 일부에서는 1층 용도와 용도별 면적을 사용하여 필로티 유형(C5)을 추가로 구분한다(그림에서 ‘C5 Filtering’으로 표시). C5는 1층에 주차장을 설치하기 위해 필로티 기둥을 설치하는 유형인데, 2002년 9월 주차장 기준의 변경으로 인해 그 수가 급격하게 증가하였다. Hong and Kim[11] 이전의 연구[1, 10]에서는 단순히 허가일자가 2002년 9월 이후면 C5로 분류하였다. 하지만 Hong and Kim[11]에서 확인한 결과 그 이전이라도 필요 때문에 필로티 구조를 사용한 경우와 그 이후라도 건물 주변에 주차장 공간이 있어 필로티 구조가 아닌 경우도 많았다. 따라서 1층의 용도와 용도별 면적을 추가로 확인하여 C5 분류에 사용하였다. 마지막으로 이전[10] 규칙에서는 연면적을 광범위하게 사용하였으나, Hong and Kim[11]에서는 Fig. 2에서 알 수 있듯이 ‘용도 2’에서만 연면적을 사용하였다.

2009년 지진취약도함수[1]에서는 용도, 층수, 허가일자를 사용하여 구조 유형을 분류하였다. 층수와 허가 일자는 표제부에서 바로 제공하고 있으나 용도는 앞에서 알 수 있듯이 주용도와 기타용도로 구분되어 있다. 지진취약도함수[1]에서는 용도 중 아파트만을 구분하고 있으며, 아파트는 기타용도 항목에서만 제공하고 있다. Lee[10]에서는 표제부에서 주용도, 기타용도, 층수, 연면적, 허가 일자를 분류에 사용하였다. Lee[10]에서는 특히 용도를 이전[1]에 비해 더 상세하게 구분하여 분류에 사용하였다. Hong and Kim[11]에서도 용도를 Lee[10]와 유사하게 앞서 언급한 대로 크게 6가지로 구분하였다. 하지만, 표제부에서 용도는 매우 다양하게 제공하므로 분류 규칙을 적용하기 위해 재분류가 필요하다. Hong and Kim[11]에서는 앞에서 기술한 대로 표제부에서 제공하고 있는 용도를 크게 6가지로 구분하였다. 6가지로 구분하기 위해서는 표제부에서 제공하는 항목에서 주용도와 기타용도에서 제공하는 용도가 필요하다.

먼저 표제부에서 제공하는 주용도의 종류는 약 32가지 있다. 물론 32가지는 지금까지 파악한 숫자이며, 필요할 때마다 종류를 추가하므로 실제로는 이보다 더 많을 수 있다. 표제부에서는 주용도 명과 더불어 코드 번호도 1000에서 32000까지 제공하고 있다. 1000은 단독주택, 2000은 공동주택, 3000과 4000은 각각 1 및 2종 근생이다. 앞서 용도를 6가지로 구분할 때 주용도를 단독 및 공동 주택, 근생의 3가지로 나타내고 있으므로 32가지 용도를 3가지로 정리했다는 것이다. 단독주택은 코드 번호 1000이 부여된 용도를 그대로 사용하며, 공동주택은 2000번의 공동주택과 15000번의 숙박시설을 포함한다. 숙박시설의 구조 형식이 공동주택과 유사하기 때문이다. 근생은 앞서 단독과 공동주택에 해당하지 않는 모든 용도를 포함한다. 따라서 여기에는 3000과 4000의 제 1 및 2종 근생 외에 나머지 28개 용도 모두가 포함된다. 판매시설 또는 업무시설과 같은 용도의 구조 형식은 주택보다는 근생에 더 가까우므로 대부분의 용도를 근생에 포함하였다.

주용도와 함께 기타용도 항목도 사용하였는데, 기타용도는 주용도에 비해 세부적인 정보를 제공하기 때문이다. 그런데 기타용도는 주용도와 달리 용도 명과 코드 번호로 명확하게 구분되어 있지 않고, 매우 다양한 형태로 제공하고 있다. 그나마 아파트와 같이 구조 형식을 유추할 수 있을 때도 있지만, 보일러실, 창고 등과 같이 그렇지 않은 경우가 훨씬 많으므로 단순화하기가 쉽지 않았다. 더구나 건물 하나당 다양한 수의 기타용도를 제공하고 있어 더욱 쉽지 않았다. 이 연구에서는 다양한 기타용도를 최대한 그룹화해서 용도를 분류하는 데 도움이 되도록 하였다.

예를 들어 용도 1에서는 기타용도에 근생을 지칭하는 명칭이 없어야 하는데, 여기에는 근생, 사무실, 음식점, 소매 등의 명칭이 포함되며, 이들이 기타용도에 있으면 주용도가 단독주택이라도 용도 5에 해당하게 된다. 용도 1이 되려면 기타용도에 주택, 다가구, 단독과 같은 명칭이 있어야 한다. 용도 2는 공동주택인데 기타용도에 아파트가 있으면 용도 4에 해당하고, 근생이 있으면 용도 5, 도시형생활주택이 있으면 용도 3에 해당한다. 용도 2가 되려면 기타용도에 공동, 다세대, 숙박 등과 같은 명칭을 포함하고 있어야 한다. 이처럼 기타용도는 건물 한 동에 제공된 여러 명칭 중에서 특정 명칭의 포함 여부를 주용도와 결합해서 6가지 용도로 분류하는 데 사용되었다.

이미 언급한 대로 Hong and Kim[11]에서는 대용량 제공 표제부의 자료뿐만 아니라 층별 자료를 추가로 사용하였다. 층별 자료는 건축 HUB 공공 포탈의 “건축물대장(층별 개요)”[16]에서 취득할 수 있으며, 건물별로 층별 용도를 3가지 항목(주용도코드, 주용도코드명, 기타용도)으로 제공하고 해당 용도별로 면적(m²)을 제공하고 있다. 여기서 주용도는 표제부에 비해 더욱 다양하게 제공하고 있는데, 표제부의 주용도 코드 번호에서 마지막 3자리에도 0이 아닌 숫자를 부여하는 방식을 사용하고 있다. 예를 들어 4000은 제 2종 근생인데, 4001은 일반음식점, 4102는 체력단련장, 4402는 사무소 등이다. 기타용도는 코드 번호는 없으며, 주용도를 그대로 사용하거나 주용도명 뒤에 괄호를 사용하여 정보를 추가로 제공한다. 예를 들어 1003 다가구주택에서 기타용도는 다가구주택(4가구)와 같은 형식이다.

여기서는 “건축물대장(층별 개요)” 중에서 1층의 용도(주차장)와 면적(1층 면적 또는 1층 주차장 면적)이 필요하다. C5 유형을 분류하기 위해서는 건축면적에서 1층 주차장이 차지하는 비율을 알아야 하기 때문이다. 주차장 용도는 기타용도에서 제공되나, 주차장이 있더라도 주차장 용도나 주차장 면적이 제공되지 않는 때도 있었다. 따라서 Hong and Kim[11]에서는 주차장 면적이 제공될 때와 없을 때를 구분해서 1층 면적비(건축면적에 대한 주차장을 제외한 1층 면적의 비)를 다르게 계산하고, C5로 구분하는 1층 면적비의 기준값도 다르게 적용하였다.

지금까지 표제부에서 제공하는 항목 중 용도 부분을 상세하게 다룬 이유는 Hong and Kim[11]의 구조 유형 분류 규칙에서 건축물의 용도를 상세하게 구분하고 있기 때문이다. 건물 전체의 주용도 뿐만 아니라 기타용도를 사용하면 해당 건물의 구조 유형에 더 쉽고 빠르게 접근할 수 있다. 그리고 1층의 기타용도에 주차장이 있으면 C5 유형을 보다 정확히 구분할 수 있다. 또한 표제부나 층별 자료에서 용도의 수는 아주 많으므로 기계학습에 적용하기 위해서는 선 처리 작업을 통해 용도의 수를 축수하여 단순화할 필요가 있다.

4. 건축물대장표제부 자료 분석 및 처리

표제부[8]에서는 세움터[15]에 수록된 개별 건물의 정보를 모아서 하나의 대용량 파일로 국내 모든 건물의 정보를 표제부라는 제목으로 제공하고 있어 다양한 연구에 사용하기 편리하다. 표제부에서는 50여 개에 달하는 항목으로 정보를 제공하고 있는데, 건축물대장 자체의 기본 정보와 건물 주소, 건물의 규모 및 구조 형식, 에너지 등급과 관련한 항목을 포함하고 있다. 다음은 표제부에서 제공하는 항목들을 5가지 영역으로 분류하여 정리한 것이다.

•대장 정보 : 관리 _건축물대장_PK, 대장_구분_코드, 대장_구분_코드_명, 대장_종류_코드, 대장_종류_코드_명, 허가번호_년, 허가번호_기관_코드, 허가번호_기관_코드_명, 허가번호_구분_코드, 허가번호_구분_코드_명, 생성_일자
•위치 정보 : 대지_위치, 도로명_대지_위치, 건물_명, 시군구_코드, 법정동_코드, 대지_구분_코드, 번, 지, 특수지_명, 새주소_도로_코드, 새주소_법정동_코드, 새주소_지상지하_코드, 새주소_본_번, 새주소_부_번, 동_명
•건물 정보 : 주_부속_구분_코드, 주_부속_구분_코드_명, 주 용도_코드, 주 용도_코드명, 기타_용도, 대지면적(m²), 건축면적(m²), 건폐율(%), 연면적(m²), 용적률 산정_연면적(m²), 용적률(%), 블록, 로트, 외필지_수, 세대수(세대), 가구수(가구), 높이(m), 지상 층수, 지하 층수, 승용 승강기_수, 비상용 승강기_수, 부속 건축물_수, 부속 건축물_면적(m²), 총 동_연면적(m²), 옥내 기계식_대수(대), 옥내 기계식_면적(m²), 옥외 기계식_대수(대), 옥외 기계식_면적(m²), 옥내 자주식_대수(대), 옥내 자주식_면적(m²), 옥외 자주식_대수(대), 옥외 자주식_면적(m²), 허가일, 착공일, 사용승인일, 호수(호)
•구조 정보 : 구조_코드, 구조_코드명, 기타_구조, 지붕_코드, 지붕_코드명, 기타_지붕, 내진설계 적용 여부, 내진 능력
•기타 정보 : 에너지효율_등급, 에너지절감_율, 에너지_EPI점수, 친환경 건축물_등급, 친환경 건축물_인증점수, 지능형 건축물_등급, 지능형 건축물_인증점수

이 연구의 구조 유형 분류에 사용되는 자료는 대부분 건물 정보에 속해 있다. 물론 철근 콘크리트 구조, 강구조, 목구조 등을 구분하는 것은 구조 정보에서 알 수 있으나, 여기서는 철근 콘크리트구조로 한정했으므로 이미 구조 정보를 사용한 것으로 간주하였다.

기계학습에 사용하기 위해 표제부에서 제공하는 자료의 전처리가 필요하다. 표제부 자료 중 주용도와 기타용도는 범주형 자료 형식이다. 기계학습에서 사용하기 위해 주용도와 기타용도는 원-핫 인코딩(One-hot Encoding)을 통해 숫자형으로 변환하였다. 연면적, 지상층수, 및 건축면적은 숫자형 자료로서 특별한 변환 없이 그대로 사용하였다. 허가일은 다른 자료와 다르게 몇 가지 작업이 필요하였다.

먼저 표제부에서 일부 건물의 허가일이 빠져있었다. 허가일이 없을 때는 착공일, 착공일이 없을 때는 사용승인일을 허가일로 사용하였다. 이들 모두 빠져있을 때는 허가일을 1980년 1월 1일로 간주하였다. 다음으로는 허가일이 있지만 형식이 서로 다른 경우가 있었다. 표제부에서 허가일의 형식은 기본적으로 “20201204”와 같이 연월일을 나타내는 8자리 숫자로 되어 있으나, 일부는 “202012”, “ 2020”와 같이 연월의 6자리, 연도만 있는 4자리 숫자로 제공될 때도 있다. 이때는 각각 그 월의 첫째날짜, 그 연도의 첫째날짜로 지정하였다. 또한 8자리 숫자를 날짜로 인식하기 위해 datetime 객체로 변환하였고, 이를 기계학습을 위한 자료로 사용하기 위해 허가일 중에서 가장 오래된 날짜를 기준일로 설정하고 기준일로부터 경과일수를 계산하여 기계학습을 위한 자료로 사용하였다.

3장에서 언급한 대로 표제부 제공 자료 외에 C5를 분류하기 위해 “건축물대장(층별 개요)”에서 1층 면적과 1층 주차장 면적 자료를 사용하였다. 이들은 표제부에서 제공하는 건축면적과 함께 1층 면적비를 계산하는 데 사용되었다. 즉, 1층 면적비는 건축물대장 표제부[8] 및 층별 개요[16]에서 직접 값을 제공한 것이 아니라 1층 면적비 계산에 필요한 값을 추출한 후 계산 과정을 거쳤음을 주지한다. 1층 면적비는 숫자형 자료 형식이므로 그대로 기계학습에 사용되었다.

5. 기계학습을 사용한 구조 유형 분류 결과

5.1 기계학습 적용 개요

기계학습 적용을 위한 대상은 이전 연구[11]와 같은 건물과 동수를 사용하였다. Table 4에서 모수는 특정 행정구역의 전체 철근콘크리트구조 건물 동수인 12,586이다. 먼저 기존 규칙[10]을 적용하여 구조 유형을 분류한 결과는 Table 4의 첫 번째 행이다. 이 분류 결과를 반영한 ‘층화 샘플링 기법’을 사용하여 유형별로 표본을 추출한 결과가 두 번째 행이며, 전체적으로는 1,821동이다. 이 1,821동이 기계학습에 사용한 전체 표본 수다. “Road view”로 표시한 행은 표본을 대상으로 구조 유형을 확인한 결과이며, 기계학습에서 이를 정답으로 간주하였다. 하지만, 이 “Road view”의 분류 결과는 근본적인 한계를 지니고 있다.

로드뷰 확인을 통해 구조 유형을 분류할 때 특히 근생이 포함된 건물은 C2와 C4의 구분이 쉽지 않다. 그 이유는 모멘트골조인 것은 명확하나 C2와 C4를 구분하는 RC 전단벽의 유무를 건물 외관만으로 판단하기는 어렵기 때문이다. 그런데도 두 유형을 구분해야 하므로 간단한 규칙을 정하였다. 근생이 포함된 건물의 허가 연도가 2000년 이전이면서 건물 외장이 치장벽돌 또는 타일이면 C2로, 패널이면 C4로 분류하였다. 허가 연도가 2000년 이후이면서 근생이 포함되어 있으면 C4로, 주거 용도만 있으면 C3로 분류하였다. 대부분 5층 이하의 저층 건물에 해당합니다. 6층 이상이면 엘리베이터 코어가 있을 확률이 높으므로 허가 연도와 상관없이 근생이 포함되어 있으면 C4로 분류하였다.

이처럼 구조 유형을 실제 도면으로 확인한 것이 아니므로, 기본적으로 오분류의 가능성을 내포하고 있다. 특히 허가 연도 2000년 전, 후에 인접한 건물들은 RC 전단벽 사용 여부가 혼재되어 있어 상반된 유형으로 분류되었을 가능성이 있다. 또한 구조 유형 분류에 저자의 주관적인 판단이 개입되어 있으므로 그 결과에는 편견(Bias)이 포함될 수밖에 없다. 앞 단락에서 기술한 대로 그 편견이 포함된 자료는 나름의 규칙성을 지니고 있다. 만약 실제 구조 유형을 그대로 반영한 자료로 학습한 모델이 있다면, 이 연구의 기계학습 모델은 그 모델보다 정확도가 더 높을 수밖에 없다. 왜냐하면, 이 연구의 학습 자료는 저자의 편견이 포함된 일정 수준의 규칙성을 지니고 있고, 기계학습 알고리즘은 그 규칙성을 잘 따라서 모델을 작성할 것이기 때문이다. 따라서 이 연구의 결론에서 제시될 기계학습 모델의 정확도는 실제보다 더 높을 수 있음을 주지한다.

이 연구에서는 기존의 구조 유형 분류 규칙과 기계학습으로 개발한 모델의 차이를 비교하기 위해 다양한 변수 조합을 다음과 같이 사용하였다.

(1) P1[1]: 주용도, 층수, 및 허가 일자, 연면적
(2) P2[10]: 주용도, 기타용도, 층수, 및 허가 일자, 연면적
(3) P3[11]: 주용도, 기타용도, 층수, 및 허가 일자, 1층 면적비
(4) P4[11]: 주용도, 기타용도, 층수, 및 허가 일자, 1층 면적비, 1층 기타용도(추가)

(1)번은 지진취약도함수 개발 초기에 사용했던 4가지 변수의 자료 조합, (2)번은 (1)번에 기타용도를 추가한 자료 조합, (3)번은 (2)번에서 연면적을 제외하고 1층 면적비를 추가한 자료 조합, (4)번은 (3)번에 1층 기타용도를 추가한 자료 조합이다.

구조 유형 분류를 위해 적용한 기계학습 알고리즘은 2장에서 기술한대로 DT, RF, GB의 3가지이다. 개별 알고리즘의 전반적인 분류 성능을 파악하기 위해 정확도를 사용하였다. 정확도(Accuracy)는 전체 데이터 중에서 모델이 실제값과 일치하게 예측(참을 참으로, 거짓을 거짓으로)한 자료의 비율을 의미한다. 즉, 모델이 얼마나 많이 맞혔는가를 나타내는 가장 기본적이고 포괄적인 척도다. 다만, 구조 유형별 빈도 차이로 인한 자료 불균형 문제를 고려하여, 정확도뿐만 아니라 정밀도(Precision), 재현율(Recall), F1 점수(F1-score)를 함께 검토하여 모델의 신뢰성을 보다 상세히 확인하였다. 정밀도는 모델이 ‘참’으로 예측한 사례 중에 실제로 ‘참’인 비율이다. 재현율은 실제로 ‘참’인 사례 중에 모델이 얼마나 많이 찾아냈는지를 나타낸다. F1 점수는 정밀도와 재현율의 조화 평균이다.

이 연구에서는 3가지 기계학습 알고리즘을 단순히 적용하는 것에서 그치지 않고 모델의 일반화 성능을 극대화하기 위해 하이퍼파라미터 튜닝(Hyper-parameter Tuning)을 수행하였다. 기계학습에서 파라미터는 모델이 데이터를 통해 스스로 학습하는 값(예: 가중치)이지만, 하이퍼파라미터는 학습의 효율성과 모델의 복잡도를 제어하기 위해 사용자가 외부에서 지정하는 변수다. 이때 그리드 서치(Grid Search)와 K-폴드 교차 검증(K-Fold Cross-Validation)을 결합하여 예측 정확도가 가장 높은 최적의 하이퍼파라미터 조합을 도출하려 하였다.

5.2 기계학습 모델의 정확도 비교

앞 절에서 언급한 P1에서 P4까지의 변수 조합에 대해 3가지 알고리즘을 적용하였다. 알고리즘을 적용할 때 파라미터들은 통상적으로 사용하는 일반적인 값을 선택하였다. 먼저 훈련(Training)과 검증(Test) 세트의 정확도를 산정하여 Table 5에 정리하였다. 기계학습에서는 일반적으로 모델 작성을 위한 훈련에 전체 자료의 80%만을 사용하고, 모델이 작성된 후 검증은 나머지 20%를 사용한다. 여기서도 이처럼 일반적인 방식을 따랐다. P1과 P2에서는 훈련은 GB가 검증은 RF의 점수가 가장 높았다. 반면 P3과 P4에서는 훈련과 검증 모두 GB의 점수가 가장 높았다. 하지만 RF는 훈련과 검증의 점수 차이가 가장 작은 알고리즘이었다. RF는 모든 자료 조합에서 다른 알고리즘에 비해 그 차이가 가장 작았다. 이는 RF가 가장 안정적인 모델을 제공한다는 뜻이다. 반면 GB는 훈련 점수가 RF에 비해 상당히 높았지만, 검증 점수는 P3과 P4에서 RF에 비해 약간 높았을 뿐이다. 이러한 결과는 GB의 특성 때문인데, 앞선 트리의 ‘오차’를 계속해서 보완하며 학습하여 학습 횟수가 늘어날수록 훈련 데이터에 완벽하게 일치하려는 성향이 강하기 때문이다. 이 때문에 모델이 훈련 데이터에 포함된 개별 건물의 특이한 사례(노이즈)까지 다 외워버려서 새로운 자료(검증 세트)가 들어왔을 때 유연하게 대처하지 못하는 현상이 발생하는 것이다. RF의 훈련 정확도는 3가지 알고리즘 중에서 가장 낮았으나, 검증 단계에서는 GB와 점수 차이는 크지 않았다. 따라서 현 자료로 구조 유형 분류를 할 때 RF가 가장 안정적인 모델을 제공한다고 볼 수 있다. 자료 조합으로 비교하면 P1에서 P4로 갈수록 훈련과 검증의 정확도는 증가하고 있으므로 구조 유형을 분류에는 P4의 자료가 더 적합하다는 것을 알 수 있다.

알고리즘의 일반화 성능을 자세히 살펴보기 위해 검증 세트의 F1 점수를 산정하여 Table 6에 정리하였다. DT는 일부에서 동점을 얻었으나 최고 점수는 대부분 RF와 GB에서 나타났다. 하지만 Table 6에서 알 수 있듯이 F1 점수의 차이는 크지 않았다. F1 점수는 정밀도와 재현율의 조화 평균이므로 이들을 따로 Table 7에 정리하였다. 정밀도는 모델이 ‘참’으로 예측한 사례 중에 실제로 ‘참’인 비율이고, 재현율은 실제로 ‘참’인 사례 중에 모델이 얼마나 많이 찾아냈는지를 나타낸다. DT는 F1 점수에서는 가장 높을 때가 없었지만 정밀도와 재현율에서는 일부에서 나타났다. P1에서 P4로 갈수록 최고 점수의 위치가 RF에서 GB로 이동하였다. 이것은 Table 5의 F1 점수의 분포와 같다. 물론 RF와 GB의 정밀도와 재현율 차이는 크지 않다. 따라서 정밀도와 재현율의 차이가 작은 것도 안정적인 모델의 조건이라고 본다면, 여기서도 차이가 가장 작은 RF가 가장 안정적인 예측 모델을 생성한다고 할 수 있다.

마지막으로 구조 유형 간의 정확도를 비교하면, 타 유형보다 C5의 정밀도와 재현율이 낮다. 가장 큰 이유는 C2에서 C4까지의 표본은 전체 모수에서 적절한 비율을 차지하고 있지만 C5의 표본은 Table 4에서 알 수 있듯이 타 유형보다 매우 작다(전체에서 9.7%에 해당). C5 유형을 정확히 분류하는 데 필요한 정보가 충분하지 않은 것도 중요한 원인이지만, 여기서는 논외로 한다. 이러한 자료 불균형 상황을 극복하고, C5의 낮은 정확도를 올리기 위해 가중치를 부여한 하이퍼파라미터 튜닝을 적용하였다. C5 외 유형의 정확도는 비교적 높았으므로, C5에 가중치를 부여하여 튜닝 시 C5의 정확도를 높이는데 좀 더 집중하도록 하였다.

5.3 하이퍼파라미터 튜닝을 통한 모델 최적화

구조 유형 예측 모델의 성능 향상, 특히 C5의 정확도를 높이기 위해 하이퍼파라미터 튜닝을 적용하였다. 앞 절에 기술한 대로 3가지 알고리즘 중 RF의 훈련 및 검증 점수의 차이가 가장 작아 안정적이었다. 또한 타 알고리즘에 비해 RF는 불균형 자료의 한계를 극복하고 소수 유형의 판별력 강화를 위한 가중치 조절이 쉽다. 앞 절의 내용에서 알 수 있듯이 하이퍼파라미터 튜닝의 목적은 소수인 C5 유형을 좀 더 정확히 분류하는 것이다. 따라서 RF만을 대상으로 하이퍼파라미터 튜닝을 실시하였다.

하이퍼파라미터 튜닝 시 그리드 서치(Grid search) 방식을 적용하였는데, 각 파라미터에 대해 이론적으로 유효한 이산적 후보군(Discrete candidate values)을 사전 정의하고 이들의 모든 가능한 조합을 전수 조사한다. 이는 특정 수치 범위 내에서 임의의 값을 추출하는 방식보다, 주요 파라미터 변화에 따른 모델의 성능 변화를 체계적으로 분석하는 데 유리하기 때문이다. 더불어 하이퍼파라미터를 튜닝할 때 특정 자료에만 성능이 잘 나오는 과적합을 방지하기 위해 K-폴드 교차 검증(K-fold Cross-validation)을 병행하였다. 이는 자료를 K개로 나누어 번갈아 가며 학습과 검증을 반복함으로써, 어떤 자료가 들어와도 일정한 성능을 내는 최적의 하이퍼파라미터를 찾을 수 있다. 여기서는 K를 5로 사용하였다. 이러한 하이퍼파라미터 최적화에는 Scikit-learn 라이브러리[17]를 활용하였다.

튜닝에는 평가를 위한 목표 지표가 필요한데, 여기서는 평균 F1 점수를 사용하였다. 평균 F1 점수는 C2에서 C5까지 유형의 F1 점수를 평균한 값이다. 만약 단순하게 평균 F1 점수를 사용한다면 C2에서 C5까지 모든 유형을 골고루 잘 분류하는 방향으로 최적의 파라미터 값을 찾게 된다. 하지만 이미 언급한 대로 타 유형 보다 C5의 표본 수가 작고 정확도도 낮으므로 C5의 분류 정확도 개선에 좀 더 중점을 둘 필요가 있다. 따라서 여기서는 데이터 불균형으로 인해 판별력이 낮았던 C5 유형에 대해 하이퍼파라미터 튜닝 과정에 클래스 가중치(Class weight)를 부여하여 최적화를 수행하였다. 이 방법은 특정 유형이 틀렸을 때 벌칙을 다른 유형보다 더 크게 줘서 모델이 해당 유형의 학습에 더 집착하게 만든다. 여기서는 표본 수에 반비례하여 가중치를 부여(class_weight=’balanced’)함으로써, 모델이 표본 수가 작은 C5에 좀 더 집중하도록 하였다.

튜닝에 사용한 하이퍼파라미터와 그리드 서치 범위를 Table 8에 정리하였다. ‘max_depth’는 트리의 최대 깊이를 의미하며, 튜닝 전에는 10을 사용하였으나, C5의 복잡한 경계를 잡기 위해 더 깊은 범위를 지정하였다. ‘min_samples_leaf’는 리프 노드가 되기 위한 최소 표본 수로서 너무 작은 리프 노드가 생기지 않도록 조절하는 파라미터다. 너무 희귀한 사례에 대해 모델이 민감하게 반응하지 않도록 튜닝 전에 5를 사용하였으나, 표본 수가 작은 C5를 위해 더 작은 노드도 가능하도록 5보다 작은 값도 포함하였다. ‘min_samples_split’는 노드를 분할하기 위한 최소 표본 수이며 값이 커질수록 모델이 단순해진다. 모델이 단순할수록 일반화 성능이 높아지므로 큰 값이 바람직하나 C5 때문에 세밀한 분할이 가능한 값으로 지정하였다. ‘n_estimators’는 트리의 개수이며, 많을수록 성능은 안정화되지만 연산 시간이 늘어난다. 보통 100개면 충분하지만, 튜닝 시에는 더 많은 트리를 사용하도록 하였다. 튜닝을 통해 찾은 하이퍼파라미터의 최적값은 Table 8에 정리하였다. 여기서 평균 F1 점수는 검증 세트의 결과값이다.

튜닝 결과 최대 깊이는 P4를 제외하면 튜닝 전과 동일하였다. P4는 C5를 분류하기 위해 변수를 추가하였으므로 트리 깊이가 증가할 수밖에 없었다. 리프 노드가 되기 위한 최소 표본 수와 노드를 분할하기 위한 최소 표본 수는 모두 최적값이 낮게 형성되어 뚜렷한 차이는 없었다. 트리의 개수는 튜닝 전과 비교해서 모두 증가하였고 P1을 제외하면 모두 그리드의 최대값인 500으로 나타났다. 목표 지표(검증 세트의 평균 F1 점수)를 최대로 높이기 위해 많은 수의 트리가 필요했다는 것을 의미한다. 평균 F1 점수는 P3과 P4에서는 90점을 약간 웃돌았고 P1과 P2에서는 미달하였다. 이들은 각 유형의 F1 점수를 평균한 것으로 튜닝 전(Table 6 참조)과 비교하면 P1에서 P3까지는 증가하였고 P4는 약간 감소하였으나 차이는 크지 않았다.

좀 더 상세히 비교하기 위해 Table 9에 가중치를 부여한 하이퍼파라미터 튜닝을 거친 RF 알고리즘 모델의 검증 세트 정밀도, 재현율 및 F1 점수를 정리하였다. 튜닝 전의 결과(Table 6)와 비교하면, C2에서 C4까지는 튜닝으로 인한 점수의 상승이 뚜렷하지 않았으며 일부에서는 약간 감소도 하였다. 하지만 C5는 튜닝으로 의미 있는 상승을 보였다. P4에서 검증 정확도는 0.94를 유지하면서 튜닝 전 모델 대비 C5의 재현율은 0.81에서 0.86으로, F1 점수는 0.85에서 0.87로 유의미하게 향상되었다. 이는 모델이 표본 수가 작은 특정 구조 유형의 특징을 상대적으로 정밀하게 학습했음을 시사한다. 훈련/검증 정확도는 튜닝 전 0.946/0.942에서 0.965/0.940으로 격차가 0.004에서 0.025로 소폭 증가하였으나, 이는 전체 정확도의 손실 없이 분류 난도가 높은 소수 유형의 판별력을 극대화하는 과정에서 발생한 기회비용으로 판단된다. 결과적으로 가중치를 적용한 하이퍼파라미터 튜닝이 이 연구의 목적에 부합하는 최적의 모델을 구축하는 데 이바지하였다.

5.4 기계학습 결과 요약 및 분석

기계학습을 적용하여 구조 유형을 분류했을 때 P4 자료 조합을 RF 알고리즘으로 학습한 모델이 훈련과 검증의 점수 차이가 가장 작았다. 따라서 이 연구에서는 RF 알고리즘이 가장 적합한 것으로 나타났다. 하지만, 개별적으로 정확도를 확인했을 때 유형 간에 격차가 있었으며, 특히 상대적으로 수량이 작은 C5의 정확도가 낮았다. 이를 해소하기 위해 하이퍼파라미터 튜닝을 수행했으며, C5의 정확도 상승을 더 강조하기 위해 클래스 가중치를 부여하였다. 그 결과, 타 유형의 재현율은 약간 감소했지만 C5의 재현율은 크게 상승하였다. 따라서 클래스 가중치를 사용한 하이퍼파라미터 튜닝으로 기계학습 모델의 분류 정확도를 최대한 높일 수 있었다.

기존 연구[11]에서 매뉴얼로 작성한 분류 규칙과 이번 연구에서 사용한 기계학습 분류 모델의 성능을 비교하기 위해 혼동 행렬(Confusion Matrix)을 사용하였다. Fig. 4는 기존 연구[11]와 튜닝 전과 후 기계학습 모델의 결과를 나타내고 있는데, 행렬의 값들은 비율로 나타내었다. 한 가지 주지할 사항은 Fig. 4의 혼동 행렬은 검증 세트(Test set)가 아니라 전체 표본(Total sample)의 분류 결과라는 것이다. 모델의 일반화 성능 검증은 분할된 검증 세트(전체 표본의 20%)를 통해 수행하였으나(Table 5 ~ Table 9), 전체 건축물 자료에 대한 모델의 분류 일관성을 확인하고 유형별 오분류 특성을 상세히 분석하기 위해 전체 표본(n=1,821)을 대상으로 혼동 행렬을 도출하였다. 보통은 학습에 사용되지 않은 자료(검증 세트)에 대한 성능을 모델의 진정한 실력으로 판단하지만, 여기서는 모델이 전체 표본 내에서 각 구조 유형을 얼마나 일관되게 분류하는지, 그리고 어떤 유형 간의 경계가 모호한지 전수 분석하기 위해서 전체 표본에 관한 결과를 도출하여 비교하였다. 또 다른 주지 사항은 전체 표본에 대한 혼동 행렬의 수치는 검증 세트에 비해 소폭 높게 나타날 수 있다는 점이다.

Fig. 4의 혼동 행렬에서 대각선은 실제 유형을 모델이 그대로 예측한 비율을 나타내는데, 튜닝 전의 모델(a)은 매뉴얼(c)에 비해 C5를 제외하면 모두 높은 비율을 보였다. C5는 매뉴얼(0.87)에 비해 튜닝 전 모델(0.80)이 오히려 감소하였다. 앞서 언급한 대로 C5에 가중치를 부여하여 튜닝을 실시한 모델(b)은 C5의 예측 정확도가 0.94로 높아졌다. 즉, 실제 C5 유형 177개 중에서 94%인 약 166개 정도를 정확히 맞췄다는 의미다. 더불어 실제 C5인데 모델이 C 또는 C4로 잘못 예측한 비율도 감소했음을 알 수 있다. 이는 각 혼동 행렬의 C5 행에 나타나 있다. 매뉴얼(c)에서는 이 비율이 3%, 9%였는데, 튜닝 전 기계학습 모델에서는 모두 10%로 증가했다가 튜닝 후 모델에서는 2%, 3%로 많이 감소하였다. C5를 제외한 나머지 유형은 기계학습 모델의 잘못 예측한 비율이 튜닝과 상관없이 낮은 수준을 보였다.

Table 10은 전체 표본에 관한 이전 연구[11]와 이번 연구의 모델 정확도를 비교한 것이다. C2와 C3 유형은 큰 차이가 없으나 C4와 C5 유형은 특히 재현율에서 기계학습 모델이 매뉴얼 모델에 비해 크게 개선되었다. Fig. 4의 혼동 행렬에서 알 수 있듯이 매뉴얼 모델은 C4와 C5 유형을 가장 크게 혼동한다. 가중치를 부여하여 튜닝한 기계학습 모델은 이를 크게 개선하였다. 더불어 기계학습 모델은 C5의 정밀도도 크게 향상해 결과적으로 F1 점수를 0.85에서 0.92로 높여 구조 유형 분류에 매우 적합한 것으로 나타났다. 이렇게 기계학습 모델은 모든 구조 유형의 F1 점수를 90% 이상으로 나타내어 이전 연구[11]에 비해 분류의 정확도를 크게 높였다.

C5 유형 분류와 자료 조합 내 입력 변수와의 관계를 보다 자세히 살펴보았다. Table 9에서 알 수 있듯이 C5 유형의 정확도가 P3 자료 조합에서 급격히 상승한다. 그 이유는 P1과 P2에는 없던 1층 면적비가 P3에 포함되었기 때문이다. 하지만 3장에서 기술한 대로 1층 면적비는 한계가 있다. 1층에 주차장 있더라도 주차장 용도나 면적이 제공되지 않는 때가 있기 때문이다. 이를 극복하기 위해 Hong and Kim[11]에서는 주차장 면적이 제공될 때와 없을 때를 구분해서 1층 면적비를 다르게 계산하고, C5에 해당하는 1층 면적비의 기준값도 다르게 적용한 것이다. P3은 Hong and Kim[11]에서 산정한 1층 면적비를 그대로 사용한 것이다.

P4는 여기에 “건축물대장(층별 개요)”에서 제공하는 “1층 기타 용도”를 추가한 것이다. C5 건물일 때 1층 기타 용도에 주차장과 계단실이 가장 많이 나타났기 때문이다. 그런데 이들 용도일 때 “건축물대장(층별 개요)”에서 제공하는 1층 면적에 약간의 차이가 있었다. 따라서 이 두 용도를 구분하여 P4에 변수로 추가하였다. 1층 기타 용도에 주택이 있을 때는 478개 대상 건물 중 10개만이 C5이었으므로 주택도 변수에 포함하였다. 아파트일 때는 C5가 단 하나도 없었으므로 아파트도 변수에 포함하였다. “건축물대장(층별 개요)”에서 제공하는 “1층 기타 용도”는 매우 많은 종류의 용도를 제공하고 있는데, 위에 언급한 용도 이외 나머지는 상관관계를 파악하지 못해 모두 기타로 분류하였다. 즉, P4에는 P4의 입력 변수에 주차장, 계단실, 주택, 아파트, 기타의 5가지 용도가 추가되어 있다.

이렇게 C5 유형 분류에 영향을 크게 미치는 1층의 용도를 추가한 P4에서 C5 유형의 정확도가 가장 높게 나타난 것이다. 하지만 여전히 타 유형과 비교하면 정확도는 상대적으로 낮다. 타 유형은 정확도가 90%를 초과하지만, C5는 90% 미만에 머물고 있다. C5 유형뿐만 아니라 모든 유형의 분류 정확도를 향상하기 위해서는 입력 변수들이 최종 분류 결과에 미치는 영향력을 정량적으로 평가하는 특성 중요도(Feature Importance) 분석이 필요하다. 특성 중요도 분석에서는 각 변수의 기여도를 검토한 후, 핵심 변수를 중심으로 자료 구성을 최적화하거나 불필요한 노이즈를 제거할 수 있다. 이를 통해 향후 연구에서는 모델의 효율성을 더 높일 수 있을 것이다.

6. 결 론

이 연구에서는 건축물대장표제부에서 제공하는 자료를 이용해서 건축물의 구조 유형을 분류할 때 기존의 매뉴얼로 작성한 분류 규칙을 최신 기계학습 알고리즘을 사용하여 분류 모델을 만드는 것을 목표로 하였다. 연구에서는 분류에 적합한 기계학습 알고리즘으로 DT, RF, GB 3가지를 선택하였으며, 하이퍼파라미터 튜닝을 통해 자료 특성에 맞는 최적화된 모델을 개발하려 하였다. 학습 자료는 기존 연구에서 사용했던 간단한 조합(P1)부터 다소 복잡한 조합(P4)까지 4가지를 사용하였다.

연구 결과 알고리즘 종류와 상관없이 P4 조합이 가장 높은 성능을 보였다. 가장 높은 성능을 보인 P4 조합을 대상으로 알고리즘별 정확도를 비교하면 DT에 비해 RF와 GB의 정확도가 상대적으로 높았다. RF와 GB를 비교하면 훈련 점수는 GB가 높았으나 훈련과 검증 점수의 차이는 RF가 매우 작아 매우 우수한 일반화 성능을 보였다. 이는 건축물 구조 유형 분류에서 자료의 복잡한 노이즈에 민감하게 반응하는 GB 모델보다, 앙상블을 통해 분산을 감소시키는 RF 모델이 더욱 강건(Robust)하고 신뢰도 높은 예측을 제공함을 보여준다. 이에 따라 이 연구에서는 P4 조합과 RF 알고리즘의 결합을 최적의 분류 모델로 제안한다.

더 나아가 이 연구에서는 구조 유형 분류의 정밀도를 높이기 위해 기계학습 모델의 최적화를 시도하였다. 특히 표본 수가 적어 잘못된 분류의 발생 빈도가 높았던 C5 유형에 대해 클래스별 가중치를 적용한 그리드 서치(Grid Search)를 수행하였다. 최종적으로 선정된 RF 모델은 전체 정확도 높게 유지함과 동시에 C5 유형의 재현율을 94%까지 확보함으로써, 자료 불균형 문제를 효과적으로 극복하였다. 이전 연구[11]에서도 언급되었는데, C5는 특히 지진에 취약한 구조 유형이므로 정확한 분류가 더욱 필요하다. 이러한 결과는 향후 건축물 구조 유형 데이터베이스 구축 시, 희소한 구조 유형에 대한 분류 신뢰도를 높이는 데 이바지할 수 있을 것으로 기대된다. 다만, 기계학습을 위해 사용한 기초자료는 본문에서 언급한 대로 실제 도면을 근거로 마련된 것이 아니라 개별 건물의 용도 및 허가 연도와 로드뷰(Road view)로 확인한 건물의 외관을 바탕으로 저자의 주관적인 판단이 작용한 것이다. 따라서 이 연구에서 나타난 구조 유형별 비율은 향후 더 정밀한 자료가 제공되었을 때 변할 수 있음을 주지한다.

이번 연구의 성과에도 불구하고, 향후 모델의 분류 고도화 및 실무 적용성 강화를 위해 보완해야 할 과제들이 있다. 먼저 이번 분석에서는 입력 변수들이 최종 분류 결과에 미치는 영향력을 정량적으로 평가하는 특성 중요도(Feature Importance) 분석을 수행하지 않았다. 향후 연구에서는 이를 통한 최적화된 자료를 사용하여 모델의 효율성을 높일 필요가 있다. 또한, 타 유형과 비교하면 상대적으로 표본 수가 부족한 C5 유형의 데이터를 추가로 확보하여 데이터 불균형 문제를 근본적으로 해소할 필요가 있다. 이러한 데이터 확충과 변수 최적화는 분류 난도가 높은 소수 유형에 대한 예측 신뢰도를 한층 더 높이는 핵심적인 후속 연구가 될 것이다.

Figure

Fig. 1.

Conceptual drawing of a decision tree algorithm

Fig. 2.

Flowchart of classifying reinforced concrete residential-only buildings[11]

Fig. 3.

Flowchart of classifying reinforced concrete buildings excluding residential-only use[11]

Fig. 4.

Normalized confusion matrix for P4 and total sample (n=1821)

Table

Table 1.Classification of concrete structures [1]

Name	Structural type
C1	Concrete moment frame
C2	Concrete moment frame with unreinforced masonry infilled wall
C3	Concrete shear wall
C4	Concrete moment frame with concrete shear wall
C5	Concrete shear wall with piloti

Table 2.Key differences between machine learning (ML) and deep learning (DL)

Category	Machine Learning (ML)	Deep Learning (DL)
Concept/Scope	Sub-field of AI (Includes linear regression, SVM, etc.)	Sub-field of ML (Uses deep neural networks)
Feature extraction	Human-driven feature engineering (Feature engineering)	Neural network autonomously learns and extracts features
Data processing	Suitable for relatively structured data and simpler problems	Effective for large-scale unstructured data (images, voice)
Complexity/Resources	Relatively simpler algorithms, requires less computational resources	Complex deep neural networks, demands massive data/high-performance hardware
Application fields	Simple prediction/classification (Spam filtering, Credit scoring, Product recommendation)	High-dimensional recognition (Image/Voice recognition, NLP, Autonomous driving)

Table 3.Characteristics and trade-offs of key algorithms

Algorithm	Characteristics	Main advantages	Main disadvantages
Decision Tree	A tree-structured model that generates rules by repeatedly splitting data based on specific criteria	Easy model interpretation, intuitive understanding, no need for data scaling	High risk of over-fitting, instability (sensitive to data changes)
Random Forest	Creates multiple decision trees and aggregates their votes for final prediction (Bagging-based ensemble)	Prevents over-fitting, high prediction accuracy, stable performance	Increased computation due to multiple trees, harder interpretation than a single tree
Gradient Boosting	Sequentially builds trees, with each new tree correcting the errors of the previous ones (Boosting-based ensemble)	Very high prediction performance (especially in complex data), strong generalization ability	Prone to over-fitting (Hyper-parameter tuning is crucial), long training time, difficulty with parallel processing

Table 4.Number of each structural type for population and sample

Type	C2	C3	C4	C5	Total
Population	8,020	1,467	581	2,518	12,586
Sample	572	457	266	526	1,821
Road view	449	594	601	177	1,821

Table 5.Accuracy check for training and test sets by machine-learning algorithms w/o hyper-parameter tuning

Type	DT	RF	GB
P1[1]	Training	0.918	0.883	0.935
Test	0.808	0.847	0.833
P2[10]	Training	0.959	0.929	0.965
Test	0.866	0.885	0.874
P3[11]	Training	0.961	0.938	0.979
Test	0.907	0.915	0.923
P4[11]	Training	0.977	0.946	0.990
Test	0.923	0.942	0.942

Table 6.F1-scores for test set by machine-learning algorithms w/o hyper-parameter tuning

Type	C2	C3	C4	C5
P1[1]	DT	0.96	0.82	0.78	0.35
RF	0.97	0.86	0.83	0.52
GB	0.97	0.85	0.80	0.52
P2[10]	DT	0.96	0.89	0.87	0.50
RF	0.97	0.91	0.89	0.51
GB	0.96	0.89	0.88	0.52
P3[11]	DT	0.96	0.91	0.91	0.75
RF	0.96	0.90	0.93	0.79
GB	0.97	0.92	0.92	0.82
P4[11]	DT	0.97	0.92	0.94	0.75
RF	0.96	0.94	0.96	0.85
GB	0.97	0.93	0.95	0.85

Table 7.Precision and recall for test set by machine-learning algorithms w/o hyper-parameter tuning

* Precision, ** Recall

Type	Metric	C2	C3	C4	C5
P1[1]	DT	P*	0.98	0.78	0.74	0.60
R**	0.94	0.86	0.82	0.25
RF	P	0.98	0.86	0.79	0.64
R	0.96	0.86	0.88	0.44
GB	P	0.97	0.88	0.77	0.57
R	0.98	0.82	0.84	0.47
P2[10]	DT	P	0.98	0.83	0.89	0.57
R	0.94	0.95	0.85	0.44
RF	P	0.99	0.85	0.87	0.74
R	0.96	0.97	0.90	0.39
GB	P	0.97	0.85	0.86	0.68
R	0.96	0.93	0.89	0.42
P3[11]	DT	P	0.96	0.85	0.96	0.81
R	0.96	0.98	0.86	0.69
RF	P	0.97	0.85	0.95	0.93
R	0.96	0.96	0.91	0.69
GB	P	0.98	0.87	0.96	0.88
R	0.97	0.97	0.89	0.78
P4[11]	DT	P	0.98	0.88	0.96	0.81
R	0.96	0.97	0.93	0.69
RF	P	0.97	0.92	0.96	0.91
R	0.96	0.96	0.96	0.81
GB	P	0.98	0.91	0.97	0.91
R	0.97	0.97	0.94	0.81

Table 8.Optimal value of hyper-parameters for RF algorithm

Parameter	No tuning	Range	Optimal value
max_depth	10	[10, 15, 20, None]	10	10	10	20
min_samples_leaf	5	[1, 2, 5]	2	1	1	2
min_samples_split	-	[2, 5, 10]	2	2	5	2
n_estimators	100	[200, 300, 500]	200	500	500	500
Average F1-score (%)	81	86	92	91

Table 9.Precision, recall, and F1-scores for test set by RF w/ hyper-parameter tuning

Type	C2	C3	C4	C5
P1[1]	P	0.99	0.87	0.83	0.56
R	0.96	0.87	0.79	0.69
F1-score	0.97	0.87	0.81	0.62
P2[10]	P	0.99	0.85	0.89	0.64
R	0.94	0.97	0.87	0.44
F1-score	0.97	0.91	0.88	0.52
P3[11]	P	0.97	0.88	0.96	0.85
R	0.96	0.95	0.90	0.81
F1-score	0.96	0.91	0.93	0.83
P4[11]	P	0.97	0.93	0.95	0.89
R	0.96	0.95	0.94	0.86
F1-score	0.96	0.94	0.95	0.87

Table 10.Comparison of accuracy for total sample by manual and RF w/ weighted hyper-parameter tuning

Type	C2	C3	C4	C5
Stock	449	594	601	177
Classification	473	450	619	589	545	595	184	187
Precision	0.94	0.98	0.90	0.96	0.96	0.97	0.84	0.89
Recall	0.99	0.98	0.94	0.95	0.87	0.96	0.87	0.94
F1-score	0.97	0.98	0.92	0.96	0.91	0.96	0.85	0.92

Reference

National Emergency Management Agency. Development of fragility function of domestic building structures; c2009.
Yang W, Yi W. Damage pattern analysis of buildings by tsunami. J. Korean Soc. Hazard Mitig. 2013 Dec;13(6):51-56.
Kim GY. A study on data collection and prediction of seismic risk assessment system. J Digit Contents Soc. 2020 Aug;21(8):1495-1500.
Shin J. AI-based engine for regional seismic assessment of building structures, TRKO202400007863. National Research Foundation of Korea; c2024.
Hahn S, Choi I, Chang H, Kim J. Development of seismic fragility framework for piloti-type buildings based on structural parameters. J Earthq Eng Soc Korea. 2025 Jan;29(1):91-97.
Federal Emergency Management Agency. Hazus®–MH 2.1, Advanced engineering building module. Available from: http://www.fema.gov/plan/prevent/hazus
Architectural Institute of Korea. Korean Building Code - Structural; c2005.
Ministry of Land, Infrastructure and Transport. Building register, Title book; c2025. Available from: https://www.hub.go.kr/portal/opn/lps/idx-lgcpt-pvsn-srvc-list.do
9 . Kim T. A classification methodology o f structural t ypes o f RC buildings for improving seismic fragility functions. J Earthq Eng Soc Korea. 2020 Nov;24(6):285-92.
Lee K. Development of social and economic effect prediction methodology due to large earthquakes, 2020-MOIS31-013. National Disaster Management Research Institute; c2021.
Hong SY, Kim T. Improvement of the classification method for structural types of domestic reinforced concrete buildings. J Earthq Eng Soc Korea. 2026 Jan;30(1):1-10.
Ministry of Land, Infrastructure and Transport. Architectural HUB, Map service. Available from: https://www.hub.go.kr/portal/gis/bld/idx-bld-list.do
Python Software Foundation. Python language reference, version 3.x. Available from: http://www.python.org
Google. Google Colaboratory. Available from: https://colab.research.google.com/
Ministry of Land, Infrastructure and Transport. Se-um-tor; c2025. Available from: https://www.eais.go.kr
Ministry of Land, Infrastructure and Transport. Building register, Floor overview; c2025. Available from: https://www.hub.go.kr/portal/opn/tyb/idx-bdrg-flr.do
Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O, Blondel M, Prettenhofer P, Weiss R, Dubourg V, Vanderplas J, Passos A, Cournapeau D, Brucher M, Perrot M, Duchesnay E. Scikit-learn: Machine learning in Python. J Mach Learn Res. 2011;12:2825-30.

Journal Abbreviation J. Earthq. Eng. Soc. Korea
Frequency Bimonthly
Doi Prefix 10.5000/EESK
Year of Launching 1997
Publisher Earthquake Engineering Society of Korea

Indexed/Tracked/Covered By

Online Submission

submission.eesk-j.or.kr

EESK

Earthquake Engineering Society of Korea

Type	C2		C3		C4		C5
Type	[11]	M–L	[11]	M–L	[11]	M–L	[11]	M–L
Stock	449		594		601		177
Classification	473	450	619	589	545	595	184	187
Precision	0.94	0.98	0.90	0.96	0.96	0.97	0.84	0.89
Recall	0.99	0.98	0.94	0.95	0.87	0.96	0.87	0.94
F1-score	0.97	0.98	0.92	0.96	0.91	0.96	0.85	0.92

SITE MAP