위급 상황이 발생하였을 때 시민들을 지켜보고 있는 것은 CCTV입니다. 현재 서울 내 CCTV가 많이 설치되어 있지만 자치구별로 많게는 3배 넘게 차이가 나는 것으로 나타났습니다. 이로 인해 어떤 자치구는 CCTV 개수의 부족으로 사각지대가 형성되어 범죄에 취약한 장소가 생기고, 사각지대에서 발생하는 범죄는 파악하는 데 어려움이 있습니다. 이를 보완하기 위해서는 CCTV가 영상인 시각정보만을 활용하는 것이 아니라 음성 정보까지 활용하면 위급 상황이 발생하였을 때 더 넓은 범위를 감시하면서 더 빠르게 상황을 파악할 수 있을 것입니다.
또한 CCTV가 방범의 역할을 하고 있긴 하지만 CCTV만으로는 위급 상황시에 빠른 대처가 어렵습니다. 따라서 최근 CCTV에 인공지능 기술이 활용되어 위급 상황을 탐지하는 연구들이 있지만 시각 정보만을 기반으로 하는 시스템이 많습니다. 이런 시스템의 단점은 시각적 정보만으로 상황을 판단하는 데에는 한계가 있다는 것과 여전히 사각지대의 일은 탐지할 수 없다는 것입니다.
이러한 동기를 바탕으로, 음성 정보를 이용하여 주변 환경의 위급 상황을 인지하고 구체적인 범죄나 응급의료 등의 상황을 예측하는 위급 상황 탐지 모델을 제작했습니다.
프로젝트에 대한 상세한 설명은 하기링크에서 확인하실 수 있습니다.
https://abounding-tennis-da0.notion.site/a1f9b298e4534b89930ca5318210efe2?pvs=4