학부생이 주도하여 SCI급 저널 MDPI electronics에 논문을 게재하는 것은 정보보호학 분야에서 큰 성과입니다. 2026년 현재, 이러한 연구는 다국어 스팸 메시지 탐지를 위한 딥러닝 모델과 시각화 기술을 중심으로 진행되고 있습니다.
다국어 스팸 메시지 탐지를 위한 시각화 기술 및 딥러닝 연구란 무엇인가요?
본 연구는 MDPI electronics 저널에 등재된 것으로, 학부생들이 주도하여 완성한 결과물입니다. 기존의 스팸 메시지 탐지 연구와 달리, CNN(Convolutional Neural Networks) 2D 모델을 활용하여 시각화 전처리 과정을 거친 것이 특징입니다. 이를 통해 한국어뿐만 아니라 영어 등 다국어 스팸 메시지 탐지의 정확도를 높이는 딥러닝 모델을 개발했습니다. 이 과정은 4학기에 걸쳐 진행되었으며, 문제 기반 학습(PBL)을 통해 팀을 이루어 진행되었습니다.
연구를 시작하게 된 계기와 목표는 무엇이었나요?
관련 글
이 연구는 2년 전, 스미싱(SMS와 Phishing의 합성어)이 사회적 이슈였던 시기에 시작되었습니다. 연구팀은 인공지능 분야를 스미싱 문제 해결에 접목하고자 했으며, 단순한 스팸 분류를 넘어 글로벌 시대에 맞춰 다국어를 탐지할 수 있는 모델 개발을 목표로 삼았습니다. 이에 따라 연구 분야를 다국어 스팸으로 확장하고, 영문 투고를 목표로 논문을 작성했습니다.
기존 스팸 탐지 모델과 차별화되는 시각화 전처리 과정은 무엇인가요?
기존 스팸 탐지 모델은 주로 언어 자체를 해석하는 방식으로 작동했습니다. 하지만 본 연구팀은 이 해석 과정을 줄이기 위해 스팸 메시지를 컴퓨팅 언어 코드로 이미지화하는 방식을 채택했습니다. 즉, 스팸 메시지를 컴퓨터 코드로 변환하고, 이를 다시 이미지 비트로 변환하는 과정을 거칩니다. 이렇게 생성된 이미지를 다른 데이터와 비교함으로써 스팸 탐지 해석 과정을 간략화하고, 보다 효율적인 딥러닝 모델을 구축할 수 있었습니다.
연구 정확도 향상을 위한 모델 비교 및 시행착오는 어떠했나요?
연구의 정확도와 효율성을 입증하기 위해 다양한 모델 비교 연구를 진행했습니다. 이미지 기반 탐지 모델뿐만 아니라 기존의 문자 기반 탐지 모델 연구도 병행했습니다. 대표적으로 CNN 2D 모델과 문자 기반 탐지에 사용되는 RNN, LSTM, CNN 1D 모델을 비교 분석했습니다. 또한, 데이터셋 변화, 언어별 성능 차이 등도 면밀히 검토했습니다. 이 과정에서 수많은 시행착오를 겪었으며, 모델 세부 사항 조정을 위해 사이버 보안 빅데이터센터를 방문하고 5만 개에 가까운 데이터를 직접 처리하는 등 많은 노력을 기울였습니다.
공유하기
💬자주 묻는 질문
MDPI electronics에 게재된 학부생 논문의 핵심 내용은 무엇인가요?
연구를 진행하게 된 계기는 무엇이며, 목표는 무엇이었나요?
기존 스팸 탐지 모델과 비교했을 때 시각화 전처리 과정의 장점은 무엇인가요?
정확도 향상을 위한 모델 비교 과정에서 어떤 어려움이 있었나요?
원문 작성자











