홈 > 게시판 > NEWS

경북대학교 IT대학 전자공학부NEWS

게시판 보기
제 목 공무경, 김강우, 박상재 석사과정생(지도교수 강재모), AI Frontier Challenge 2025 장려상 수상
작성자 관리자 작성일 2025-11-24 조회수 391
첨부파일


강재모 교수 연구팀(DeLTA LAB)의 석사과정 학생들(공무경, 김강우, 박상재)이 '(사)한국인공지능학회 AI Frontier Challenge 2025'에서 혁신적인 2단계 음성 복원 AI 프레임워크를 제시하며 장려상(상금 50만 원)을 수상하는 쾌거를 이루었다.

이 연구는 고속도로, 공장, 게임장 등 극저 SNR(신호 대 잡음비) 환경에서 수집된 음성 대화를 명료하게 복원하고 인식할 수 있는 AI 모델 개발을 목표로 진행되었다. 연구팀은 참가자들이 고속도로, 공장, 게임장 등 강한 소음 환경에서 수집된 음성 데이터를 개선하여, 원래의 대화 내용을 보다 명확하게 복원하는 모델을 구현해야 하는 과제를 성공적으로 수행했다.

2단계 음성 복원 구조를 통한 극한 환경 강건성 확보
본 연구팀은 기존의 단일 모델 기반 음성 복원 방식이 저 SNR 환경에서 구조적 왜곡, 발음 불명확성, 및 할루시네이션 발생 등의 한계를 보였던 점을 해결하고자 했다. 또한, 연구팀은 극한 소음 환경에서 안정적인 신호 복원을 수행할 수 있는 확산 기반 잡음 제거 모델(SGMSE)을 훈련 및 1단계에 적용하여 음성의 기본적인 파형 구조와 물리적 특징을 보존한 저왜곡 베이스 신호를 생성다. 이후 2단계에서는 화자의 언어적, 발음적 특징을 반영하기 위해 HuBERT 모델, wav2vec2 등 Self-Supervised Learning(SSL) 기반 음성 모델을 활용하여 고차원 음성 임베딩을 추출하고 , 이를 Diffusion 기반 명료화 모델의 조건 블록으로 사용했다. SSL 임베딩은 발음 구조, 음소 전환 정보, 말소리의 의미적 패턴을 안정적으로 제공한다. 이를 통해 연구팀은 극저 SNR 환경에서도 구조적 일관성과 의미적 품질을 모두 확보 가능한 고신뢰 음성 복원 프레임워크를 구축하고자 했다.

이번 대회 수상 통해 연구팀은 Diffusion 모델 운용, 소음 환경 음성 처리, 특성 기반 표현 학습 등 향후 연구 수행에 필요한 핵심 기술 및 개념 개발하여 지역 사회에 공헌을 할 것이라 생각된다. 또한, 데이터 구축, 모델 비교, 성능 평가 등 연구의 기본 절차를 익혀 향후에 진행할 프로젝트나 학위 연구 수행에 기반이 될 것으로 기대된다. 


DeLTA LAB (강재모 교수 연구실) 홈페이지: https://sites.google.com/view/jmkang


[좋아요 0 ]
댓글 ( 0 )
댓글 등록 폼
덧글 입력박스
유동형 덧글모듈
목록

저작권정보

41566 대구광역시 북구 대학로 80 경북대학교TEL : 053-950-5506FAX : 053-950-5505
COPYRIGHT(C) 2015 SEE.KNU.AC.KR. ALL RIGHTS RESERVED.

맨위로 이동