제 목 | 강재모 교수팀 CVPR 주관 국제 인공지능 경진대회 우승 | ||||
---|---|---|---|---|---|
작성자 | 관리자 | 작성일 | 2024-07-03 | 조회수 | 1257 |
첨부파일 | |||||
강재모 교수팀(팀명: DeLTA Lab, 구성원: Jamshid Tursunboev 박사과정, 최현민 석사과정, 문성환 교수, Il-Min Kim 교수, 강재모 교수)은 2024년 6월 미국 시애틀에서 열린 인공지능 및 컴퓨터비전 분야 최고 학술대회인 CVPR(Computer Vision and Pattern Recognition)에서 주관한 제10회 SoccerNet Challenge의 "Dense Video Captioning" 경진대회에서 세계 1위를 차지하였다. 왼쪽부터 Jamshid Tursunboev 박사과정, 최현민 석사과정, 문성환 교수, Il-Min Kim 교수, 강재모 교수 2015년에 처음 열린 이 경진대회에서는 2월부터 5월까지 4개월간의 기간동안 세계 각국의 42개 팀이 경쟁하였다. 강재모 교수팀은 GPT기반의 혁신적인 VLM(Visual Language Model)을 개발하여 축구경기 영상에서 일어나는 행위를 분석하고 각 장면에 대하여 상세한 설명을 정교하게 생성하는 딥러닝 모델을 개발하였다. 종래의 사전 훈련된 거대언어모델(LLM)은 축구 중계에 적용이 될 때 문맥을 벗어나는 문장을 생성하는 문제를 가지고 있다. 이를 개선하기 위하여 test-time adaptation 기법을 통해 텍스트 임베딩 모델을 데이터셋에 적응(adaptation)시켜 만들어내는 토큰으로 transformer decoder와 GPT-2를 미세조정해 문맥에 맞는 문장을 생성하여 기존 성능 한계를 돌파하고 비약적인 성능의 향상을 이루었다. 이러한 인공지능 기술의 개발을 통해 downstream task에 딥러닝 모델을 활용할 때 미세조정에 들이는 시간과 자원을 줄일 수 있어 스포츠 방송 분석 분야와 다양한 관련 분야에 큰 파급효과가 있을 것이라 기대된다. |
|||||
[좋아요 1 ] |