본교 SW 기자단에서는 분기당 1개의 S-Lab 탐방을 진행하고 있습니다.

이번 S-Lab 탐방에서는 국내 최초로 딥러닝 연구를 시작한 연구실,  김인중 교수님의 Deep-learning Lab.(DL-Lab) 랩장 강민수 대학원생을 만나보았습니다.

1.  S-Lab의 이름과 뜻은 무엇인가요?

S-Lab의 이름은 Deep-learning Lab.(DL-Lab, 딥러닝 연구실)입니다. 딥러닝 전반에 대해 연구하고 있고, 연구에 참여하는 연구원들이 깊게 문제를 알고 해결하는 방법론을 배워나가는(deep-learning) 연구실이기에 Deep-learning Lab.이라는 이름을 붙였습니다.

 

2.  지도 교수님에 대해서 소개해주세요.

연구실의 지도교수님이신 김인중 교수님께서는 카이스트에서 전산학 박사학위를 받으셨고, 딥러닝 및 머신러닝 기술 전반의 이론과 적용에 관심이 있으십니다. 학생들에게 깊은 신뢰를 주시고 학생들의 성장에 대해 관심이 많으셔서 많은 것들을 가르쳐 주시고자 항상 노력하십니다.

 

3.  구성원들과 S-Lab의 장점을 소개해주세요.

전문성

국내 최초로 딥러닝 연구를 시작한 연구실입니다. 딥러닝의 핵심 분야인 이미지, 자연어, 음성 등에 대한 여러 기술들을 연구해 왔습니다.

풍부한 컴퓨팅 인프라

딥러닝(머신러닝) 연구를 수행하기 위해서는 많은 수의 고성능 컴퓨팅 자원이 필요합니다. 본 연구실은 10개 이상의 서버와 60개 이상의 GPU를 보유하고 있어 컴퓨팅 자원의 제약 없이 다양한 연구를 수행 가능합니다.

다양한 협력 기관과 연구 과제

본 연구실은 국내의 다양한 기업 및 연구기관들과 협력하여 산업계의 문제들을 해결하고 있습니다. 대표적인 협력기관은 아래와 같습니다.

화목한 분위기

연구실의 구성원들은 나이, 프로젝트, 석사/학사에 관계없이 한 공간에서 생활합니다. 연구실 보다는 “연구 동아리” 같은 화목한 분위기 속에서 함께 성장하고 누군가 모르는 것이 있으면 서로 알려주기 바쁩니다. 또한, 매 방학마다 함께 랩 outing을 하기도 하고, 맛있는 식사를 함께 하거나 음식 나눔, BBQ 등을 통해 동료들과의 우정을 다집니다.

 

4.  S-Lab의 주된 분야와 목표를 소개해주세요.

본 연구실은 딥러닝(혹은 머신러닝) 전반의 이론과 그 적용에 대해 연구합니다. 최신 딥러닝 기술의 습득 및 문제점 개선, 산학 과제 연구 목표 달성, 연구실 구성원의 문제 해결 능력 성장 등이 Deep-learning Lab.의 목표입니다.

 

5.  현재 진행중인 S-Lab 프로젝트들에 대해서 소개해주세요.
Neural Text-to-Speech(TTS) Synthesis (음성합성)

TTS는 사용자로부터 자연어 문장(예: “안녕하세요.”)을 입력받고, 이를 자연어 문장에 대응되는 음성으로 변환하는 문제입니다. 본 연구실에서는 TTS와, 그와 관련된 문제들(발화 화자 변환, 음성 스타일 모델링 등)을 해결하고자 노력하고 있습니다.
Few-shot learning을 통한 얼굴 영상 인식

얼굴 영상 인식은 입력된 얼굴의 신원을 인식하는 방법을 학습하는 문제입니다. 하지만, 딥러닝을 활용한 얼굴 영상 인식 문제는 모델을 학습하기 위한 데이터의 수가 많아야 합니다. 그러므로, 소수의 데이터 만으로 좋은 성능을 내기 위한 방법론인 Few-Shot Learning을 적용하여 소수의 얼굴 이미지 데이터만으로 얼굴 인식을 학습하는 방법을 연구하고 있습니다.
Real-time semantic segmentation

semantic segmentation이란 영상을 입력으로 받고 영상의 각 픽셀을 특정 클래스(예, 이미지에서의 강아지, 고양이 등)로 구분하는 문제입니다. 하지만 Deep-learning을 이용한 semantic segmentation  모델은 결과(output)를 내기까지 많은 시간과 컴퓨팅 자원을 소비합니다. 그러므로 제한된 컴퓨팅 자원만을 사용할 수 있는 환경(예시: 자율주행 등)에는 적용하기 어려울 수 있습니다. 본 연구는 이 문제를 해결하고자 실시간 환경에서 사용할 수 있는 경량화된 Semantic segmentation 모델을 개발하는 것을 목표로 하고 있습니다.
딥러닝 오픈소스 프로젝트, WICWIU

WICWIU(What I can Create, What I Understand)는 국내 최초의 딥러닝 오픈소스 프레임워크입니다. 모든 API가 C++로 제공되어 메모리 및 성능 최적화에 유리합니다. 또한, 응용시스템의 개발 외에도 프레임워크 자체를 특수한 환경에 맞도록 수정 및 확장이 가능합니다.
산업계와의 다양한 협력 프로젝트

제시된 프로젝트들 외에도, 협력 기관들에서 제안한 다양한 연구 과제를 수행하고 있습니다.
기타 연구

S-Lab 연구 수행 과정에서 얻은 부가적 연구와 그 성과들을 연구실 github에 공개하고 있습니다. 자세한 내용은 github(https://github.com/HGU-DLLAB)를 참조하시기 바랍니다.

 

6.  현재까지 완성된 S-Lab 프로젝트 중 하나를 소개해주세요.

Fast Deep-Convolutional Text-to-Speech (Fast DCTTS)

자동회귀적(autoregressive)으로 동작하는 딥러닝 기반 음성합성 모델은 음성 합성 속도가 매우 느려 서비스에 적용하기에 어려움이 있습니다. 본 프로젝트는 모델의 음성 합성 속도를 개선하고자 여러가지 경량화 기술을 적용하였습니다. 본 연구를 수행한 결과, CPU thread 한개만 사용한 음성 합성 속도가 음성 합성의 품질 저하 없이 GPU보다 0.72배 빠르게 합성합니다. 자세한 결과는 아래에 제시된 표와 같습니다.

 

7.  S-Lab에 참여하고 싶으면 어떻게 해야하나요? 제약사항 같은 것이 있나요?

본 연구실에서는 아래의 요건을 갖춘 지원자를 지향합니다. 참여를 원하시는 분은 ijkim@handong.edu(김인중 교수님)께 메일 주시면 됩니다.

– 딥러닝 및 머신러닝에 대해 관심이 있으신 분
– 다양한 산업계의 문제 해결을 경험하고 싶으신 분
– 어려운 문제에 부딪혀도 끝까지 포기하지 않는 분
– 최선을 다해 성장할 준비가 되어 있으신 분
– 배운 것을 나누며 함께 성장할 준비가 되어 있으신 분

 

SW기자단 신희주

[S-Lab 탐방] Deep-learning Lab – 김인중 교수님