오늘은 오랜만에 대학원 생활에 대한 회상을 해봅니다. 요즘 1주일 간 감기 몸살로 병치레 아닌 병치레를 하느라 자신이 나아가야 할 길에 대한 방향을 놓칠까봐, 지금까지 어떤 문제점들이 있었는지 상기해보려는 겁니다. 나중에 언젠가 다시 이 글을 볼 때 쯤이면, 혹은 국내 대학원 석박사과정 진학을 희망하는 분들에게 도움이 될 수 있겠죠.
시작합니다.
1. 개괄저는 박사과정 4학기차, 그러니까 이 연구실 소속으로 10학기(5년)째 지내고 있는 상황입니다. 2005년 4월부터 연구실 인턴이 시작되었고, 9월부터 정식 석사과정이 시작되어 5학기(4학기 이수, 1학기 논문)에 졸업했습니다. 이후 2008년 3월부터 박사과정을 시작하여 현재 코스웍 수료 학기에 있습니다. 표로 정리하면 아래와 같습니다.
= 2004. 9. : 지도 교수님과 첫 접촉 (학부 7학기차)
= 2005. 4. ~ 2005. 8. : 인턴과정 (학부 8학기차)
= 2005. 9. ~ 2008. 2. : 석사과정 (5학기)
= 2008. 3. ~ 현재 : 박사과정 (4학기차)
대부분의 학생들이 그렇듯, 저도 학부 4학년 때 앞으로 나아가야 할 분야를 정했고, 석사과정 때에는 다양한 분야에 대한 경험을 쌓았으며, 박사과정인 지금은 하나의 분야를 택해 깊이 파고들고 있습니다. 그 분야는 다음과 같습니다.
학사 과정 - 멀티미디어 검색 선택
석사 과정 - 비디오, 이미지, 오디오 분석 및 검색
박사 과정 - 오디오, 특히 음악 정보 연구(MIR)
현대의 멀티미디어(multimedia)는 컴퓨터로 나타낼 수 있는 다양한 형태의 컨텐츠
(*1)를 통칭합니다. 비디오(video), 오디오(audio), 이미지(image) 외에도 다양한 형태가 있지만, 가장 메이저한 표현 형태는 언급한 세가지일 것입니다. 비디오, 오디오, 이미지에 관한 연구는 다양하며 그 역사 또한 오래되었습니다. 그렇기에, 최근에 와서는 이 세 가지의 모든 기술을 익히는 것이 그리 쉬운 일은 아닙니다. 가령, 오디오만 하더라도 신호처리의 관점에서는 sound enhancement (사운드 품질 향상), noise reduction (노이즈 제거), speech recognition (음성 인식), speaker detection (화자 검출), speach emotion recognition (음성 감성 인식), source separation (음성 분리) 등등 다양한 연구가 있습니다. 이 외에도 더 있지만 이 분야의 전문가가 아닌 관계로 스킵합니다.
한편, 많은 사람들은 음악(music)은 오디오(audio)의 서브클래스로 생각하지만, 최근의 음악 연구자들은 음악을 멀티미디어 정보 검색의 서브클래스로 분류하는 것에 대해 강력한 의문을 표합니다. 그만큼 음악 연구에 대한 관심이 높아지고 있으며 분야 또한 세분화되고 있습니다. 허밍 및 노래에 의한 질의(QBSH; query-by-humming/singing), 음악 추천(music recommendation), 음악가 인식(music artist detection), 비트 추출(beat extraction), 음악 구조 분석(musical structure analysis), 자동 태그(music tagging), 장르 분류 (music genre classification), 무드 검출 (music mood detection) 등등..
현재까지의 저의 여정은 멀티미디어 라고 하는 큰 그림으로부터 시작하여, 멀티미디어의 주요 구성 요소인 비디오, 오디오, 이미지라는 큰 세가지의 서브 클래스를 이루는 요소를 탐구하고, 이 중 오디오와 많은 영역이 겹치는 음악 정보 검색과 그의 파생 분야로 관심이 옮겨간 상태입니다. 이 중, 음악 정보 검색 중에서는 QBSH 및 음악 추천 분야에 깊이 연구를 진행해온 상황입니다.
간단히 적으면 '아 이렇게 해서 이 사람이 이렇게 분야가 옮겨갔구나' 정도의 피상적인 이해로 끝나겠지만, 매 순간마다 어째서 이렇게 분야가 바뀌어갔는지 생각해보면 저 자신도 등에 식은땀이 흐를 정도입니다. 그만큼 연구 분야를 선택한다는 것은 연구를 지휘하는 입장이 아닌, 연구 현장에 있는 학생 혹은 연구원인 누구에게나 정말 중요한 일입니다.
이에, 저의 경우에는 지금까지 어떻게 하여 지금의 과정에 도달하게 되었는지에 대한 간단하면서도 비교적 긴 회상을 정리해 봅니다. 지금 생각해보면 정말 부끄럽기 그지없는 과거이지만, 또 앞으로 무사히 박사과정을 끝내게 될 지에 대한 확신도 없는 상황이지만, 한 번 정리해보면 앞으로의 이정을 정하는 데에 도움이 될 것 같습니다.
또한, 생각보다 주변의 석박사과정에 있는 선후배동기분들 가운데 연구실의 단순한 '구현(implementation) 인력'으로 계신 경우도 있습니다. 이런 분들은 스스로 창조할 수 있도록 이끌어주는 사람을 만나지 않으면, 아니면 스스로가 창조적인 사고를 하도록 변화하지 않으면 영원히 위에서 시키는 일(컴퓨터 구현, 반복된 실험 등등...)만 하며 논문의 제1저자나 교신저자가 아닌 상태로 살아가야 할 것입니다
(*2). 현재 계신 학위 과정 이후 최종 종착지가 학교, 연구소, 회사, 기타 등으로 세분화되지만, 적어도 박사과정의 경우 '창조할 수 있는 능력'은 있어야 한다고 봅니다. 이러한 창조하는 능력은 어떻게 갖게 되는지에 대해 여러가지 생각을 담아보겠습니다.
마지막으로, 개인의 생활사에 기반한 것이며, 서로 다른 분야에 대해 깊이 언급하는 것은 흥미를 잃을 것으로 생각, 본문 중에 레퍼런스를 붙이는 일은 거의 없을 것입니다. 간혹 이해하기 어려운 상황이 있을 경우 댓글을 달아주시면 최대한 반영하거나 부연 설명하도록 하겠습니다.
- 계속 -
*1. contents를 컨텐츠, 컨텐트, 콘텐츠, 또는 복수형을 빼고 컨텐트, 콘텐트 등으로 적는 분들이 많은데, 사실 한국 발음기호로 옮길 때에는 칸텐츠 혹은 콘텐츠가 맞는 말입니다. 하지만 실제의 발음이 콘과 컨 사이의 발음 정도가 되기에, 컨텐츠라고 적는 분들도 있습니다. 심지어 학회 중에는 '한국콘텐츠학회'도 있으니 콘텐츠라고 적는게 맞는 말이겠지요. 그렇지만, 본 글을 포스팅할 당시 컨텐츠(약 2000만 건), 콘텐츠(약 600만 건), 칸텐츠(약 21만 건), ... 등의 결과를 얻었기에, 이하 본 글의 시리즈에서는 컨텐츠로 통일해서 씁니다.
*2. 수학이나 물리 분야의 경우 저자 순서를 알파벳 순으로 나열한다고 들었습니다. 이 경우 제1저자가 갖는 의미는 경감되겠지요. 또한, 제1저자는 구현자, 지휘자, 책임자, 제1공로자 등의 의미에 따라 다양하게 표시됩니다. 그렇지만 공학 분야에서는 일반적으로는 제1공로자일 경우가 많은 듯 합니다.