세상을 이끌어가는 기술 인공지능, 기계에게 지능을 부여하는 이 기술을 위해서는 기계를 학습시킬 자료가 필요하다. 예를 들어서 컴퓨터에게 고양이가 무엇인지 가르쳐주기 위해서는, 고양이의 이름과 특징을 연관시키거나 고양이의 이미지를 주고 '이건 고양이다' 와 같이 데이터에 설명을 붙여야 그 데이터를 바탕으로 기계는 학습을 하고 지능을 갖게 될 수 있다. 이렇게 인공지능, AI가 학습을 할 수 있게 데이터를 수집, 가공하는 툴을 어노테이터(Annotator)라고 부른다. (혹은 이러한 데이터 가공작업을 하는 사람을 어노테이터라고 부르기도 한다. 이는 인공지능의 핵심적인 역할이지만 컴퓨터만 있으면 누구나 어디서든 작업할 수 있어서 재택 부업 알바 직업으로도 좋다)
이번 글에서는 이미지 자료를 픽셀단위로 가공하는 에노테이터 툴들을 소개해보고자 한다. 단순히 어떠한 이미지를 보고 '이건 고양이' 이렇게 분류하는것이 아닌, 이미지에서 고양이가 있는 위치와 범위를 파악하고, 이미지에서 고양이만 자르거나 고양이 이외의 배경을 제거하는 기능을 개발할 수 있도록 해주는 데이터 가공작업 툴을 알아볼 것이다.
이러한 어노테이터 작업방법은 다음과 같다. 컴퓨터에게 고양이를 학습시키고 싶다면 고양이가 포함된 이미지를 준비하고, 어노테이터를 이용하여 이미지에 고양이가 존재하는 부분을 마킹하고 이름을 지정해주면 된다. 똑똑한 어노테이터 툴은 정점간을 자연스럽게 이어주고, 고양이를 포함한 정점들을 컴퓨터가 쉽게 인식할 수 있는 텍스트(json등) 파일로 변환해줄것이다.
이미지에서 고양이가 존재하는 부분을 지정하고, 이를 'cat'이라는 속성을 정해준 뒤 export하면 다음과 같은 json파일이 나온다. 이제 머신러닝 모델을 만들때 이미지와 고양이의 위치가 지정된 json파일을 이용하여 인공지능 모델을 학습시킬 수 있다. 이렇게 학습된 인공지능은 이미지나 영상에서 고양이가 어디 위치해있는지 찾아내고, 고양이만 흑백으로 만든다던가 고양이 이외에 배경을 없앤다던가 하는 작업을 자동으로 수행할 수 있게된다.
이미지 에노테이션 툴
LabelMe: 가장 유명한 툴
RectLabel: Mac 전용
VIA: 사용하기 쉽고 빠름. 위 고양이 예제에서 사용된 툴
관련영상
'프로그래밍 > 머신러닝' 카테고리의 다른 글
[ML] 손글씨 인식 - Colab+Keras+CNN+MNIST (0) | 2020.12.24 |
---|