데이터 AI 사이언티스트? 데이터와 AI 관련 직종을 꿈꾸는 사람들에게
상태바
데이터 AI 사이언티스트? 데이터와 AI 관련 직종을 꿈꾸는 사람들에게
  • 백주호 인턴기자
  • 승인 2021.01.14 13:31
  • 댓글 0
이 기사를 공유합니다

[인플루언스뉴스 l 백주호 인턴기자] 네이버 클로바, 구글 디벨로버 익스퍼트 등에서 활동하고 있는 유튜버 AI holic 크리스가 ‘데이터 AI 사이언티스트 하지 마세요’라는 충격적인 제목의 영상을 업로드 했다.

영상에서 크리스는 대학생 중 데이터 사이언티스트에 대한 로망을 가진 사람들한테 하고 싶은 말을 전했다. 머신러닝 사이언티스트나 데이터 사이언티스트가 멋있어 보여 장래 희망을 품고 있는 사람들이 많은데 데이터 사이언티스트로 커리어를 시작하지 않았으면 좋겠다고 말했다.

이유는 회사에는 데이터만으로 성과를 낼 만한 환경이 대부분 갖추어져 있지 않다고 말했다. 이어 회사는 대부분 둘 중 하나의 상황에 처해 있다고 말했다. 첫 번째, 데이터가 없거나 두 번째, 데이터를 사용할 수 없는 상태가 그것이다.

첫 번째, 데이터가 없는 경우에는 데이터를 남기도록 만들어야 하는데, 즉 로그를 남기도록 만들어야 하는데 그렇기 위해선 백엔드 개발을 할 줄 알아야 한다고 말했다. 엔지니어링 능력이 없다면 백엔드 개발자가 로그를 남기도록 설득을 해야 하고 개발을 하도록 만들어야 한다고 했다. 현실적으로 남한테 개발을 요구하기 쉽지 않고 자신이 직접 하는 게 편하기에 백엔드 개발을 먼저 시작하는 게 낫다고 했다. 개발자를 설득하고 정리도 깔끔하게 해 주어야 하기에 업무 속도가 느려지기 때문이다. 결국, 데이터도 정리되어 있지 않은 상태에서 데이터 전처리하는 데 코스트가 많이 들다 보면 성과를 자연스럽게 낼 수 없다고 했다. 그래서 일반적으로 데이터 사이언티스트가 신입으로 와서 성과를 내기 어려운 구조라고 한다. 그렇기에 신입을 안 뽑는다고 말했다.

결론적으로 크리스는 백엔드 엔지니어로 시작해서 데이트 사이언티스트 역량을 갖는 것을 추천했다. 백엔드 엔지니어는 자연스럽게 빅데이터를 접할 수 있고 로그를 마음대로 설정할 수도 있다. 그러다 보면 데이터를 직접 다루게 되고 전처리하는 역할도 맡게 된다. 이러한 관점을 자연스럽게 머신 러닝에도 적용할 수 있다. 즉, 엔지니어링 능력을 올리는 것이 더 좋은 방향이라고 말했다.

또 하나의 이유는 전반적으로 데이터 사이언티스트를 잘하는 것보다 엔지니어링을 잘 하는 것이 시장에서 수요도 많고 몸값도 비싸다고 말했다. 엔지니어링을 잘하면 모든 프로젝트를 할 수 있지만, 데이터 사이언티스트는 좋은 데이터가 마련되어 있어야 하고 그렇지 않으면 문제 정의가 힘들다고 말했다. 비유하자면 엔지니어링 기반이 없는 데이터 사이언티스트는 온실 속의 화초인 것이다.

AI 리서치 역시 마찬가지라고 한다. 학부생들의 문제가 머신러닝 모델링만 조금 할 줄 알고 엔지니어링 기반이 갖추어지지 않았다는 것이다. 모델링은 전체 프로젝트의 5% 정도밖에 차지하는 비율이 적기에 모델링 보다는 데이터 전처리나 데이터 엔지니어링을 해야 하는 경우가 더 많다고 한다. 즉, AI 프로젝트에서 성과를 내려면 모델링보다는 개발을 잘하는 것이 중요하다고 한다.

크리스가 추천하는 커리어는 백엔드 개발에서 시작해서 데이터 엔지니어링도 다루면서 머신러닝을 보는 것을 추천한다고 했다. 커머셜 프로젝트에서 엔지니어링 경험을 해보는 것이 매우 중요한 요소라고 말했다. 실제로 일을 할 수 있는 역량이 있다는 것을 증명하는 것이기 때문이다. [영상 출처=AI Holic]

백주호 인턴기자
백주호 인턴기자 influencenews@naver.com다른기사 보기
흥미로운 뉴스를 발빠르게 전합니다.

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사