데이터 과학자들은 10 년 안에 멸종 될 것입니다


으로 미하일 뮤, 연구원, 투자자, 데이터 과학자



~의 사진 레비 베어 의 위에 Unsplash

AI의 발전이 계속해서 비약적으로 발전함에 따라 기본 수준에서 데이터 과학에 대한 접근성이 점점 더 민주화되었습니다. 데이터 부족 및 컴퓨팅 성능과 같은 기존의 진입 장벽은 새로운 데이터 스타트 업이 지속적으로 공급되고 (일부는 하루에 커피 한 잔에 액세스 할 수 있음) 강력한 클라우드 컴퓨팅이 모두 제거되면서 사라졌습니다. 고가의 현장 하드웨어가 필요합니다. 전제 조건의 삼위 일체를 마무리하는 것은 데이터 과학의 가장 유비쿼터스 측면이 된 구현 기술과 노하우입니다. “몇 초 만에 X 모델 구현”, “몇 줄의 코드로 데이터에 Z 방법 적용”과 같은 태그 라인을 선전하는 온라인 자습서를 찾기 위해 멀리 볼 필요가 없습니다. 디지털 세계에서 즉각적인 만족은 게임의 이름이되었습니다. 향상된 접근성은 액면가에 해를 끼치 지 않지만 눈부신 소프트웨어 라이브러리와 빛나는 새 모델 아래에서 데이터 과학의 진정한 목적은 모호 해지고 때로는 잊혀지기도합니다. 그렇게하기 위해 복잡한 모델을 실행하거나 임의의 성능 메트릭을 최적화하는 것이 아니라 실제 문제를 해결하는 도구로 사용하기 때문입니다.

간단하지만 관련성이있는 예는 Iris 데이터 세트입니다. 꽃받침 길이를 측정하는 이유는 말할 것도없고 꽃받침이 무엇인지에 대한 생각을 아끼지 않고 알고리즘을 시연하는 데 얼마나 많은 사람들이 사용 했습니까? 새로운 모델을 레퍼토리에 추가하는 데 더 관심이있는 신진 실무자에게는 사소한 고려 사항처럼 보일 수 있지만, 아이리스 꽃의 변형을 이해하기 위해 문제의 속성을 분류 한 식물학자인 Edgar Anderson에게는 사소한 고려 사항이 아닙니다. 이것은 인위적인 예 임에도 불구하고 간단한 요점을 보여줍니다. 주류는 데이터 과학을 “적용”하기보다는 데이터 과학을 “수행”하는 데 더 초점을 맞추고 있습니다. 그러나 이러한 오정렬은 데이터 과학자의 쇠퇴의 원인이 아니라 증상입니다. 문제의 원인을 이해하려면 물러서서 조감도를 가져야합니다.

데이터 과학은 실무자에게 영역이없는 몇 안되는 연구 분야 중 하나라는 호기심 많은 구별이 있습니다. 약국 학생은 약사가되고 법학 학생은 변호사가되고 회계 학생은 회계사가됩니다. 따라서 데이터 과학 학생들은 데이터 과학자가되어야합니까? 하지만 데이터 과학자들은 무엇입니까? 데이터 과학의 광범위한 응용은 양날의 검으로 입증되었습니다. 한편으로는 데이터가 생성되고 캡처되는 모든 산업에 적용 할 수있는 강력한 도구 상자입니다. 다른 한편, 이러한 도구의 일반적인 적용 가능성은 사용자가 사실 이전에 해당 산업에 대한 진정한 도메인 지식을 거의 갖지 못함을 의미합니다. 그럼에도 불구하고 데이터 과학이 떠오르는 동안 고용주가이 기술이 무엇인지, 그리고 어떻게 회사에 완전히 통합 될 수 있는지 완전히 이해하지 못한 채이 초기 기술을 활용하기 위해 서두르면서 문제는 중요하지 않았습니다.

그러나 거의 10 년 후, 비즈니스와 이들이 운영하는 환경이 모두 진화했습니다. 이제 그들은 확립 된 업계 표준에 따라 벤치마킹 된 대규모 팀과 함께 데이터 과학 성숙도를 위해 노력하고 있습니다. 긴급한 채용 수요는 비즈니스, 각 산업 및 이해 관계자를 이해하는 문제 해결사 및 비판적 사고 자에게로 이동했습니다. 더 이상 소프트웨어 패키지 몇 개를 탐색하거나 몇 줄의 코드로도 충분하지 않으며 데이터 과학 실무자가 코딩 능력으로 정의되지 않습니다. 이는 데이터 로봇, Rapid Miner 및 Alteryx와 같은 코드 없음, autoML 솔루션의 인기가 증가함에 따라 입증됩니다.

이것은 무엇을 의미 하는가?

데이터 과학자는 10 년 안에 멸종되거나 (주거나 받거나) 적어도 역할 제목이 될 것입니다. 앞으로 데이터 과학으로 통칭되는 기술 세트는 코딩 가능 여부에 관계없이 깊이있는 도메인 지식을 분석에 담을 수있는 차세대 데이터에 정통한 비즈니스 전문가 및 주제 전문가가 담당 할 것입니다. 그들의 직함은 규정 준수 전문가, 제품 관리자 또는 투자 분석가와 같이이를 입증하는 수단이 아니라 전문성을 반영합니다. 역사적인 전례를 찾기 위해 멀리 뒤돌아 볼 필요가 없습니다. 스프레드 시트가 등장하는 동안 데이터 입력 전문가들은 매우 탐내었지만, 요즘에는 Cole Nussbaumer Knaflic ( “Storytelling With Data”의 저자)이 적절하게 관찰했듯이 Microsoft Office 제품군에 대한 능숙도는 최소한입니다. 그 전에는 타자기로 타자기를 만지는 능력이 전문 기술로 여겨졌지만 개인용 컴퓨터의 접근성도 가정이되었습니다.

마지막으로, 데이터 과학 분야의 경력을 고려하거나 연구를 시작하는 사람들에게는 의심 할 여지없이 만나게 될 벤 다이어그램을 지속적으로 참조하는 것이 도움이 될 수 있습니다. 데이터 과학을 통계, 프로그래밍 및 도메인 지식의 융합으로 설명합니다. 각각이 교차 영역에서 동일한 몫을 차지함에도 불구하고 일부는 다른 것보다 더 높은 가중치를 보장 할 수 있습니다.

면책 조항 : 내 관찰과 경험을 기반으로 한 견해는 내 것입니다. 동의하지 않아도 괜찮습니다. 생산적인 토론을 환영합니다.

약력 : 미하일 뮤 연구자, 투자자, 데이터 과학자이자 호기심 많은 관찰자로서 투자와 기계 학습의 융합에서 생각과 통찰력을 제공합니다.

실물. 허가를 받아 재 게시되었습니다.

관련 :



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *