오늘날 우리 세계는 빅데이터 세계이다. 과거부터 축적된 데이터의 역할이 오늘날 주목받고 있다. 통계학, 인공지능, 컴퓨터과학, 공학, 금융, 인문등 여러 분야에서 데이터 과학을 다루는 입장이 되어버린 것이다. 미국에서 근무한 한국인 데이터 과학자 김옥기 저자의 '데이터 과학 무엇을 하는가?'. 실제 데이터를 다루는 사람이 전해주는 데이터 과학 이야기를 사례와 함께 풀어나가보자.


빅데이터 분석에서는 흐름이라는 것이 있다. 데이터를 수집하고, 전처리 과정을 거치고, 모델에 입력하고, 결과를 출력하는 등 프로세스에 맞게 각 작업이 이뤄지길 마련이다.


빅데이터 플랫폼 구성도

데이터 과학자가 되기까지 겪어야 할 과정은 다양하다. 기본적으로 수리통계학, 기계 학습, 수리 경제학, 신호처리등 여러 분야에서 데이터 과학자가 되는 길이 존재한다. 대부분의 데이터 과학자는 석사 및 박사 학위를 가지고 있다. 그만큼 깊은 수준의 지식과 응용이 필요하다는 것이다. 우수한 분석 알고리즘과 프로그래밍 언어 및 툴을 사용할 줄 알아야한다.


데이터 과학자가 되기까지는...

이 책은 저자가 업무에서 겪을 내용부터 데이터 과학자가 되기까지의 이야기를 담고 있다. 사례와 실제 회사 위주의 이야기도 있으며, 분석을 과정도 잘 담고 있다.


데이터 과학자가 되려면?

실제로 데이터 분석 툴을 이용해 분석할 시 출력되는 결과를 보여주고 있다. 단순히 데이터 과학자는 이론만 이해할 것이 아니라, 실무에서도 툴을 효율적이고 효과적으로 사용할 줄 알아야함을 보여준다. 데이터 과학자에게 필요한 지식뿐만 아니라 과정도 친절히 알려주고 있다.


데이터 과학자에게는 원할한 툴 사용 능력도 필요하다

기계 학습은 1960년부터 그 역사가 시작된다고 도표에서 보여주고 있다. 인지 학습부터 시작해, 신경망, 의자 결정 나무, 랜덤 포레스트, 딥러닝등 오늘날까지 주목 받는 기계 학습의 활용 추세를 보여주고 있다.


기계 학습 발전 및 활용 추세

누구나 관심 있어하는 버스 운행 노선에 관련된 문제이다. KT의 통화 데이터를 사용해 심야 버스 노선 운행을 최적화했는데, SKT, LG 통신사의 데이터도 있었으면 더 정확했을지도 모른다. 노드간의 가중치를 학습해 좀 더 의미 있는 가중치를 뒀다면 좀 더 제대로된 버스 운행 노선이 신설되거나 변경되지 않았을까 싶다.


서울시는 통화 데이터를 어디에 적용했을까?

데이터 분석하는 방법에는 여러 가지가 있다. 데이터를 분석할 때 중요한 것은 변수이다. 어떤 것이 독립 변수이고 종속 변수인지 파악하고, 필요없는 변수는 없애고 의미 있는 변수는 강조하는 등 변수를 잘 다뤄야한다.


데이터 분석의 시작

공공 데이터는 그 활용도가 무궁무진하다. 누구에게나 공개되어 있고, 쉽게 접근할 수 있을 만큼 지금까지도 그 활용이 기대되고 있다. 하지만 이 데이터를 제대로 다룰 전문가는 아직까지 부족한 실정이다. 향후 정부, 공공기관, 금융, 물류, 영업등 모든 산업에서 이러한 공공 데이터를 활용해 효율적으로 업무를 진행해야 할 것이다.


공공 데이터 활용하기


"

데이터 과학은 어디로 흘러가고 있고, 앞으로 우리는 어떻게 해야할까?

실무 20년 데이터 과학자에게 배워보자!
"



현재 캐드와 관련된 도서는 수없이 많이 출간되었다. 하지만 올해 가장 따끈따끈한 최신서는 오토캐드 2019에 관한 입문서를 살펴보도록 하겠다. 물론 이전 버전에서도 충분히 사용할 수 있으니 걱정말자.


책의 표지를 보면 건축, 인테리어, 토목, 기계, 전기, 가구 도면을 모두 총망라했다고 설명하고 있다. 하지만 생각보다 건축쪽에 많은 부분을 차지하고 있다.



캐드에서의 명령어는 시간을 줄일 수 있는 가장 빠른 지름길이다. 객체를 그리고 편집하고 화면을 구성할 시 마우스를 통한 GUI가 아닌 키보드 명령어로 바로 접근하고 수행할 수 있다. 이미 이 책은 이를 알고 두번째 장부터 명령어에 대한 설명을 하고 잇다. 명령어별로 분류하여 본인이 필요한 부분을 골라 배워볼 수 있다.

작업 화면을 비롯해 GUI 환경에서 설명이 필요한 경우 이렇게 영역별로 숫자를 표시해 하나하나씩 설명해주고 있다.



작업 화면을 비롯해 GUI 환경에서 설명이 필요한 경우 이렇게 영역별로 숫자를 표시해 하나하나씩 설명해주고 있다.



이론과 실전은 다르다. 이론에서는 정확한 순서대로 하지만 실전에서는 시간을 줄이고자 야매(?)로 하는 경우가 다반사이다. 이 책은 실전 입문서인 만큼 실무에선 이렇게 하라고 친절히 설명하고 있다. 역시 실전에서 가장 많이 야매로 하는 경우는 도형 그리기이다. 도형 그리기는 사람마다 그 방법이 다를 정도로 많은 기술이 있다.



업무의 생산성을 높이기 위해 중요한 것은 불필요한 반복적인 작업을 줄이는 것이다. 시간을 줄이고 정확도는 높일 수 있다. 위와 같이 객체 1개로 그려진 패턴을 나누고 싶을 때 [개별 해치]를 사용해 각 구간별로 해치 패턴을 다르게 할 수도 있다. 이처럼 일일이 해치를 넣는 작업을 한 번에 할 수 있다.



어느 날 작업을 하다보면 이 부분은 왜 않되지 의문이 생길때가 많다. 인터넷에 검색하자니 어떻 단어 및 문장으로 검색해야할지 모르고 애매할 때, '캐드 고수의 비밀'을 살펴보자. 작은 팁 하나가 네이버 지식인의 도움 없이도 업무에 희망을 줄 것이다.



앞서 배운 내용을 바탕으로 준비 파일을 열어 스스로 예제를 구성해보고 만들어나갈 수 있다. 실제로 주어진 업무를 하는 것과 같은 느낌이다. 본인만의 스타일로 또는 내가 잘할 수 있는 기술로 예제를 완성할 수 있다.



캐드에 대해 전혀 모르는 사람도 첫 장부터 컴퓨터를 켜고 책을 펴며 하나하나씩 따라하기 넘 좋은 입문서이다. 건축 분야 위주라 예제 도면들이 건축 및 인테리어쪽이 많지만, 그럼에도 분야 공통적으로 사용할 수 있는 팁이나 내용들이 알차게 들어가있다. 따라서 건축분야가 아니더라도 캐드를 충분히 배우기에 손색없다.


하지만 입문서인 만큼 예제가 많이 풍부하지 못한 느낌은 있다. 실제 건축, 기계 분야 실무자들이 사용하는 도면을 가져와 여러 사람이 협업하는 형태도 보여주면 좀 더 좋았을지 싶다. 물론 도면을 공유하고 협업하는 툴은 오토데스크에서 따로 있으니 개인적으로 찾아보고 공부해도 충분할듯하다.



"건축, 기계등의 최신의 오토 캐드를 위한 

캐드 초심자 및 중급자를 위한 실전 기반 입문서"



+ Recent posts