OT 이후 본격적인 개강을 했다.
수업 제목이 빅데이터 이해 & 데이터 리터러시 함양 이길래, 빅데이터에 대해 좀 배우고 시작하나보다 했다. 하지만 낯선 출석 체크 적응하기 + 앞으로의 빡센 스케줄을 경험하고 살짝 적응할 수 있는 질 좋은 워밍업이었다.
데이터 사이언티스트 실무 현직자 분이 와서 본 특강을 진행하셨다.
뭘 필기하고 어떤 점을 주의 깊게 들어야하지? 하고 처음엔 어버버 했지만 금방 강사분의 수업을 듣고 어떤 점을 오늘 가르쳐주고 싶은지 이해하게 되었다.
개강 첫날부터 데이터 분석 기법을 배우는 것은 아니었고 '데이터 분석을 왜 하는지', '데이터 분석이 어디에 필요한지'
'데이터분석을 잘 하기 위해선 어떤 능력이 필요한지' 앞으로 헤쳐나갈 여정을 어떤 자세로 임하면 좋을지 알려주는 강의였다.
( 개인적으로 어떤 자세로 임하세요. 이걸 직설적으로 알려줘서 너무 좋았다. 이런 실무자의 직설적이고도 경험이 담긴 조언이 배움을 시작하는 사람한테 참 조언이라고 생각한다!)
지금부터는 수업 때 내가 중요하게 들은 부분 위주로 간략하게 정리를 해보려고 한다
< 빅데이터 이해 & 데이터 리터러시 함양 강의 내용>
- 데이터 리터러시란?
데이터 문해력. 즉, 데이터를 보고 해석하고 데이터를 어떻게 활용할 수 있을지 생각해내는 기법.
데이터 리터러시(데이터 문해력)이 결국 이 강의에 핵심이었다. 데이터 분석을 공부한다는 것은, 단순히 데이터를 읽고 데이터를 만들어내는 것이 아니다. 이미 실무에서는 나 이전에 수많은 훌륭한 현직자 분들이 '전처리 과정'을 통해 데이터 가공을 마친 상태이다.
* 전처리 과정: 원자료(raw data)를 데이터 분석 목적과 방법에 맞는 형태로 처리하기 위하여 불필요한 정보를 분리 제거하고 가공하기 위한 예비적인 조작. [네이버 사전]
나는 전처리가 된 데이터를 해석하고, 내가 해결해야되는 문제에 적용하고, 해결을 위해 분석한 데이터의 결과를 데이터 전문가가 아닌 사람한테 이해시킬 수 있을 정도로 효과적으로 시각화 하는 것이 '데이터 리터러시' 이다.
* 여기서 데이터 분석 결과를 시각화 한것이 바로 '대시보드'이다.
- 데이터 분석이 필요한 이유
기업의 비즈니스적인 Value를 찾기 위함.
- 데이터 리터러시를 함양하기 위해 필요한 것, 해야할 것 ☆★☆
1. 분석한 데이터 결과를 시각화 하는 연습 하기
대시보드에 대한 최대한 많은 예제를 보라고 하셨다.
강사님이 알려주신 대시보드 예제 사이트: https://plotly.com/examples/
Plotly Dash App Examples
Combined with Python, Plotly Dash delivers interactive, customizable data apps. Explore examples in a wide range of industries and advanced analytic needs.
plotly.com
2. 데이터 가공 연습하기
쉽게 찾아 볼 수 있는 공공 데이터, 오픈 데이터를 가지고 목적과 주제를 만들어 데이터를 가공해본다.
주의할 사항: 가공을 하다가 내가 지금 데이터를 다루는 주제와 목적을 잊지 말기!
강사님이 알려주신 공공데이터, 오픈데이터 사이트: https://www.kaggle.com/ 에서 datsets 카테고리 이용하기
https://dacon.io/ 에 참여해보며 데이터 이용하기
3. 기술 블로그나 뉴스레터 구독을 통해서 환경을 세팅해놓는다.
개인적으로 기술에 대해 더 다양한 접근을 할 수 있는 가장 쉽고 좋은 환경 세팅이라고 생각한다.
4. 추천해주신 도서
< 빅데이터 시대, 성과를 이끌어 내는 데이터 문해력> - 저자 카시와기 요시키
< 논리적 사고(Logical Thinking)> -저자 김동현
이 책은 컨설턴시를 위해서: 문제 정의부터 결론내기 연습을 위한 책 이다.
- Q&A 에서 강사님이 주신 TIP
1. 포트폴리오
부트캠프 혹은 다른 프로젝트로를 했다는 것을 취업할때 어필하려면 이 프로젝트를 통해 내가 '전략적으로 어떤 부분에 초 점을 맞췄고 노력을해서 해결했다' 는 것을 강조할것 .
절대 중구난방하게 쓰면 안됨! 이것저것 다 해봣다 NO, ~에 초점을 맞춰서 몰두했다 O
현업과 가까운 데이터 분석을 해봤다 라는 어필을 할 수 있는 포트폴리오는 필수다. (그래서 스스로 위에 적어놓은 오픈 데이터 가공 연습을 경험해보는 것이 중요할듯!)
2. 새로운 Tool 을 접할 때 내가 가질 자세
" 맨 땅에 헤딩", 절대 답부터 보지말고 끊임없이 고민하고 다양한 시도를 해볼것 ★
" 지치지 않기", 나에 대한 압박을 스스로 만드는 자세가 좋다고 하셨음. (이 변태같은 열정이 데이터 분석에 매력이라고 난 생각한다..)
3. 내 질문에 대한 답변
질문: SQL을 처음 배우면서 쿼리를 처음 짜면서 목적에 맞게 짜는게 맞는지 (답이 나오게끔 짜는게 맞는지)를 고민하게 되었다. 그 이유는 쿼리가 간결하지 않고 길었기 때문이다. 쿼리를 짤 때는 목적성 OR 효율성+간결성 중에 뭐가 더 필요한 가?
답변: 데이터 분석가로서 더 필요한 것은 "목적성" 이다.
효율성과 간결성은 개발자 분들이 더 추구할 방향이라고 하셨다.
<강의 후기>
3시간의 실시간 강의 + 1시간의 Q&A 시간이라 지루할까봐 걱정한 것이 사실이다.
그러나 강사님은 꾸며내기 식 강의가 아니라 정말 본인이 데이터 분석이라는 공부를 평생 해오면서 느낀점, 필요한 것을 진심을 담아 진솔하게 말해주셔서 강의 시간이 빠짐없이 알찼다.
특히 직접 경험하셨던 실무 경험 예시들은 굉장히 흥미롭고 도움이 많이 되는 내용이었다!
데이터 분석을 시작하는 수강생들에게 갖춰야 할 자세와 갖춰야 할 역량을 너무나도 깔끔하게 강의해주셔서 5개월간의 방대한 커리큘럼을 어떻게 따라갈지 살짝 감을 잡게 된 좋은 워밍업이었다!
'패스트캠퍼스 데이터분석 부트캠프 14기' 카테고리의 다른 글
[2주차] 패스트캠퍼스 데이터 분석 부트캠프 _ 데이터 분석을 위한 기초 수학과 통계_ t-test, f-test (4) | 2024.04.30 |
---|---|
[2주차] 기초 수학 통계, 엑셀을 이용한 데이터 탐색 (EDA), 데이터 전처리, 시각화 (3) | 2024.04.29 |
[1주차] 실무 엑셀 데이터 분석 및 기초 수학/통계_ 데이터 전처리 (3) | 2024.04.25 |
패스트캠퍼스 데이터 분석 부트캠프(BDA) 14기 최종합격 그리고 OT (1) | 2024.04.22 |
패스트캠퍼스 데이터 분석 부트캠프 14기 지원하다. (58) | 2024.04.22 |