💬 과목 소개
파이썬 기초와 numpy,pandas 의 기초를 끝낸 후 실전 데이터 분석을 위해 여러가지 프로젝트를 진행해봅니다
트럼프 대통령 트윗으로 시작하는 데이터 처리 , 텍스트 파일 분석, 넷플릭스 시청 데이터 분석,
테드 강연 데이터 분석 등 여러가지 데이터 분석 프로젝트를 다루며
특히 넷플릭스 데이터 프로젝트의 경우 넷플릭스 데이터 대회에 사용된 데이터를 변형하고
재정렬해보며 실전 데이터 분석 능력을 키워봅니다.
👤 수업 목표 & 수강대상
파이썬 중급자 : 파이썬 학습 이후 어떻게 활용해야 할 지 모르는 분
데이터 분석 꿈나무 : 데이터분석의 기초를 배우고 시각화까지 해보고 싶은사람
머신러닝 입문자 : 머신러닝에 대해 어디서부터 시작해야할 지 모르시는 분
📂 커리큘럼
1. 트럼프 대통령 트윗으로 시작하는 데이터처리
조건문, 반복문, 리스트를 복합적으로 이용해 트럼프 대통령의 트윗을 분석하고 2017
학습 내용: 리스트 순회하기, 문자열인덱싱, 문자열함수startwith(), split(), append(), lower(), replace()
2. 영어 단어 모음으로 시작하는 텍스트 파일 분석
파이썬 라이브러리와 파일을 불러오기를 이용해 영문자료에서 가장 많이 사용되는 단어 10,000
학습내용: 파일다루기, 데이터구조다루기, 리스트로리스트만들기, 데이터정렬하기, 그래프다루기
넷플릭스 데이터 대회에 사용된 데이터 일부를 JSON, 사전형으로 변환하고 재정렬해보기
학습내용: 딕셔너리, 딕셔너리키, JSON, 집합, 집합연산, 교집합과 합집합 구하기-집합연산자
matplotlib으로 그래프 설정
4. 테드 강연으로 다뤄보는 복잡한 형태의 데이터
CSV, JSON 형태의 데이터와 앞서 배운 개념을 종합적으로 다루며 테드 강연에서 가장 인기있는 동
학습내용: CSV, 고급파이썬-lambda / map / filter 등