💬 과목 소개


파이썬 기초와 numpy,pandas 의 기초를 끝낸 후 실전 데이터 분석을 위해 여러가지 프로젝트를 진행해봅니다

트럼프 대통령 트윗으로 시작하는 데이터 처리 , 텍스트 파일 분석, 넷플릭스 시청 데이터 분석,
테드 강연 데이터 분석 등 여러가지 데이터 분석 프로젝트를 다루며
특히 넷플릭스 데이터 프로젝트의 경우 넷플릭스 데이터 대회에 사용된 데이터를 변형하고
재정렬해보며 실전 데이터 분석 능력을 키워봅니다. 



👤 수업 목표 & 수강대상



  • 파이썬 중급자 : 파이썬 학습 이후 어떻게 활용해야 할 지 모르는 분

  • 데이터 분석 꿈나무 : 데이터분석의 기초를 배우고 시각화까지 해보고 싶은사람

  • 머신러닝 입문자 : 머신러닝에 대해 어디서부터 시작해야할 지 모르시는 분


📂 커리큘럼


1. 트럼프 대통령 트윗으로 시작하는 데이터처리

  • 조건문, 반복문, 리스트를 복합적으로 이용해 트럼프 대통령의 트윗을 분석하고 2017 

  • 학습 내용: 리스트 순회하기, 문자열인덱싱, 문자열함수startwith(), split(), append(), lower(), replace()


2. 영어 단어 모음으로 시작하는 텍스트 파일 분석

  • 파이썬 라이브러리와 파일을 불러오기를 이용해 영문자료에서 가장 많이 사용되는 단어 10,000

  • 학습내용: 파일다루기, 데이터구조다루기, 리스트로리스트만들기, 데이터정렬하기, 그래프다루기

3. 넷플릭스 시청 데이터로 알아보는 데이터형 변환

  • 넷플릭스 데이터 대회에 사용된 데이터 일부를 JSON, 사전형으로 변환하고 재정렬해보기 

  • 학습내용: 딕셔너리, 딕셔너리키, JSON, 집합, 집합연산, 교집합과 합집합 구하기-집합연산자

  • matplotlib으로 그래프 설정


4. 테드 강연으로 다뤄보는 복잡한 형태의 데이터

  • CSV, JSON 형태의 데이터와 앞서 배운 개념을 종합적으로 다루며 테드 강연에서 가장 인기있는 동

  • 학습내용: CSV, 고급파이썬-lambda / map / filter 등