💬 과목 소개
웹에 있는 많은 정보를 하나하나 복사 붙여넣기 하기엔 시간이 많이 걸리지 않나요?
웹 크롤링을 통해 많은 정보들을 한 번에 컴퓨터에게 시켜봅니다.
웹의 기본 구조와 크롤링의 동작 원리를 이해하고 Selenium 을 통해 프로젝트를 진행해 보아요.
코드를 통해 브라우저를 제어하고 데이터를 원하는 대로 수집한다면
내가 몰랐던 인사이트들을 데이터를 통해 파악하고 빠르게 업무를 자동화 할 수 있습니다.
영상만 보는 강의가 아닌 내일패스를 통해 직접 실습하고 나만의 결과물을 만들어보세요!
👤 수업 목표 & 수강대상
기초 파이썬은 수강 하였지만 문법을 어디에 활용할지 막막하신 분
필요한 데이터를 웹 상에서 반복없이 자동으로 정보를 수집하고 싶은 분
웹의 구조를 파악하고 데이터를 추출하는 방법을 알고 싶은 분
📂 커리큘럼
1. HTML 훑어보기
웹의 기본이 되고, 우리가 원하는 정보가 있는
HTML에 대해 배워보는 시간을 가집니다.
크롤링에 관하여
HTML 태그 1
HTML 태그 2
HTML 태그 3
HTML 전역 속성
핵심 정리
2. Selenium 활용 : 스크래핑
웹 스크래핑을 도와주는 파이썬 라이브러리 Selenium에 대해 알아보고,
스크래핑을 할 수 있는 방법을 배웁니다.
웹 스크래핑과 Selenium
태그 이름으로 요소 찾기
class, id 로 요소 찾기
요소들의 주소 Xpath
브라우저와 Xpath의 활용
핵심정리
3.Selenium 심화 : 브라우저 제어
웹 테스트 자동화 도구인 Selenium을 이용해 브라우저를 제어하는 방법을 배웁니다.
Selenium을 이용한 브라우저 제어
브라우저 로딩 기다리기
키보드 / 마우스 입력하기
다양한 입력 , ActionChains
핵심정리
4. 웹 스크래핑 프로젝트
앞에서 배운 것 들을 토대로 다양한 웹 페이지를 스크래핑 해보는 시간을 가집니다.
프로젝트 소개
국가 수도와 인구 정보 크롤링하기
하키 팀의 팀별 , 연도별 승패 크롤링하기
연도별, 작품별 오스카 상 수상목록 크롤링하기