티스토리 뷰


수익화
까지 할 수 있는 완성형 웹, 앱 서비스, 인공지능이 보는 나의 동물상 테스트 만들기 1강으로 인공지능 학습에 필요한 동물상 연예인 사진 데이터를 수집하기 위한 파이썬 크롤링 기초 강의입니다.

Beautifulsoup를 활용하여 네이버 실시간 검색 순위를 크롤링하여 텍스트 파일로 저장해보고, google-images-download를 활용하여 코드 1줄만 수정하고도 연예인 사진을 다운받는 실습을 해봅니다.

파이썬과 라이브러리의 개념을 잘 모르셔도 따라 하실 수 있게 기초부터 차근차근 설명해 드립니다. 이처럼 잘되어있는 라이브러리와 예제 코드를 활용한다면 코드 1줄만 수정하여도 원하는 로직을 작성하실 수 있습니다.

 

- 구름IDE https://ide.goorm.io/

- Beautifulsoup 공식 문서 https://www.crummy.com/software/BeautifulSoup/bs4/doc/

- google-images-download pypi https://pypi.org/project/google_images_download/

- 완성 코드 보기 https://github.com/youtube-jocoding/python-crawling

 

아래는 동물상 연예인 제가 구글링하면서 찾은건데 혹시 추가나 수정이 필요한 것 같으면 말해주세요!ㅎㅎ

강아지: 워너원 강다니엘, 엑소 백현, 박보검, 송중기

고양이: 워너원 황민현, 엑소 시우민, 강동원, 이종석, 이준기

곰: 마동석, 조진웅, 조세호, 안재홍

공룡: 윤두준, 이민기, 김우빈, 육성재, 공유

토끼: 방탄소년단 정국, 아이콘 바비, 워너원 박지훈, 엑소 수호

 

---

본 영상은 구름IDE에서 에반젤리스트 활동 지원을 받아 제작되었습니다.

안녕하세요 누구나 배울 수 있는 쉬운 코딩 채널은 만들어가는 조코딩입니다.

이번 영상부터 커뮤니티에 예고한대로 하나의 완성형 웹과 앱 서비스를 각각 만들어서 출시하고 마케팅하고 수익화까지 해보는 프로젝트를 진행해보겠습니다.

우리가 만들 서비스는 "인공지능이 보는 나의 동물상 테스트"라는 웹과 앱 서비스를 제작할 예정인데요. 동물상 대표 연예인들의 사진을 머신러닝을 통해 학습시켜서 내 사진을 업로드하면 어떤 동물상인지 판단해주고 SNS를 통해 사람들과 결과를 공유할 수 있는 서비스를 만들 것입니다.

이를 위한 첫번째 단계로 대표 동물상 연예인들의 사진 데이터를 모을 것입니다. 그러나 일일히 검색하여 하나씩 다운받으려면 엄청난 시간이 걸리겠죠. 그래서 이번 시간에 우리는 크롤링이라는 기술을 배워보겠습니다.

크롤링이란 인터넷에 있는 정보 중 우리가 원하는 정보만 골라서 자동으로 수집하는 기술입니다. 크롤링의 기초만 할 줄알아도 엄청 실용적이고 재미있는 것들을 많이 만들 수 있습니다. 예를들어 학교나 회사의 식단표를 크롤링하면 오늘의 식단을 볼 수 있는 서비스를 만들 수 있고, 다양한 뉴스 사이트 중 원하는 주제의 뉴스 기사만 골라서 모아볼 수도 있겠습니다. 그 외에도 엄청 다양한 것을 만들어볼 수 있겠죠.

크롤링의 원리는 매우 간단합니다. 우리가 정보를 가져오려는 사이트를 불러와서 원하는 정보를 찾아서 그 부분을 가져오는 것을 코드로 작성하는 것 뿐입니다.

그러면 함께 크롤링의 매우 기초부터 차근차근 배워보겠습니다. 크롤링 관련 라이브러리는 보통어느 언어에나 있어서 언어는 아무거나 쓰셔도 무방하지만 요즘 핫한 python을 이용해 실습을 해보겠습니다. Python 언어를 잘 모르셔도 따라오실 수 있게 쉽게 설명 드릴테니 영상 끝까지 함께 해주세요.

그럼 화면을 통해 함께 보시죠!

댓글