이제 데이터 공부 안하는 블로그

[패스트캠퍼스 수강 후기] 파이썬 인강 100% 환급 챌린지 18회차 미션 본문

파이썬

[패스트캠퍼스 수강 후기] 파이썬 인강 100% 환급 챌린지 18회차 미션

공사노비 2020. 11. 19. 23:51

 

 


17일차

xpath
오늘 자세하게 xpath가 무엇인지 좀더 알아 보겠습니다. 
xpath는 html에서 좀더 쉽게 원하는 태그를 찾아갈수 있게 해주는 경로입니다. 


쉽게 예를 들어 보겠습니다. 학교를 가정해보겠습니다. 


<학교 이름  = “코딩학교”>
<학년 value =  “1학년”>
<반 value = “1반”>
<학생 value = “1번”> 유재석 </학생>
<학생 value = “2번”> 박명수 </학생>
<학생 value = “3번”> 노홍철 </학생>
<학생 value = “4번”> 정준하 </학생>
<학생 value = “5번”> 박명수 </학생>

</반>
<반 value =“2반”/>
<반 value =“3반”/>
<반 value =“4반”/>
<반 value =“5반”/>

이렇게 있다고 하면 유재석 학생을 부르기 위해서는 코딩학교 > 1학년 > 1반 > 1번 이라고 불러 줘야 합니다.
만약 학교에 유재석 학생이 한명이라면 그냥 유재석 학생이라고만 불러도 되겠죠. 
하지만 2번 박명수 학생의 경우 같은 이름의 학생이 또있습니다. 이경우에는 처음부터 끝까지모든 번호를 불러 주어야 합니다. 
만약에 학생에게 학번이 있다고 가정해 보겠습니다. 


<학생 value = “1번”, 학번 = “1-1-1”> 유재석 </학생>
<학생 value = “2번”, 학번 = “1-1-2”> 박명수 </학생>

 

이렇게 되면 학번 1-1-2 박명수 라고 쉽게 부를수 있게 됩니다. 
이렇게 학번을 부르는것이 xpath를 사용하는 것입니다. 
보통 html태그가 부모자식 태그의 깊이를 가지고 있습니다. 
/html/body/div[2]/div[3]/div[2]/div/span/a…. 
이런형식이죠. 훨씬 긴 경우들도 많이 있습니다. 
이경우에 만약에 태그들에 id= “login” 이라는 값이 있다면

쉽게 
//[@id = “login”] 
이라고 간단히 불러 올수 있게 됩니다. 훨씬 쉽게 간단하게 경로를 따올수가 있게 됩니다. 

requests 모듈

requests 모듈이란 http 웹 브라우저의 작업을 파이썬에서 쉽게 할 수 있도록 도와주는 모듈입니다. 

우선, requests 모듈을 사용하기 위해서는 pip를 통해 설치를 해야합니다.

 

pip install requests 

위의 명령어를 통해 requests 모듈을 설치해줍니다.

 

import requests #설치한 requests를 불러옵니다

 

response = requests.get('https://google.com)  #response 변수에 requests를 사용하여 get('불러올 홈페이지주소')을 넣어줍니다.

 

여기서 홈페이지가 잘 불러와졌는지 확인하고 싶다면 res.status_code를 이용하면 됩니다.

print(res.status_code)

# 이렇게 res.status_code를 출력했을 때 값이 200이 나오면 정상이고, 403이 나오면 페이지에 접근할 수 없다는 뜻입니다. 

 

res.raise_for_status()

# 위의 코드를 사용하면 정보가 잘 불러와져서 문제가 없으면 계속 진행하고 문제가 생기면 바로 종료해줄 수 있습니다.

 

print(res.text) # 구글 웹사이트의 텍스트를 가져와서 출력합니다.

 

정보를 파일로 가져오고 싶다면 아래 코드를 사용해주면 됩니다.

with open("mygoogle.html","w", encoding="utf8") as f: 

    f.write(res.text)         # 파일로 가져오기

 




강의소개 https://bit.ly/33a7nvc