커뮤니티
포인트
로딩중
쿠폰
내 강의실
국비 신청 내역
수강권
증명서
숙제 피드백
계정
로그아웃
학습 질문
개발 일지
나의 활동
답변 완료
네이버 아닌 다른 사이트 웹스크래핑하기 문의
[스파르톤] 파이썬 웹스크래핑
2주차
북마크
곽*미
댓글
4
추천
0
조회수
20
조회수
20
답변 완료


안녕하세요!

무료강의 웹스크래핑 강의 2-4 질문입니다.


1) 사이트를 구글 학술검색으로 변형해서 스크래핑하려고 하니 네이버의 뉴스 리스트에서 li에 해당하는 부분이 구글사이트에서는 찾기가 힘듭니다..ㅠㅠ

이 부분부터 막혀서 다음 강의(함수로 만들기)로 넘어가지 못햇어요..


2) kci 사이트로 변형해서 스크래핑하는 경우, kci 사이트에서 '플랫폼'으로 검색한 화면의 url이 제대로 표시되지 않아요..

(url: KCI 국내학술지 인용색인 정보 포털입니다.)

제가 원하는 플랫폼 검색결과 화면이 나오도록 url을 만드는 방법(url 규칙)을 알 수 있는 방법

또는 바로url으로 사용이 안되면 앞부분에 코딩을 추가로 해서

첫번째로 브라우저를 열고, kci 사이트에 접속하고, '플랫폼(원하는 검색 단어)'으로 검색하고, 그다음 검색 화면이 나타나는 것을 코딩으로 따로 만들어둔 뒤 그다음부터 강의2-4부분을 따라가야 할까요?


보고 계신 화면 전체를 캡처해 주시면, 튜터님들이 빠르게 상황을 상황을 이해할 수 있어요.

1-1) 강의 화면

스파르타 즉문즉답


스파르타 즉문즉답



1-2) 구글 화면

스파르타 즉문즉답


스파르타 즉문즉답




2-1) kci홈페이지에서 '플랫폼'을 검색한 결과 화면과 url

스파르타 즉문즉답

2-2) kci홈페이지에서 '플랫폼'을 검색한 화면의 url을 주소창에 넣어서 나오는 화면

스파르타 즉문즉답




1의 오류메시지


---------------------------------------------------------------------------
NameError                                 Traceback (most recent call last)
<ipython-input-11-e5b38df80862> in <module>
      7 soup = BeautifulSoup(data.text, 'html.parser')
      8 
----> 9 lis = soup.select('#gs_bdy_ccl' > div)
     10 lis

NameError: name 'div' is not defined



취소
 공유
취소
댓글 0
댓글 알림
나의얼굴