JAVA - HttpURLConnection+parameter, getHttpHTML, 크롤러(crawler)
오늘은 웹 크롤러의 기본이 되는 웹페이지의 코드를 가져오는 URL코드에 대해서 알아보겠습니다. HTTP 프로토콜을 이용해서 웹페이지를 서비스하는 방식에는 GET 또는 POST방식이 있습니다. 마찬가지로 저희가 java코드로 웹페이지의 소스를 파싱할려면 위 방식에 알맞는 코드를 사용해야합니다. 1. GET GET방식은 페이지의 이동시 주소창에 Parameter가 들어있습니다. http://PPD_ML/run_ga2.jsp?input_file_name=inp_file1004.txt 위와 같은 주소처럼 사용자가 주소를 알면 그냥 사면 되지만 상황에 따라 Parameter를 다르게 하여 파싱하고 싶다면 추가적인 작업을 해야합니다. PS) 코드 중 param1=%s¶m2=%s 부분이 업로드중 계속 깨지네요..
SoftWare/JAVA
2016. 2. 25. 17:46
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 포켓몬 Go
- LISTVIEW
- 파일 입출력
- 유전
- 5582
- 포켓몬 고
- android
- 서버
- Java Decompiler
- java
- Notification
- 파일입출력
- Service
- 자바 입출력
- 카운터
- java url
- c언어
- 알고리즘
- vim 설치
- vim
- php
- counter
- 인텐트
- 안드로이드
- Res
- 유전 알고리즘
- java 파일 입출력
- jad
- 아두이노
- 테라펀딩 #투게더펀딩 #P2P투자 #부동산 소액 투자 #카카오 #토스
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함