javaはJsoupを通じてウェブページを取ります。
この文章は主にjavaがJsoupを通じてウェブページを取得する過程を紹介しています。ここでは例示的なコードを通して紹介された非常に詳細で、皆さんの学習や仕事に対して一定の参考となる学習価値があります。必要な友達は参考にしてください。
一、導入依存
カバンを間違えないように注意してください。org.jsoup.nodesの下です。
一、導入依存
<!--java -->
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.10.3</version>
</dependency>
<!--httpclient -->
<dependency>
<groupId>org.apache.httpcomponents</groupId>
<artifactId>httpclient</artifactId>
</dependency>
二、demo類を編纂するカバンを間違えないように注意してください。org.jsoup.nodesの下です。
package com.taotao.entity;
import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
/**
* Author: TaoTao 2019/9/26
*/
public class intefaceTest {
public static void main(String[] args) throws IOException {
CloseableHttpClient httpClient = HttpClients.createDefault();// httpClient
HttpGet httpGet = new HttpGet("http://www.cnblogs.com/");// httpget
CloseableHttpResponse response = httpClient.execute(httpGet);// get
HttpEntity entity = response.getEntity();//
String content = EntityUtils.toString(entity,"utf-8");//
response.close();//
Jsoup.parse(content);
Document doc = Jsoup.parse(content);//
Elements elements = doc.getElementsByTag("title");// tag title dom
Element element = elements.get(0);//
String title = element.text(); //.html html
System.out.println(" :"+title);
Element element1 = doc.getElementById("site_nav_top");// id=site_nav_top
String str = element1.text();
System.out.println("str:"+str);
}
}
以上が本文の全部です。皆さんの勉強に役に立つように、私たちを応援してください。