javaはJsoupを通じてウェブページを取ります。


この文章は主にjavaがJsoupを通じてウェブページを取得する過程を紹介しています。ここでは例示的なコードを通して紹介された非常に詳細で、皆さんの学習や仕事に対して一定の参考となる学習価値があります。必要な友達は参考にしてください。
一、導入依存

<!--java  -->
    <dependency>
      <groupId>org.jsoup</groupId>
      <artifactId>jsoup</artifactId>
      <version>1.10.3</version>
    </dependency>
    <!--httpclient  -->
    <dependency>
      <groupId>org.apache.httpcomponents</groupId>
      <artifactId>httpclient</artifactId>
    </dependency>
二、demo類を編纂する
カバンを間違えないように注意してください。org.jsoup.nodesの下です。

package com.taotao.entity;
import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

/**
 * Author: TaoTao 2019/9/26
 */
public class intefaceTest {
  public static void main(String[] args) throws IOException {
    CloseableHttpClient httpClient = HttpClients.createDefault();//  httpClient
    HttpGet httpGet = new HttpGet("http://www.cnblogs.com/");//  httpget  

    CloseableHttpResponse response = httpClient.execute(httpGet);//  get  
    HttpEntity entity = response.getEntity();//      
    String content = EntityUtils.toString(entity,"utf-8");//    
    response.close();//          

    Jsoup.parse(content);
    Document doc = Jsoup.parse(content);//          
    Elements elements = doc.getElementsByTag("title");//  tag title   dom  
    Element element = elements.get(0);//       
    String title = element.text(); //.html   html
    System.out.println("    :"+title);
    Element element1 = doc.getElementById("site_nav_top");//  id=site_nav_top  
    String str = element1.text();
    System.out.println("str:"+str);
  }
}
以上が本文の全部です。皆さんの勉強に役に立つように、私たちを応援してください。