java簡単ホームページのキャプチャ
4247 ワード
背景の紹介
一tcp概要
1 tcpはネットワーク中点対点の伝送を実現する.
2送信は、ポーツとsocketsを通じて行われる.
ポータブルは異なるタイプの伝送を提供している(例えばhttpのportは80)
1)socketsは特定のポートに結びつけられ、伝送機能を提供することができる.
2)一つのポロは複数のsocketに接続できます.
二URL概要
URLはインターネットから入手できるリソースの位置とアクセス方法を簡潔に示すもので、インターネット上の標準リソースのアドレスである.
インターネット上のすべてのファイルには唯一のURLがあります.ファイルの位置やブラウザはどうすればいいですか?
このように、私達はホームページの内容を把握したいです.実質的にはurlを通じてウェブページの内容を把握します.
Javaは2つの方法を提供する.
一つはURLから直接ページを読み取ることです.
一つはURLConnectionを通じてウェブページを読むことです.
その中のURLConnectionはhttpを中心とするクラスであり、httpを接続する関数について多く提供されています.
本論文ではURLConnectionに基づく例示的なコードを与える.
その前にまず、urlに関する異常を見てみます.javaの異常なメカニズムを知らない人は前のブログを参照してください.
URLを構成する異常Mal formedURLException生成条件:urlの文字列が空かどうかは識別できないプロトコルです.
作成 URLConnectionの異常IOException発生条件:openConnectionが失敗しました.openConnectionに注意する時、コードはまだリモートに接続されていません.接続のための準備をしています.
総合コード
http://docs.oracle.com/javase/tutorial/networking/urls/index.html
一tcp概要
1 tcpはネットワーク中点対点の伝送を実現する.
2送信は、ポーツとsocketsを通じて行われる.
ポータブルは異なるタイプの伝送を提供している(例えばhttpのportは80)
1)socketsは特定のポートに結びつけられ、伝送機能を提供することができる.
2)一つのポロは複数のsocketに接続できます.
二URL概要
URLはインターネットから入手できるリソースの位置とアクセス方法を簡潔に示すもので、インターネット上の標準リソースのアドレスである.
インターネット上のすべてのファイルには唯一のURLがあります.ファイルの位置やブラウザはどうすればいいですか?
このように、私達はホームページの内容を把握したいです.実質的にはurlを通じてウェブページの内容を把握します.
Javaは2つの方法を提供する.
一つはURLから直接ページを読み取ることです.
一つはURLConnectionを通じてウェブページを読むことです.
その中のURLConnectionはhttpを中心とするクラスであり、httpを接続する関数について多く提供されています.
本論文ではURLConnectionに基づく例示的なコードを与える.
その前にまず、urlに関する異常を見てみます.javaの異常なメカニズムを知らない人は前のブログを参照してください.
URLを構成する異常Mal formedURLException生成条件:urlの文字列が空かどうかは識別できないプロトコルです.
作成 URLConnectionの異常IOException発生条件:openConnectionが失敗しました.openConnectionに注意する時、コードはまだリモートに接続されていません.接続のための準備をしています.
総合コード
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
public class SimpleNetSpider {
public static void main(String[] args) {
try{
URL u = new URL("http://docs.oracle.com/javase/tutorial/networking/urls/");
URLConnection connection = u.openConnection();
HttpURLConnection htCon = (HttpURLConnection) connection;
int code = htCon.getResponseCode();
if (code == HttpURLConnection.HTTP_OK)
{
System.out.println("find the website");
BufferedReader in=new BufferedReader(new InputStreamReader(htCon.getInputStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
}
else
{
System.out.println("Can not access the website");
}
}
catch(MalformedURLException e )
{
System.out.println("Wrong URL");
}
catch(IOException e)
{
System.out.println("Can not connect");
}
}
}
参考文献:http://docs.oracle.com/javase/tutorial/networking/urls/index.html