Javaでのバックグラウンド取得url最終アドレス

3988 ワード

Javaのurlは最終アドレスを取得しますここにカスタムディレクトリのタイトルを書きます
Javaの中のHttpClientあるいはHttpURLConnectionの方法はすべてバックグラウンドのウェブサイトの転送に対してジャンプして、もし1つの中間ページがjsがwindow.location.hrefをジャンプするならば盲目になって、バックグラウンドがjsの方法を呼び出すことができないためです
この場合、爬虫類メソッドを使用してページ全体をキャプチャしurlを取得できます.
欠点は明らかで、遅くて大量の使用はメモリのオーバーフローをもたらすことができて、しかし結局役に立ちます、先に記録します
		WebClient web = new WebClient(BrowserVersion.FIREFOX_60);
		web.getOptions().setJavaScriptEnabled(true);//   JS   ,   true
		web.setJavaScriptTimeout(1000);//   JS       
		web.getOptions().setCssEnabled(false);//   css  
		web.getOptions().setThrowExceptionOnScriptError(false);// js     ,      
		web.getOptions().setTimeout(1000); //         
		HtmlPage html = web.getPage(url);//  url  
		System.out.println("html.getBaseURL():"+html.getBaseURL());
		web.close();//