C#WebサイトのHTMLコンテンツを読み込む

2839 ワード

詳細については、HTMLソースの取得(文字のみ、判断コード、フィルタラベル)を参照してください.
本章はGB 2312コードのみを採用する
コード:
URL:サイトアドレス
public String GetHtml(String Url)
        {
            string sException=null;
            string sRslt=null;
            WebResponse oWebRps=null;
            WebRequest oWebRqst=WebRequest.Create(Url);
            oWebRqst.Timeout=50000;
            try
            {
                oWebRps=oWebRqst.GetResponse();
            }
            catch(WebException e)
            {
                    sException=e.Message.ToString();
                    MessageBox.Show(sException);
            }
            catch(Exception e)
            {
                    sException=e.ToString();
                    MessageBox.Show(sException);
            }
            finally
            {
                if(oWebRps!=null)
                {
                    StreamReader oStreamRd=new StreamReader(oWebRps.GetResponseStream(),Encoding.GetEncoding("GB2312"));
                    sRslt=oStreamRd.ReadToEnd();
                    oStreamRd.Close();
                    oWebRps.Close();
                }
            }
            return sRslt;
        }