xpathを勉強してこれを見れば十分です.
5338 ワード
前言
偶然
理解する
≪インスタンス|Instance|emdw≫
ノードの選択 を選択する. を選択 を考慮することなく、選択に一致する現在のノードから選択される. を選択 を選択 を選択
注意:これらの構文は混在して使用できます.
式#シキ#
説明
article
すべてのarticle要素のすべてのサブノードを選択
/article
ルート要素articleの選択
article/a
articleに属するすべてのサブエレメントのaエレメントを選択します(位置は考慮しません)
/div
すべてのdiv要素を選択
article//div
すべてのarticle要素の子孫div要素を選択
//@class
classという名前のすべてのプロパティを選択
複数のclassを選択
偶然
python
のscrapy
フレームワークを見て、興味の吸引のため、最近入門式の学習のようで、学習の過程の中でxpathの関連知識に出会って、ここで総括の方面の後日の照会と記憶を行います.参考:菜鳥チュートリアル理解する
XPath
は、XML
ドキュメントで情報を検索する言語です.もちろんHTML
にも使えます.scrapyでページに必要なコンテンツを検索します.≪インスタンス|Instance|emdw≫
<bookstore>
<h1>Exampleh1>
<book>
<title lang="eng">Harry Pottertitle>
<price>29.99price>
book>
<book>
<title lang="eng">Learning XMLtitle>
<price>39.95price>
book>
bookstore>
ノードの選択
:このノードのすべてのサブノード/
:ルートノードから//
:文書内のノードは、その位置(理解).
:現在のノード..
:現在のノードの親ノード@
:属性注意:これらの構文は混在して使用できます.
式#シキ#
説明
article
すべてのarticle要素のすべてのサブノードを選択
/article
ルート要素articleの選択
article/a
articleに属するすべてのサブエレメントのaエレメントを選択します(位置は考慮しません)
/div
すべてのdiv要素を選択
article//div
すべてのarticle要素の子孫div要素を選択
//@class
classという名前のすべてのプロパティを選択
複数のclassを選択