xpathテクニック
989 ワード
pythonのxpathはdivタグ内のhtmlコンテンツを取得する機能を持っていません.つまりdivまたはaタグのinnerhtmlを取得し、小さなプログラムを書いて実現します.
結果:
XPath軸(XPath Axes)は、現在のノードに対するノードセットを定義します.
# , html
def getinnerhtml(data):
return data[data.find(">")+1:data.rfind("")]
str1="OK[ ]"
print(getinnerhtml(str1))
結果:
OK[ ]
XPath軸(XPath Axes)は、現在のノードに対するノードセットを定義します.
1、child
2、parent
3、descendant ( 、 )
4、ancestor ( 、 )
5、descendant-or-self ( 、 )
6、ancestor-or-self ( 、 )
7、preceding-sibling
8、following-sibling
9、preceding
10、following
11、self
12、attribute
13、namespace
preceding-sibling, ,
parent , “ ” ( )。