xpathテクニック

989 ワード

pythonのxpathはdivタグ内のhtmlコンテンツを取得する機能を持っていません.つまりdivまたはaタグのinnerhtmlを取得し、小さなプログラムを書いて実現します.
                        
#       ,       html     
def getinnerhtml(data):
    return data[data.find(">")+1:data.rfind("")]
str1="OK[  ]"
print(getinnerhtml(str1))

結果:
OK[  ]

XPath軸(XPath Axes)は、現在のノードに対するノードセットを定義します.
 1、child              

 2、parent            

 3、descendant              ( 、  )

 4、ancestor             ( 、   )

 5、descendant-or-self              ( 、  )        

 6、ancestor-or-self             ( 、   )        

 7、preceding-sibling                

 8、following-sibling                

 9、preceding                        

 10、following                        

 11、self        

 12、attribute             

 13、namespace                

 preceding-sibling,               ,
    parent         , “  ”  (        )。