python解析URLには特殊な記号が含まれているアドレス

1956 ワード

要約
今日はcurlでsourアドレスクエリデータを呼び出した時にエラーが発生しました.URLアドレスに[ が含まれていることが分かりました.shellのcurlコマンドはだめです.PythonのurllibパケットがURLアドレスを解析できると考えています.これを試してみます.
curl実行エラー
エラーの場合:
root@pts/3 $ curl "http://192.168.xxx.xxx:8983/solr/core1_shard2_replica1/select?q=*:*&fq=sex:1&fq=activeTime_tdt:[NOW-20MINUTE TO NOW]&wt=json&indent=true"
curl: (3) [globbing] error: bad range specification after pos 96
中かっこが含まれているクエリー条件を除いたら、curlで大丈夫です.
root@pts/3 $ curl "http://192.168.xxx.xxx:8983/solr/core1_shard2_replica1/select?q=*:*&fq=sex:1&wt=json&indent=true"
{
  "responseHeader":{
    "status":0,
    "QTime":8,
    "params":{
      "q":"*:*",
      "indent":"true",
      "fq":"sex:1",
      "wt":"json"}},
      ...
python urllib
ここで具体的な例を示します.
root@pts/3 $ python
Python 2.7.5 (default, Nov 20 2015, 02:00:19)
[GCC 4.8.5 20150623 (Red Hat 4.8.5-4)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import urllib
>>> urlstr = "http://192.168.xxx.xxx:8983/solr/core1_shard2_replica1/select?q=*:*&fq=sex:1&fq=activeTime_tdt:[NOW-20MINUTE TO NOW]&wt=json&indent=true"
>>> result = urllib.urlopen(urlstr)
>>> print(result)
>
>>> print(result.read())
{
  "responseHeader":{
    "status":0,
    "QTime":11,
    "params":{
      "q":"*:*",
      "indent":"true",
      "fq":["sex:1",
        "activeTime_tdt:[NOW-20MINUTE TO NOW]"],
      "wt":"json"}},
最後にPythonの正規表現などを組み合わせて個性的なニーズを実現することができます.