やっかいなことの山を集める


今日はウェブサイトを採集したいです.ルビーを持って練習したいです.結果としてトラブルがたくさん発生しました.
正則を書きたくないので、プラグインをいくつか探してみました.
(1)scrapi、順調にインストールが完了しました.確かに情報が得られません.
require 'scrapi'
require 'open-uri'

task :dream => :environment do 
     url='http://www.hushibo.cn' 
     html = open(url).read
     
     puts html 
end
 
これだけで山のようにミスを報告して、本当に書き続ける自信がないです.次のHpricetに変えます.
gem install hpricot
 
結果はwindows ruby 1.9.1に入れられませんでした.万株はしょうがないので、nokogiriを使うしかないです.使う人は確かに少ないです.文書は探しにくいです.
require 'nokogiri'
require 'open-uri'

task :dreamtype => :environment do 
    doc = Nokogiri::HTML(open('http://www.hushibo.cn'))
    tpes = []
    doc.css("table.txt>td:nth-child(12)>a").each do |link|
        #puts link.content
	tpes.push(link.content)
    end
    #puts doc
    tpes.each do |t|
        #puts tpes.length
        Dream.create(:parent_id => 6,:name => t)
    end

end