やっかいなことの山を集める
今日はウェブサイトを採集したいです.ルビーを持って練習したいです.結果としてトラブルがたくさん発生しました.
正則を書きたくないので、プラグインをいくつか探してみました.
(1)scrapi、順調にインストールが完了しました.確かに情報が得られません.
これだけで山のようにミスを報告して、本当に書き続ける自信がないです.次のHpricetに変えます.
結果はwindows ruby 1.9.1に入れられませんでした.万株はしょうがないので、nokogiriを使うしかないです.使う人は確かに少ないです.文書は探しにくいです.
正則を書きたくないので、プラグインをいくつか探してみました.
(1)scrapi、順調にインストールが完了しました.確かに情報が得られません.
require 'scrapi'
require 'open-uri'
task :dream => :environment do
url='http://www.hushibo.cn'
html = open(url).read
puts html
end
これだけで山のようにミスを報告して、本当に書き続ける自信がないです.次のHpricetに変えます.
gem install hpricot
結果はwindows ruby 1.9.1に入れられませんでした.万株はしょうがないので、nokogiriを使うしかないです.使う人は確かに少ないです.文書は探しにくいです.
require 'nokogiri'
require 'open-uri'
task :dreamtype => :environment do
doc = Nokogiri::HTML(open('http://www.hushibo.cn'))
tpes = []
doc.css("table.txt>td:nth-child(12)>a").each do |link|
#puts link.content
tpes.push(link.content)
end
#puts doc
tpes.each do |t|
#puts tpes.length
Dream.create(:parent_id => 6,:name => t)
end
end