有關 rest-client 抓取 當前網址的回應response
官方解說Rest-client
有時候會需要調用其他系統的端口而rest-client就是運用在這時候的
請先安裝rest-clientgem 'rest-client'
。
接下來安裝完成後讓我們開始測試以新北市為主
require 'rest-client'
response = RestClient.get "http://www.cwb.gov.tw/V7/forecast/taiwan/New_Taipei_City.htm"
response.body
會出現一堆亂碼但那些亂碼是給HTML看得接下來讓我們翻譯給人看的。使用 Nokogiri 他會抓取出 response 解析HTML 透過 CSS selctor從文件中比對出想要的資訊,這種方式就叫做網路爬蟲(web crawler) ,說白點就是翻譯成給人看的而不是給程式語言。
require 'nokogiri'
doc = Nokogiri::HTML.parse(response.body)
doc.css(".today .tem").map{ |x| x.text } # 得到 ["\n13°C\n", "\n2°C\n", "\n"]