google code prettify

2016年3月19日 星期六

運用Jsoup取得網頁資訊

如果要使用Java去parse Web page, 可以使用Jsoup,簡單好用
以下範例為使用jsoup抓取yahoo 首頁的新聞標題



package test.charles.JsoupExample;

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class App 
{
    public static void main( String[] args ) throws IOException
    {
     //read yahoo home page
     String url  = "https://tw.yahoo.com/";
     Document doc = Jsoup.connect(url).get();
     
     //get first news tab one
     Element t1 = doc.getElementById("t1");
     
     //get news title
     Elements newsTitle = t1.select("a[href] > span");
     
     //print size
        System.out.println("size:" + newsTitle.size());
        
        //print news title
        for(Element e:newsTitle){
         System.out.println("title:" + e.text());
        }
        
    }
}




程式碼可以至github下載

沒有留言:

張貼留言