格式化

廣告

廣告2

2014年4月6日 星期日

[Android程式範例] 利用好用的HTML Parser-Jsoup抓取網頁資料


[Android程式範例] 利用好用的HTML Parser-Jsoup抓取網頁資料

jsoup一個Java函示庫專們給現實世界中的HTML工作的。它提供了很方便的API用於提取和操作資料,使用最佳的DOM、CSS、以及類似jquery的方法。

jsoup實現了WHATWG的HTML5規範,並解析HTML以相同的DOM作為現代瀏覽器做的。

  1. 一個URL、檔案或字串解析HTML
  2. 查找和提取數據,使用DOM遍歷或CSS選擇器
  3. 操作HTML元素,屬性和字串
  4. 對安全白名單乾淨的用戶提交內容,以防止XSS攻擊
  5. 輸出整齊的HTML

jsoup不只JAVA可以用,ANDROID也可以直接導入來作使用,本篇示範一個簡單的範例,是利用jsoup抓取中華民國文化部的最新公告,除了本身jsoup函式庫的利用之外,還有幾點是必須要注意的事項:

  1. 有關網路的操作一定要在新的執行序
  2. 有關UI元件的操作一定要交給Handler來做

以下就是完整範例
如果你真的很懶可以直接下載完整專案檔,直接eclipse開始利用

沒有留言 :