已匯入:客家委員會

  • 匯入:https://sheethub.com/data.hakka.gov.tw
  • 網址:客家委員會
  • 網站分析:
    • 扣分:資料目錄、資料分類頁面沒有 unique url,所以必須用 header 去換頁
    • 扣分:每一個資料網址是一串 68FFE0C1-B157-4AE8-A5BB-189D2361FC70# hash 過的網址,並非有意義的流水號或分類。在爬的時候,需要先產生所有的連結,在一次性下載
    • 加分:提供表頭 餐廳名稱:restaurant 電話:tel 住址:address
    • 很多頁面只是 .pdf 或著是把另一個網站的連結放過來而已:公務統計預算書