已匯入:新竹縣政府

  • 匯入:https://sheethub.com/data.hsinchu.gov.tw
  • 網址:新竹縣政府
  • 網站分析:
    • 扣分:網頁上的 JSON、CSV 按鈕所導向的 API 頁面沒有辦法直接用程式讀取,會出現錯誤: CERT_UNTRUSTE。需要把頁面上 API 網址的 https 改成 http,頁面居然會出現下列程式碼,然後伺服器才會將使用者導入到 https。但因為頁面的 http 的加密強度不夠,導致 node.js 的 request 會因為安全性問題沒有辦法讀取網頁。需要加上 "rejectUnauthorized": false 才可以解決。
var url = window.location.href;  
url = url.replace("http","https");  
window.location.replace(url);  
    • 扣分:API 頁面不是直接資料,而是包在一個 <html> 的檔案中,這導致 .csv 檔案中的換行 \n 沒有辦法正確顯示,而變成空格。而 .csv 檔案本身也有一些問題,導致幾個檔案的欄位錯亂
    • 扣分:JSON API 裡面則是先包了一層 "Table"才有內容,多此一舉,應該直接有內容。
{
    Table: [
        {
            動物編號: "(犬) 103E0143",
        },
        {
            動物編號: "(犬) 103E0144",
        }
    ]
}
    • 扣分:每一個資料網址是一串 68FFE0C1-B157-4AE8-A5BB-189D2361FC70# hash過的網址,並非有意義的流水號或分類。在爬的時候,需要先產生所有的連結,在一次性下載。
    • 完全空的資料列
    • 加分:頁面 / csv / json 的頁面 share 同一個 token
    • 很訝異的點,是這一個網頁列出了很多(19 個)應用。或許是因為政府有舉辦相關比賽?