健康數據拓析統計研究所

網址:https://hdas.ntu.edu.tw/

 

巨量資料及高速運算科技的普及,促成了AI應用時代的來臨。在背後支撐AI發展的資料科學領域已然成為顯學,大專院校也紛紛開設資料科學的相關系所以吸引更多人才投入,許多就業市場也把python和deep learning列為錄取的基本門檻。然而現今網路資訊發達,會執行deep learning說到底不是難事,只要有基本的程式編寫知識即可。這樣的趨勢固然對許多只追求結果而不在乎過程的分類問題提供了捷徑,然而這個被忽略的過程卻往往是通往更偉大成就的必經道路,而統計學則是通行證。統計學是處理資料的學問,其涵蓋的面向相當廣泛,從資料的蒐集、相對應的推論方法、到分析結果的解讀及應用都有詳細的探討與研究,可說是資料科學發展的基石。這也意味著正確的資料分析,在每一個環節都必須有統計學的把關,才能確保分析結果是有效且有用的。

 

傳統的 "data analysis" 將資料解構後硏究細部,是較為狹隘的概念。"data analytics"的含義較深廣,並具前瞻性。Data analytics除了研究資料各細部外,更注重各細部間彼此之關聯及互動,以及從過去累積至今之現有數據中找出様態或規律,藉以預測未來。Data analytics和 data analysis內涵的不同,英文字義是很清楚的,比如國際知名大學或研究機構多設置有"Institute for Data Analytics"或 "Center for Data Analytics"。然而data analytics至今仍無合適的中文翻譯,以彰顯和data analysis ("資料分析")的不同。此處我們提倡以"數據拓析"做為新所的中文名(健康數據拓析統計研究所)。拓析的意思是拓展研析,這個中文譯名恰如其分地反應出analytics的內涵。

 

傳統的統計學(statistics)其研究主題主要針對機率及統計的各項議題如隨機變數、抽樣分佈、假說檢定、估計理論、大樣本方法、迴歸分析及統計建模等等進行理論上的研究,許多大學也都有設立理論導向的統計研究所,並以上述主題為主要發展目標。然而,實務問題的迫切需求,會刺激統計學的全新發展,例如工程統計、財務統計、以及目前統計學主要研究領域之一的健康數據拓析統計(Health Data Analytics and Statistics)。健康數據拓析統計主要是由醫學及公共衛生的研究所面臨的實際問題以刺激其發展的統計領域。當今健康數據拓析統計學所探討的主要議題如下,皆值得深入研究、改良、並進一步發展。