“范式”(paradigm)源自希臘詞“Paradeig-ma”,意指“模范”或“模型”。由美國科學(xué)史家、科學(xué)哲學(xué)家T.S.庫恩(Thomas Samuel Kuhn,1922~1996)于1962年在《科學(xué)革命的結(jié)構(gòu)》中提出,指科學(xué)家團體所共同遵從的思維和行為方式,體現(xiàn)了某個科學(xué)發(fā)展階段的特殊內(nèi)在結(jié)構(gòu),并隨著科學(xué)的發(fā)展而變化:幾千年前,為描述自然現(xiàn)象的經(jīng)驗或?qū)嶒灴茖W(xué)范式,即第一范式;幾百年前,為利用歸納法和數(shù)學(xué)模型進行理論科學(xué)研究的第二范式;幾十年前,為利用計算科學(xué)來模擬復(fù)雜現(xiàn)象的第三范式。
在數(shù)據(jù)爆炸性增長和大數(shù)據(jù)技術(shù)蓬勃發(fā)展的當代,美國資訊工程學(xué)家J.M.格雷(James Nicholas Gray,1944~ )在2007年提出了基于科學(xué)大數(shù)據(jù)來進行科學(xué)研究的第四范式——數(shù)據(jù)密集型范式。其研究特點是:數(shù)據(jù)由設(shè)備抓取或由模擬器/傳感器產(chǎn)生,數(shù)據(jù)依靠專門軟件得到處理,信息或知識利用計算機網(wǎng)絡(luò)進行組織、存儲和分享,科學(xué)發(fā)現(xiàn)依賴機器學(xué)習(xí)或人工智能進行。
天文學(xué)是最早采用數(shù)據(jù)密集型科學(xué)的學(xué)科之一,因其具有天然的數(shù)據(jù)驅(qū)動特征,例如:斯隆數(shù)字巡天(Sloan Digital Sky Survey; SDSS)最新的第16批公開釋放數(shù)據(jù)(DR16)的數(shù)據(jù)量達到了273TB;中國的天眼工程(Five-hundred-meter Aperture Spherical Telescope; FAST)每天都在產(chǎn)生PB級別的數(shù)據(jù),并配套專門的高性能計算和大數(shù)據(jù)存儲中心以支持其數(shù)據(jù)處理、存儲和分析。