精品精品国产理论在线 - 全国亚洲最大的av网站久久久 - 国产不卡视频一区二区三区四区 - 亚洲一区二区观看播放

學(xué)術(shù)研究 | 社會科學(xué)領(lǐng)域的大數(shù)據(jù)研究方法初探

2016-02-08
李軍 萌泰科技
摘要:大數(shù)據(jù)研究就是"樣本等于總體"的思維方式,大數(shù)據(jù)對研究范疇時和空間的拓展,以及其所揭示的規(guī)律和相關(guān)關(guān)系,能夠極大地促進(jìn)社會科學(xué)研究假設(shè)的提出

大數(shù)據(jù)研究就是"樣本等于總體"的思維方式,大數(shù)據(jù)對研究范疇時和空間的拓展,以及其所揭示的規(guī)律和相關(guān)關(guān)系,能夠極大地促進(jìn)社會科學(xué)研究假設(shè)的提出


在社會科學(xué)領(lǐng)域,大數(shù)據(jù)可以用來做描述性研究,亦可以用來做分析性研究。正如南京大學(xué)社會學(xué)院陳云松老師所言,“大數(shù)據(jù)在社會科學(xué)領(lǐng)域拓展了研究范疇的時間和空間”。過去無法獲取或者需要花費很大代價才能獲取的數(shù)據(jù),在今天變成可能或者更加容易。尤其是當(dāng)下的大數(shù)據(jù)時代,數(shù)據(jù)變得無比巨量,而且伴隨巨量數(shù)據(jù)產(chǎn)生的大數(shù)據(jù)處理技術(shù)也快速發(fā)展,這使得利用大數(shù)據(jù)的研究思維成為可能,并越來越獲得社會科學(xué)界的認(rèn)可和推崇。

其實,大數(shù)據(jù)研究并不是什么新的思維,近代統(tǒng)計學(xué)之父凱特勒(Quetelet)早在19 世紀(jì)二三十年代就從事過犯罪和富裕程度之間的大數(shù)據(jù)相關(guān)分析;著名社會學(xué)家涂爾干在1897 年的《自殺論》中將自殺者分門別類,試圖從他們的生活和自殺的機率間找出關(guān)聯(lián)性,這些都是典型的基于總體樣本的大數(shù)據(jù)分析思維,盡管那時的“大數(shù)據(jù)”的數(shù)據(jù)量相對較“小”。近幾年的大數(shù)據(jù)熱實際上是計算機信息技術(shù)發(fā)展,尤其是互聯(lián)網(wǎng),移動互聯(lián)網(wǎng),物聯(lián)網(wǎng)等技術(shù)的發(fā)展所催生出的一個概念或相關(guān)技術(shù)的總概括(本質(zhì)上和云計算熱是一回事),大家所經(jīng)常引用的大數(shù)據(jù)的4V(Volume, Variety,Velocity,Value)特征也是由IBM 提出的一個計算機科學(xué)領(lǐng)域的定義。

就社會科學(xué)研究方法層面,大數(shù)據(jù)研究就是"樣本等于總體(sample = population)"的思維方式,正如凱特勒和涂爾干所研究的一樣。這一研究方式,在近幾百年一直被人們所熟悉和使用,只是由于當(dāng)時社會生產(chǎn)力的局限性,總體不太輕易被獲取。自18 世紀(jì)統(tǒng)計學(xué)層面的抽樣理論誕生后,社會科學(xué)的研究才獲得了極大發(fā)展,因此,這使得我們?nèi)菀渍`認(rèn)為定量的社會科學(xué)研究似乎就等同于抽樣調(diào)查研究。仔細(xì)算來,這一歷史也不過就是二三百年。今天,隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等信息技術(shù)的發(fā)展一方面產(chǎn)生了大量的數(shù)據(jù),另一方面獲取和處理數(shù)據(jù)的成本更加低廉,技術(shù)更加先進(jìn),因此,我們突然發(fā)現(xiàn):總體不再是遙不可及,如果我能獲得總體,為什么我還要抽樣?一下子,大數(shù)據(jù)突然之間成了所有社會科學(xué)領(lǐng)域的人們所共同關(guān)注的話題。

傳統(tǒng)的小數(shù)據(jù)研究方法基于抽樣理論,當(dāng)前主要包括問卷法、訪談法等,而問卷法又包括電話問卷調(diào)查、移動面訪調(diào)查以及網(wǎng)絡(luò)問卷調(diào)查等三種主要形式。與小數(shù)據(jù)的抽樣相比,大數(shù)據(jù)強調(diào)的是全部樣本;與小數(shù)據(jù)的精確性相比,大數(shù)據(jù)允許存在一定范圍的不準(zhǔn)確性;與小數(shù)據(jù)的因果關(guān)系相比,大數(shù)據(jù)通過關(guān)聯(lián)性尋求自然和社會的變化規(guī)律。因此,大數(shù)據(jù)研究方法不僅補充了科學(xué)研究的范式,甚至可能動搖社會科學(xué)的傳統(tǒng)根基,產(chǎn)生顛覆性的變革。

與單次抽樣調(diào)查以及長期跟蹤調(diào)查相比,大數(shù)據(jù)研究的樣本量更大,持續(xù)觀測的時間更長。即使跟蹤調(diào)查的時間可能延續(xù)很長,但其仍然是不連續(xù)的觀測。普查是一個特例,其研究的樣本是總體,但就觀測的時間而言,仍然是不連續(xù)的。

以下是大數(shù)據(jù)研究和小數(shù)據(jù)研究的對比。

但是,社會科學(xué)領(lǐng)域的大數(shù)據(jù)研究方法或研究思維仍存在一些局限性,就目前而言,大數(shù)據(jù)的研究方法仍在探索階段。

首先,大數(shù)據(jù)的思維方式本身就是誕生自統(tǒng)計學(xué),它從來就是社會科學(xué)領(lǐng)域定量研究方法的一部分,過去就是,未來還是!

其次,大數(shù)據(jù)并不能囊括所有我們想要的數(shù)據(jù)(比如想法或直接態(tài)度),獲取和處理我們想要的數(shù)據(jù)也不是都很簡單和低成本(目前大部分?jǐn)?shù)據(jù)掌握在少數(shù)巨頭手中,獲取有成本),無論是從經(jīng)濟層面還是操作可行性層面,基于抽樣理論的小數(shù)據(jù)調(diào)研方式依然不可替代。

最后,大數(shù)據(jù)研究目前還僅停留在發(fā)現(xiàn)相關(guān)關(guān)系,對因果關(guān)系的解釋還需要進(jìn)一步依賴于定性研究或其他研究手段。但是,僅有相關(guān)是不夠的。從哲學(xué)層面人類對世界的探索和真理的追求來看,大數(shù)據(jù)研究最終一定會走向因果分析。從這一方面講,大數(shù)據(jù)研究絕不是終極手段,最多只能算研究方法之一。

當(dāng)然,今天我們在社會科學(xué)領(lǐng)域為什么如此重視大數(shù)據(jù),“重提”大數(shù)據(jù),我認(rèn)為,是因為技術(shù)的發(fā)展使得大數(shù)據(jù)研究更為便捷,而大數(shù)據(jù)對研究范疇時間和空間的拓展,以及其所揭示的規(guī)律和相關(guān)關(guān)系,能夠極大地促進(jìn)社會科學(xué)研究假設(shè)的提出,從而為因果關(guān)系的分析提供新的支撐,使得人們在追求真理的過程中,又多了一條康莊大道。

發(fā)表評論
評論通過審核后顯示。
  銳研中國
移動訪問