高校案例:南京大學新聞大數(shù)據(jù)平臺
- 2019-03-04
- admin
2018年10月29日,由上海萌泰數(shù)據(jù)科技股份有限公司和南京大學新聞傳播學院合作開發(fā)的南京大學雙創(chuàng)新聞數(shù)據(jù)平臺的在南京大學新聞傳播學院進行了成果展示。
在此次會議上,上海萌泰數(shù)據(jù)科技股份有限公司總經(jīng)理李軍詳細介紹了新聞數(shù)據(jù)平臺的功能。包括網(wǎng)頁爬蟲、搜索引擎、文本分析和分布式計算技術等。
伴隨著專業(yè)細化、學科交叉、知識爆炸的信息社會全面來臨,各行業(yè)各層次人士都面臨著如何及時、準確、高效地獲取信息這一社會性難題。由國家統(tǒng)籌建設的大型綜合化數(shù)據(jù)庫,在滿足社會信息需求方面主要地扮演了“百科全書”式角色, 其重要性不可低估。
但是,對于特定地域、特定行業(yè)、特定專業(yè)或特定專題的個性化信息需求,綜合數(shù)據(jù)庫大概主要起方向性、指導性作用,而不能很好滿足諸如科研人員、市場企劃人員等對特定領域信息的系統(tǒng)深入需求。因此,為了滿足數(shù)字化信息的集合和用戶個性化需求的發(fā)展, 迫切需要建設一批有規(guī)模、有特色、有權威的專題數(shù)據(jù)庫。
南京大學雙創(chuàng)新聞數(shù)據(jù)平臺的建設
1.建設意義
南京大學雙創(chuàng)新聞數(shù)據(jù)庫基于靈活的可配置的數(shù)據(jù)采集和數(shù)據(jù)處理規(guī)則,力圖打造成一個公共的新聞研究開放數(shù)據(jù)庫平臺,支持定制面向各個主題的專題數(shù)據(jù)庫,最終建設成能夠覆蓋全媒體,全領域,全時域的新聞事件數(shù)據(jù)庫,為相關領域的學者、媒體機構、政府機構等用戶提供分析和研究的公共數(shù)據(jù)服務平臺。
2.服務對象
南京大學“雙創(chuàng)”新聞數(shù)據(jù)平臺是一個面向廣大研發(fā)人員的特色新聞大數(shù)據(jù)開放研究平臺,其服務對象主要包括開發(fā)人員、項目經(jīng)理、用戶、測試人員或文檔的編寫人員等。
3.內(nèi)容介紹
新聞數(shù)據(jù)庫共收錄了中國大陸地區(qū)的300家媒體網(wǎng)站上的數(shù)據(jù)。新聞內(nèi)容覆蓋2015年國家網(wǎng)信辦公布可供網(wǎng)站轉載新聞的所有新聞單位(合計380家)的全部數(shù)據(jù),包括中央新聞網(wǎng)站、部委網(wǎng)站、地方新聞網(wǎng)站、中央新聞單位(報刊和雜志)、省級新聞單位(報刊)以及廣電新聞機構。

南京大學“雙創(chuàng)”新聞數(shù)據(jù)庫及分析平臺是一套面向互聯(lián)網(wǎng)新聞大數(shù)據(jù)領域,集互聯(lián)網(wǎng)數(shù)據(jù)動態(tài)采集、文本搜索、文本分析、專題數(shù)據(jù)庫管理于一體的大數(shù)據(jù)研究服務平臺。平臺能夠提供對互聯(lián)網(wǎng)文本數(shù)據(jù)的采集、存儲、檢索和分析等功能,平臺可以集成 Hadoop 技術框架,支持分布式計算,具有穩(wěn)定、可靠、高性能和高可擴展性。
目前南京大學“雙創(chuàng)”新聞數(shù)據(jù)平臺尚處于小規(guī)模使用中,有望今年年底正式對外提供服務。如需了解更多詳細信息,敬請關注銳研中國!
- 上海萌泰數(shù)據(jù)科技助力湘南學院教育創(chuàng)新,李軍博士主講《作為研究方法的人工智能》
- 上海市社會工作研究會2024年學術年會暨第二屆長三角金融社會工作論壇在滬舉行
- 人工智能如何改變社會科學的面貌?——AI與社會科學的學術對話紀實(下)
- 人工智能如何改變社會科學的面貌?——AI與社會科學的學術對話紀實(上)
- 校企協(xié)同 | 浙江越秀外國語學院到訪上海萌泰數(shù)據(jù)
- 2024年(第十六屆)國際數(shù)據(jù)挖掘與應用統(tǒng)計研究會年會在哈爾濱商業(yè)大學成功舉辦
- 全面深化改革與中國社會學新征程:中國社會學會2024年學術年會在哈爾濱工程大學舉行