精品精品国产理论在线 - 全国亚洲最大的av网站久久久 - 国产不卡视频一区二区三区四区 - 亚洲一区二区观看播放

高校案例:南京大學新聞大數(shù)據(jù)平臺

2019-03-04
admin
摘要:南京大學新聞大數(shù)據(jù)平臺

2018年10月29日,由上海萌泰數(shù)據(jù)科技股份有限公司和南京大學新聞傳播學院合作開發(fā)的南京大學雙創(chuàng)新聞數(shù)據(jù)平臺的在南京大學新聞傳播學院進行了成果展示。


在此次會議上,上海萌泰數(shù)據(jù)科技股份有限公司總經(jīng)理李軍詳細介紹了新聞數(shù)據(jù)平臺的功能。包括網(wǎng)頁爬蟲、搜索引擎、文本分析和分布式計算技術等。

伴隨著專業(yè)細化、學科交叉、知識爆炸的信息社會全面來臨,各行業(yè)各層次人士都面臨著如何及時、準確、高效地獲取信息這一社會性難題。由國家統(tǒng)籌建設的大型綜合化數(shù)據(jù)庫,在滿足社會信息需求方面主要地扮演了“百科全書”式角色, 其重要性不可低估。

但是,對于特定地域、特定行業(yè)、特定專業(yè)或特定專題的個性化信息需求,綜合數(shù)據(jù)庫大概主要起方向性、指導性作用,而不能很好滿足諸如科研人員、市場企劃人員等對特定領域信息的系統(tǒng)深入需求。因此,為了滿足數(shù)字化信息的集合和用戶個性化需求的發(fā)展, 迫切需要建設一批有規(guī)模、有特色、有權威的專題數(shù)據(jù)庫。


南京大學雙創(chuàng)新聞數(shù)據(jù)平臺的建設

南京大學雙創(chuàng)新聞數(shù)據(jù)平臺的建設為社會科學學術研究搭建一個可以提供  全維度歷史數(shù)據(jù)查詢的新聞大數(shù)據(jù)開放研究平臺,平臺擬采用分布式文本  采集技術面向全網(wǎng)媒體構建面向各個領域,各個主題的各類新聞熱點事件  的數(shù)據(jù)庫,并應用文本分析、數(shù)據(jù)挖掘、人工智能、數(shù)據(jù)可視化等大數(shù)據(jù)  分析手段,從新聞文本內(nèi)容中提取時間、空間、人物、事件、觀點、情感  等內(nèi)容,實現(xiàn)對各類新聞事件的多維度可視化呈現(xiàn)和分析研究。


1.建設意義

南京大學雙創(chuàng)新聞數(shù)據(jù)庫基于靈活的可配置的數(shù)據(jù)采集和數(shù)據(jù)處理規(guī)則,力圖打造成一個公共的新聞研究開放數(shù)據(jù)庫平臺,支持定制面向各個主題的專題數(shù)據(jù)庫,最終建設成能夠覆蓋全媒體,全領域,全時域的新聞事件數(shù)據(jù)庫,為相關領域的學者、媒體機構、政府機構等用戶提供分析和研究的公共數(shù)據(jù)服務平臺。

2.服務對象

南京大學“雙創(chuàng)”新聞數(shù)據(jù)平臺是一個面向廣大研發(fā)人員的特色新聞大數(shù)據(jù)開放研究平臺,其服務對象主要包括開發(fā)人員、項目經(jīng)理、用戶、測試人員或文檔的編寫人員等。

3.內(nèi)容介紹

新聞數(shù)據(jù)庫共收錄了中國大陸地區(qū)的300家媒體網(wǎng)站上的數(shù)據(jù)。新聞內(nèi)容覆蓋2015年國家網(wǎng)信辦公布可供網(wǎng)站轉載新聞的所有新聞單位(合計380家)的全部數(shù)據(jù),包括中央新聞網(wǎng)站、部委網(wǎng)站、地方新聞網(wǎng)站、中央新聞單位(報刊和雜志)、省級新聞單位(報刊)以及廣電新聞機構。



南京大學“雙創(chuàng)”新聞數(shù)據(jù)庫及分析平臺是一套面向互聯(lián)網(wǎng)新聞大數(shù)據(jù)領域,集互聯(lián)網(wǎng)數(shù)據(jù)動態(tài)采集、文本搜索、文本分析、專題數(shù)據(jù)庫管理于一體的大數(shù)據(jù)研究服務平臺。平臺能夠提供對互聯(lián)網(wǎng)文本數(shù)據(jù)的采集、存儲、檢索和分析等功能,平臺可以集成 Hadoop 技術框架,支持分布式計算,具有穩(wěn)定、可靠、高性能和高可擴展性。

目前南京大學“雙創(chuàng)”新聞數(shù)據(jù)平臺尚處于小規(guī)模使用中,有望今年年底正式對外提供服務。如需了解更多詳細信息,敬請關注銳研中國!



    發(fā)表評論
    評論通過審核后顯示。
      銳研中國
    移動訪問