精品精品国产理论在线 - 全国亚洲最大的av网站久久久 - 国产不卡视频一区二区三区四区 - 亚洲一区二区观看播放

科技創(chuàng)新 | 云文析:文本數(shù)據(jù)可視化分析

2019-05-02
萌泰科技
摘要:銳研·云文析(RING TEXT ANALYZER)是萌泰數(shù)據(jù)旗下文本大數(shù)據(jù)分析與挖掘云平臺(tái)。云文析應(yīng)用自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、人工智能、大數(shù)據(jù)等技術(shù),可對(duì)大規(guī)模文本數(shù)據(jù)進(jìn)行分析挖掘,并呈現(xiàn)可視化分析結(jié)果
對(duì)大規(guī)模文本的分析挖掘一直是學(xué)術(shù)界和工業(yè)界面臨的技術(shù)難題之一,隨著自然語(yǔ)言處理等人工智能技術(shù)的發(fā)展,通過(guò)計(jì)算機(jī)對(duì)大規(guī)模文本的深度挖掘和理解得以可能。銳研·云文析(RING TEXT ANALYZER)是萌泰數(shù)據(jù)旗下文本大數(shù)據(jù)分析與挖掘云平臺(tái)。云文析應(yīng)用自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、人工智能、大數(shù)據(jù)等技術(shù),可對(duì)大規(guī)模文本數(shù)據(jù)進(jìn)行分析挖掘,并呈現(xiàn)可視化分析結(jié)果。


云文析平臺(tái)集成了數(shù)據(jù)清洗、詞頻統(tǒng)計(jì)、詞云展現(xiàn)、文本分類、文本聚類、情感分析、主題分析、詞向量分析、詞共現(xiàn)網(wǎng)絡(luò)、事件網(wǎng)絡(luò)、新聞指數(shù)等各類可視化分析模型和工具。可支持從文本內(nèi)容中提取時(shí)間、空間、人物、機(jī)構(gòu)、事件、觀點(diǎn)、情感等內(nèi)容,實(shí)現(xiàn)對(duì)各類文本的多維度可視化呈現(xiàn)和分析研究。


平臺(tái)可為相關(guān)領(lǐng)域的學(xué)者、媒體機(jī)構(gòu)、政府機(jī)構(gòu)、企業(yè)等用戶提供新聞數(shù)據(jù)可視化分析和研究服務(wù),幫助用戶更好地洞察和了解社會(huì)現(xiàn)象,市場(chǎng)需求以及政治、經(jīng)濟(jì)、社會(huì)變遷的趨勢(shì)。


云文析在科研教學(xué)和社會(huì)服務(wù)等方面都具有重大的學(xué)術(shù)價(jià)值和應(yīng)用價(jià)值。在科研教學(xué)方面,國(guó)內(nèi)尚缺乏面向?qū)W術(shù)研究的文本大數(shù)據(jù)研究平臺(tái),本項(xiàng)目可以彌補(bǔ)這一短板。教學(xué)方面,本項(xiàng)目可以支持國(guó)內(nèi)社會(huì)科學(xué)專業(yè)師生進(jìn)行課堂教學(xué)和上機(jī)實(shí)踐,如面向新聞專業(yè)的課程可覆蓋研究方法設(shè)計(jì)、數(shù)據(jù)新聞、計(jì)算傳播學(xué)等課程,面向營(yíng)銷學(xué)的課程可包括數(shù)字營(yíng)銷,市場(chǎng)調(diào)查與研究等課程;科研方面,本項(xiàng)目可以幫助社會(huì)科學(xué)領(lǐng)域的研究人員完成原始資料收集、文本內(nèi)容分析、輿情分析、傳播路徑和脈絡(luò)的梳理、數(shù)據(jù)可視化等研究?jī)?nèi)容和操作。


在社會(huì)服務(wù)方面,其應(yīng)用主要在于新聞?shì)浨轭I(lǐng)域。該項(xiàng)目可以為政府、企業(yè)和媒體從業(yè)者等不同用戶群體帶來(lái)價(jià)值。政府管理者可以通過(guò)對(duì)本平臺(tái)更全面地了解社情民意,分析突發(fā)事件的輿情規(guī)律,洞察經(jīng)濟(jì)社會(huì)發(fā)展的時(shí)代特征;企業(yè)用戶可以通過(guò)本平臺(tái)了解消費(fèi)者輿情,產(chǎn)品需求變化,競(jìng)爭(zhēng)對(duì)手動(dòng)態(tài)等信息;媒體記者可以通過(guò)本平臺(tái)梳理出新聞事件傳播的路徑,找到不同事件之間的關(guān)聯(lián)性。


云文析主要功能如下:

(1)數(shù)據(jù)清洗
 對(duì)文本庫(kù)進(jìn)行數(shù)據(jù)預(yù)處理的可視化工具;
 創(chuàng)建不同的清洗條件,根據(jù)設(shè)置的條件能快速清洗數(shù)據(jù);
 對(duì)清洗的數(shù)據(jù)可以保存到新的文本庫(kù)。
(2)銳研NLP
 集成主流自然語(yǔ)言處理(NLP)引擎;
 支持文本分詞,詞性標(biāo)注,文本摘要,關(guān)鍵詞提取和詞云展現(xiàn);
 支持自定義文本語(yǔ)料庫(kù)。
(3)詞頻統(tǒng)計(jì)
 支持詞頻統(tǒng)計(jì),以及詞云圖分析展現(xiàn);
 可根據(jù)不同的詞性進(jìn)行篩選統(tǒng)計(jì);
 可根據(jù)條件篩選對(duì)部分文本進(jìn)行詞頻統(tǒng)計(jì)。
(4)文本分類
 支持多種分類算法;
 支持對(duì)分類訓(xùn)練集的管理和維護(hù);
 支持對(duì)多種分類結(jié)果進(jìn)行比較。
(5)文本聚類
 支持K-Means, STC, Lingo等多種聚類算法;
 支持聚類算法參數(shù)的調(diào)整;
 聚類結(jié)果可以導(dǎo)出。
(6)情感分析
 支持進(jìn)行基于情感字典的情感分析;
 集成多個(gè)情感字典庫(kù),包括臺(tái)灣大學(xué)中文情感庫(kù)、LIWC等。
 支持自定義情感字典庫(kù)。
詞向量分析
 對(duì)一組文本進(jìn)行Word2Vec詞向量分析;
 可查詢?cè)~的詞向量;
 可以發(fā)現(xiàn)詞的相似性。
(7) 主題分析
 基于LDA算法對(duì)一組文本進(jìn)行主題分析;
 可以設(shè)定LDA算法的模型參數(shù);
 可以查詢算法運(yùn)行的主題分類結(jié)果。
(8)詞共現(xiàn)分析
 基于詞共現(xiàn)網(wǎng)絡(luò)算法對(duì)一組文本進(jìn)行分析;
 支持查詢?cè)~和詞共現(xiàn)的概率;
 可視化呈現(xiàn)詞共現(xiàn)網(wǎng)絡(luò)圖。

作為對(duì)銳研·云采集(RING SPIDER PLATFORM)的姊妹產(chǎn)品,云文析可支持對(duì)爬蟲采集的文本數(shù)據(jù)進(jìn)行深度分析和挖掘。云文析亦可支持分析用戶上傳的自定義文本數(shù)據(jù)。就部署方式而言,云文析既可支持獨(dú)立的公有云或私有云部署,也可以與銳研·云采集一起集成到銳研文本大數(shù)據(jù)研究平臺(tái)(RING BIGRESEARCH)上。
    發(fā)表評(píng)論
    評(píng)論通過(guò)審核后顯示。
      銳研中國(guó)
    移動(dòng)訪問(wèn)