科技創(chuàng)新 | 云文析:文本數(shù)據(jù)可視化分析
- 2019-05-02
- 萌泰科技
云文析平臺(tái)集成了數(shù)據(jù)清洗、詞頻統(tǒng)計(jì)、詞云展現(xiàn)、文本分類、文本聚類、情感分析、主題分析、詞向量分析、詞共現(xiàn)網(wǎng)絡(luò)、事件網(wǎng)絡(luò)、新聞指數(shù)等各類可視化分析模型和工具。可支持從文本內(nèi)容中提取時(shí)間、空間、人物、機(jī)構(gòu)、事件、觀點(diǎn)、情感等內(nèi)容,實(shí)現(xiàn)對(duì)各類文本的多維度可視化呈現(xiàn)和分析研究。

平臺(tái)可為相關(guān)領(lǐng)域的學(xué)者、媒體機(jī)構(gòu)、政府機(jī)構(gòu)、企業(yè)等用戶提供新聞數(shù)據(jù)可視化分析和研究服務(wù),幫助用戶更好地洞察和了解社會(huì)現(xiàn)象,市場(chǎng)需求以及政治、經(jīng)濟(jì)、社會(huì)變遷的趨勢(shì)。
云文析在科研教學(xué)和社會(huì)服務(wù)等方面都具有重大的學(xué)術(shù)價(jià)值和應(yīng)用價(jià)值。在科研教學(xué)方面,國(guó)內(nèi)尚缺乏面向?qū)W術(shù)研究的文本大數(shù)據(jù)研究平臺(tái),本項(xiàng)目可以彌補(bǔ)這一短板。教學(xué)方面,本項(xiàng)目可以支持國(guó)內(nèi)社會(huì)科學(xué)專業(yè)師生進(jìn)行課堂教學(xué)和上機(jī)實(shí)踐,如面向新聞專業(yè)的課程可覆蓋研究方法設(shè)計(jì)、數(shù)據(jù)新聞、計(jì)算傳播學(xué)等課程,面向營(yíng)銷學(xué)的課程可包括數(shù)字營(yíng)銷,市場(chǎng)調(diào)查與研究等課程;科研方面,本項(xiàng)目可以幫助社會(huì)科學(xué)領(lǐng)域的研究人員完成原始資料收集、文本內(nèi)容分析、輿情分析、傳播路徑和脈絡(luò)的梳理、數(shù)據(jù)可視化等研究?jī)?nèi)容和操作。
在社會(huì)服務(wù)方面,其應(yīng)用主要在于新聞?shì)浨轭I(lǐng)域。該項(xiàng)目可以為政府、企業(yè)和媒體從業(yè)者等不同用戶群體帶來(lái)價(jià)值。政府管理者可以通過(guò)對(duì)本平臺(tái)更全面地了解社情民意,分析突發(fā)事件的輿情規(guī)律,洞察經(jīng)濟(jì)社會(huì)發(fā)展的時(shí)代特征;企業(yè)用戶可以通過(guò)本平臺(tái)了解消費(fèi)者輿情,產(chǎn)品需求變化,競(jìng)爭(zhēng)對(duì)手動(dòng)態(tài)等信息;媒體記者可以通過(guò)本平臺(tái)梳理出新聞事件傳播的路徑,找到不同事件之間的關(guān)聯(lián)性。
云文析主要功能如下:
(1)數(shù)據(jù)清洗對(duì)文本庫(kù)進(jìn)行數(shù)據(jù)預(yù)處理的可視化工具;
創(chuàng)建不同的清洗條件,根據(jù)設(shè)置的條件能快速清洗數(shù)據(jù);
對(duì)清洗的數(shù)據(jù)可以保存到新的文本庫(kù)。
(2)銳研NLP
集成主流自然語(yǔ)言處理(NLP)引擎;
支持文本分詞,詞性標(biāo)注,文本摘要,關(guān)鍵詞提取和詞云展現(xiàn);
支持自定義文本語(yǔ)料庫(kù)。
(3)詞頻統(tǒng)計(jì)
支持詞頻統(tǒng)計(jì),以及詞云圖分析展現(xiàn);
可根據(jù)不同的詞性進(jìn)行篩選統(tǒng)計(jì);
可根據(jù)條件篩選對(duì)部分文本進(jìn)行詞頻統(tǒng)計(jì)。
(4)文本分類
支持多種分類算法;
支持對(duì)分類訓(xùn)練集的管理和維護(hù);
支持對(duì)多種分類結(jié)果進(jìn)行比較。
(5)文本聚類
支持K-Means, STC, Lingo等多種聚類算法;
支持聚類算法參數(shù)的調(diào)整;
聚類結(jié)果可以導(dǎo)出。
(6)情感分析
支持進(jìn)行基于情感字典的情感分析;
集成多個(gè)情感字典庫(kù),包括臺(tái)灣大學(xué)中文情感庫(kù)、LIWC等。
支持自定義情感字典庫(kù)。
詞向量分析
對(duì)一組文本進(jìn)行Word2Vec詞向量分析;
可查詢?cè)~的詞向量;
可以發(fā)現(xiàn)詞的相似性。
(7) 主題分析
基于LDA算法對(duì)一組文本進(jìn)行主題分析;
可以設(shè)定LDA算法的模型參數(shù);
可以查詢算法運(yùn)行的主題分類結(jié)果。
(8)詞共現(xiàn)分析
基于詞共現(xiàn)網(wǎng)絡(luò)算法對(duì)一組文本進(jìn)行分析;
支持查詢?cè)~和詞共現(xiàn)的概率;
可視化呈現(xiàn)詞共現(xiàn)網(wǎng)絡(luò)圖。
作為對(duì)銳研·云采集(RING SPIDER PLATFORM)的姊妹產(chǎn)品,云文析可支持對(duì)爬蟲采集的文本數(shù)據(jù)進(jìn)行深度分析和挖掘。云文析亦可支持分析用戶上傳的自定義文本數(shù)據(jù)。就部署方式而言,云文析既可支持獨(dú)立的公有云或私有云部署,也可以與銳研·云采集一起集成到銳研文本大數(shù)據(jù)研究平臺(tái)(RING BIGRESEARCH)上。
- 上海萌泰數(shù)據(jù)科技助力湘南學(xué)院教育創(chuàng)新,李軍博士主講《作為研究方法的人工智能》
- 上海市社會(huì)工作研究會(huì)2024年學(xué)術(shù)年會(huì)暨第二屆長(zhǎng)三角金融社會(huì)工作論壇在滬舉行
- 人工智能如何改變社會(huì)科學(xué)的面貌?——AI與社會(huì)科學(xué)的學(xué)術(shù)對(duì)話紀(jì)實(shí)(下)
- 人工智能如何改變社會(huì)科學(xué)的面貌?——AI與社會(huì)科學(xué)的學(xué)術(shù)對(duì)話紀(jì)實(shí)(上)
- 校企協(xié)同 | 浙江越秀外國(guó)語(yǔ)學(xué)院到訪上海萌泰數(shù)據(jù)
- 2024年(第十六屆)國(guó)際數(shù)據(jù)挖掘與應(yīng)用統(tǒng)計(jì)研究會(huì)年會(huì)在哈爾濱商業(yè)大學(xué)成功舉辦
- 全面深化改革與中國(guó)社會(huì)學(xué)新征程:中國(guó)社會(huì)學(xué)會(huì)2024年學(xué)術(shù)年會(huì)在哈爾濱工程大學(xué)舉行
- 全球視野 | Information and Communication Technologies in Social Work
- 學(xué)術(shù)研究 | CAI調(diào)研方法概述
- 大趨勢(shì) | 下一代調(diào)研技術(shù)發(fā)展趨勢(shì)
- 市場(chǎng)前沿 | 移動(dòng)面訪在中國(guó)家庭發(fā)展追蹤調(diào)查中的應(yīng)用
- 市場(chǎng)前沿 | 云計(jì)算、大數(shù)據(jù)與統(tǒng)計(jì)局信息化建設(shè)
- 卷首語(yǔ) | 數(shù)據(jù)的靈性
- 市場(chǎng)前沿 | 云調(diào)研平臺(tái)助推高??蒲薪虒W(xué)工作