銳研·云文析:文本分析和挖掘系統(tǒng)
- 2016-02-06
- 萌泰科技
一、概述
銳研文本分析和挖掘系統(tǒng)(Ring BigResearch TextAnalyzer)是一套基于自然語(yǔ)言處理(NLP)技術(shù)的文本分析和挖掘軟件,支持對(duì)文本進(jìn)行內(nèi)容分析,利用自然語(yǔ)言處理(NLP)對(duì)文本進(jìn)行分詞,詞性標(biāo)注和詞頻統(tǒng)計(jì)。平臺(tái)可集成中文處理引擎和多種文本分析算法,支持結(jié)合系統(tǒng)和用戶自定義的詞匯字典庫(kù)進(jìn)行各類(lèi)詞頻分析、情感分析、實(shí)體抽取、短語(yǔ)抽取、文本分類(lèi)、文本聚類(lèi)、主題模型、詞向量分析、共現(xiàn)分析、事件分析等。
二、產(chǎn)品功能
1、系統(tǒng)集成
作為子系統(tǒng)能集成到統(tǒng)一的云管理平臺(tái),共享云平臺(tái)的統(tǒng)一用戶管理功能。
2、文本庫(kù)管理
提供對(duì)分析文本庫(kù)的統(tǒng)一管理,包括建立文本庫(kù)的子文本庫(kù)管理;支持對(duì)文本進(jìn)行快速的統(tǒng)計(jì)分析,可根據(jù)數(shù)據(jù)源、日期等條件對(duì)所有文本進(jìn)行數(shù)量統(tǒng)計(jì)。
3、數(shù)據(jù)導(dǎo)入
支持?jǐn)?shù)據(jù)從文件導(dǎo)入,從云采集平臺(tái)導(dǎo)入和從文本數(shù)據(jù)庫(kù)直接導(dǎo)入。
4、數(shù)據(jù)清洗
提供對(duì)文本庫(kù)的文本的可視化增刪改查處理,支持?jǐn)?shù)據(jù)去重和數(shù)據(jù)替換。
5、文本分詞
利用自然語(yǔ)言處理(NLP)分詞算法對(duì)文本進(jìn)行分詞,詞性標(biāo)注;支持選擇不同的分詞算法;支持系統(tǒng)和用戶自定義的詞匯字典庫(kù)。
6、詞頻統(tǒng)計(jì)
支持對(duì)文本進(jìn)行詞頻統(tǒng)計(jì);可根據(jù)詞性篩選關(guān)鍵詞或自定義關(guān)鍵詞生成詞云圖。
7、文本分類(lèi)
根據(jù)一個(gè)訓(xùn)練集,對(duì)新的文本進(jìn)行數(shù)據(jù)分類(lèi),提供對(duì)分類(lèi)訓(xùn)練集的管理;集成貝葉斯分類(lèi) ,BP神經(jīng)網(wǎng)絡(luò)分類(lèi) , CNN深度學(xué)習(xí)分類(lèi)等分類(lèi)算法。
8、文本聚類(lèi)
在沒(méi)有訓(xùn)練集的情況下,根據(jù)算法對(duì)所有文本進(jìn)行聚類(lèi)分析,集成K-means聚類(lèi),DBSCAN聚類(lèi),聚合聚類(lèi),BIRCH聚類(lèi),Mini-batch聚類(lèi),均值漂移聚類(lèi),光譜聚類(lèi),高斯混合聚類(lèi),ISODATA聚類(lèi)等聚類(lèi)算法。
9、情感分析
支持根據(jù)情感字典庫(kù)來(lái)判斷某一個(gè)文章的正負(fù)情感,集成常用的中文情感詞典。
10、詞向量分析
基礎(chǔ)詞向量分析模型,能夠?qū)o定的文本集進(jìn)行詞向量分析,可以實(shí)時(shí)查詢分析結(jié)果和可視化呈現(xiàn)。
11、主題分析
集成LDA主題分析模型,能夠自動(dòng)對(duì)給定的文本集進(jìn)行主題建模,支持自動(dòng)推薦最優(yōu)主題數(shù)。
12、自動(dòng)編碼
能夠自動(dòng)根據(jù)文本的關(guān)鍵詞規(guī)則為文本進(jìn)行自動(dòng)編碼。
13、短語(yǔ)抽取
可根據(jù)詞性權(quán)重,長(zhǎng)度權(quán)重,主題突出權(quán)重等提取出文本中的短語(yǔ),并進(jìn)行頻次統(tǒng)計(jì)。
14、詞共現(xiàn)網(wǎng)絡(luò)
能夠?qū)o定的文本分析一組詞的共現(xiàn)概率,生成詞共現(xiàn)網(wǎng)絡(luò)圖。
15、事件提取
能夠根據(jù)事件詞典庫(kù)提取文本中的核心事件,并進(jìn)行統(tǒng)計(jì);支持用戶自定義事件詞典庫(kù);事件包括事件分類(lèi)、參與者、時(shí)間、地點(diǎn)等屬性。
三、特色和優(yōu)勢(shì)
強(qiáng)大的數(shù)據(jù)處理
- 數(shù)據(jù)清洗:去重、替換、篩選、排序
- 數(shù)據(jù)組合:分割、聚合、聯(lián)合、合并
- 數(shù)據(jù)計(jì)算:函數(shù)、取樣
- 數(shù)據(jù)預(yù)處理:編碼、分詞、向量化
靈活的分析配置
- 自定義算法和模型參數(shù)
- 內(nèi)置豐富的分析模板
- 智能化參數(shù)推薦
豐富的可視化圖表
- 更豐富的可視化方式
- 分析結(jié)果頁(yè)面自定義布局
- 以鏈接方式分享分析結(jié)果
全新的圖形化建模
- 全面支持自定義分析流程
- 通過(guò)拖動(dòng)任務(wù)模塊,輕松構(gòu)筑復(fù)雜的文本處理和分析流程
四、產(chǎn)品體驗(yàn)
點(diǎn)擊這里體驗(yàn) 銳研云文析 的全部功能。

- 上海萌泰數(shù)據(jù)科技助力湘南學(xué)院教育創(chuàng)新,李軍博士主講《作為研究方法的人工智能》
- 上海市社會(huì)工作研究會(huì)2024年學(xué)術(shù)年會(huì)暨第二屆長(zhǎng)三角金融社會(huì)工作論壇在滬舉行
- 人工智能如何改變社會(huì)科學(xué)的面貌?——AI與社會(huì)科學(xué)的學(xué)術(shù)對(duì)話紀(jì)實(shí)(下)
- 人工智能如何改變社會(huì)科學(xué)的面貌?——AI與社會(huì)科學(xué)的學(xué)術(shù)對(duì)話紀(jì)實(shí)(上)
- 校企協(xié)同 | 浙江越秀外國(guó)語(yǔ)學(xué)院到訪上海萌泰數(shù)據(jù)
- 2024年(第十六屆)國(guó)際數(shù)據(jù)挖掘與應(yīng)用統(tǒng)計(jì)研究會(huì)年會(huì)在哈爾濱商業(yè)大學(xué)成功舉辦
- 全面深化改革與中國(guó)社會(huì)學(xué)新征程:中國(guó)社會(huì)學(xué)會(huì)2024年學(xué)術(shù)年會(huì)在哈爾濱工程大學(xué)舉行
- 全球視野 | Information and Communication Technologies in Social Work
- 學(xué)術(shù)研究 | CAI調(diào)研方法概述
- 大趨勢(shì) | 下一代調(diào)研技術(shù)發(fā)展趨勢(shì)
- 市場(chǎng)前沿 | 移動(dòng)面訪在中國(guó)家庭發(fā)展追蹤調(diào)查中的應(yīng)用
- 市場(chǎng)前沿 | 云計(jì)算、大數(shù)據(jù)與統(tǒng)計(jì)局信息化建設(shè)
- 卷首語(yǔ) | 數(shù)據(jù)的靈性
- 市場(chǎng)前沿 | 云調(diào)研平臺(tái)助推高??蒲薪虒W(xué)工作