精品精品国产理论在线 - 全国亚洲最大的av网站久久久 - 国产不卡视频一区二区三区四区 - 亚洲一区二区观看播放

銳研·云文析:文本分析和挖掘系統(tǒng)

2016-02-06
萌泰科技
摘要:銳研文本分析和挖掘系統(tǒng)(Ring BigResearch TextAnalyzer)是一套基于自然語(yǔ)言處理(NLP)技術(shù)的文本分析和挖掘軟件,支持對(duì)文本進(jìn)行內(nèi)容分析,利用自然語(yǔ)言處理(NLP)對(duì)文本進(jìn)行分詞,詞性標(biāo)注和詞頻統(tǒng)計(jì)。平臺(tái)可集成中文處理引擎和多種文本分析算法,支持結(jié)合系統(tǒng)和用戶自定義的詞匯字典庫(kù)進(jìn)行各類(lèi)詞頻分析、情感分析、實(shí)體抽取、短語(yǔ)抽取、文本分類(lèi)、文本聚類(lèi)、主題模型、詞向量分析、共現(xiàn)分析、事件分析等。


一、概述

銳研文本分析和挖掘系統(tǒng)(Ring BigResearch TextAnalyzer)是一套基于自然語(yǔ)言處理(NLP)技術(shù)的文本分析和挖掘軟件,支持對(duì)文本進(jìn)行內(nèi)容分析,利用自然語(yǔ)言處理(NLP)對(duì)文本進(jìn)行分詞,詞性標(biāo)注和詞頻統(tǒng)計(jì)。平臺(tái)可集成中文處理引擎和多種文本分析算法,支持結(jié)合系統(tǒng)和用戶自定義的詞匯字典庫(kù)進(jìn)行各類(lèi)詞頻分析、情感分析、實(shí)體抽取、短語(yǔ)抽取、文本分類(lèi)、文本聚類(lèi)、主題模型、詞向量分析、共現(xiàn)分析、事件分析等。

二、產(chǎn)品功能

1、系統(tǒng)集成

作為子系統(tǒng)能集成到統(tǒng)一的云管理平臺(tái),共享云平臺(tái)的統(tǒng)一用戶管理功能。

2、文本庫(kù)管理

提供對(duì)分析文本庫(kù)的統(tǒng)一管理,包括建立文本庫(kù)的子文本庫(kù)管理;支持對(duì)文本進(jìn)行快速的統(tǒng)計(jì)分析,可根據(jù)數(shù)據(jù)源、日期等條件對(duì)所有文本進(jìn)行數(shù)量統(tǒng)計(jì)。

3、數(shù)據(jù)導(dǎo)入

支持?jǐn)?shù)據(jù)從文件導(dǎo)入,從云采集平臺(tái)導(dǎo)入和從文本數(shù)據(jù)庫(kù)直接導(dǎo)入。

4、數(shù)據(jù)清洗

提供對(duì)文本庫(kù)的文本的可視化增刪改查處理,支持?jǐn)?shù)據(jù)去重和數(shù)據(jù)替換。

5、文本分詞

利用自然語(yǔ)言處理(NLP)分詞算法對(duì)文本進(jìn)行分詞,詞性標(biāo)注;支持選擇不同的分詞算法;支持系統(tǒng)和用戶自定義的詞匯字典庫(kù)。

6、詞頻統(tǒng)計(jì)

支持對(duì)文本進(jìn)行詞頻統(tǒng)計(jì);可根據(jù)詞性篩選關(guān)鍵詞或自定義關(guān)鍵詞生成詞云圖。

7、文本分類(lèi)

根據(jù)一個(gè)訓(xùn)練集,對(duì)新的文本進(jìn)行數(shù)據(jù)分類(lèi),提供對(duì)分類(lèi)訓(xùn)練集的管理;集成貝葉斯分類(lèi) ,BP神經(jīng)網(wǎng)絡(luò)分類(lèi) , CNN深度學(xué)習(xí)分類(lèi)等分類(lèi)算法。

8、文本聚類(lèi)

在沒(méi)有訓(xùn)練集的情況下,根據(jù)算法對(duì)所有文本進(jìn)行聚類(lèi)分析,集成K-means聚類(lèi),DBSCAN聚類(lèi),聚合聚類(lèi),BIRCH聚類(lèi),Mini-batch聚類(lèi),均值漂移聚類(lèi),光譜聚類(lèi),高斯混合聚類(lèi),ISODATA聚類(lèi)等聚類(lèi)算法。

9、情感分析

支持根據(jù)情感字典庫(kù)來(lái)判斷某一個(gè)文章的正負(fù)情感,集成常用的中文情感詞典。

10、詞向量分析

基礎(chǔ)詞向量分析模型,能夠?qū)o定的文本集進(jìn)行詞向量分析,可以實(shí)時(shí)查詢分析結(jié)果和可視化呈現(xiàn)。

11、主題分析

集成LDA主題分析模型,能夠自動(dòng)對(duì)給定的文本集進(jìn)行主題建模,支持自動(dòng)推薦最優(yōu)主題數(shù)。

12、自動(dòng)編碼

能夠自動(dòng)根據(jù)文本的關(guān)鍵詞規(guī)則為文本進(jìn)行自動(dòng)編碼。

13、短語(yǔ)抽取

可根據(jù)詞性權(quán)重,長(zhǎng)度權(quán)重,主題突出權(quán)重等提取出文本中的短語(yǔ),并進(jìn)行頻次統(tǒng)計(jì)。

14、詞共現(xiàn)網(wǎng)絡(luò)

能夠?qū)o定的文本分析一組詞的共現(xiàn)概率,生成詞共現(xiàn)網(wǎng)絡(luò)圖。

15、事件提取

能夠根據(jù)事件詞典庫(kù)提取文本中的核心事件,并進(jìn)行統(tǒng)計(jì);支持用戶自定義事件詞典庫(kù);事件包括事件分類(lèi)、參與者、時(shí)間、地點(diǎn)等屬性。


三、特色和優(yōu)勢(shì)

強(qiáng)大的數(shù)據(jù)處理

  • 數(shù)據(jù)清洗:去重、替換、篩選、排序
  • 數(shù)據(jù)組合:分割、聚合、聯(lián)合、合并
  • 數(shù)據(jù)計(jì)算:函數(shù)、取樣
  • 數(shù)據(jù)預(yù)處理:編碼、分詞、向量化

靈活的分析配置

  • 自定義算法和模型參數(shù)
  • 內(nèi)置豐富的分析模板
  • 智能化參數(shù)推薦

豐富的可視化圖表

  • 更豐富的可視化方式
  • 分析結(jié)果頁(yè)面自定義布局
  • 以鏈接方式分享分析結(jié)果

全新的圖形化建模

  • 全面支持自定義分析流程
  • 通過(guò)拖動(dòng)任務(wù)模塊,輕松構(gòu)筑復(fù)雜的文本處理和分析流程

四、產(chǎn)品體驗(yàn)

點(diǎn)擊這里體驗(yàn)  銳研云文析  的全部功能。



    發(fā)表評(píng)論
    評(píng)論通過(guò)審核后顯示。
      銳研中國(guó)
    移動(dòng)訪問(wèn)