精品精品国产理论在线 - 全国亚洲最大的av网站久久久 - 国产不卡视频一区二区三区四区 - 亚洲一区二区观看播放

全球視野 | 國外文獻(xiàn)數(shù)據(jù)庫最新發(fā)展現(xiàn)狀述要

2019-05-03
南京大學(xué)信息管理學(xué)院 華薇娜 等
摘要:調(diào)查、歸納和總結(jié)國外文獻(xiàn)型數(shù)據(jù)庫的最新發(fā)展現(xiàn)狀:包括資源發(fā)現(xiàn)服務(wù)勢頭迅猛、大力度開發(fā)回溯數(shù)據(jù)資源、提供數(shù)據(jù)分析功能、提供文獻(xiàn)處理功能、主題語言檢索體的應(yīng)用面得到擴展、分類語言檢索體系更具專業(yè)性、提供特色檢索途徑、引入期刊評價新指標(biāo)、準(zhǔn)確定位作者信息和注重細(xì)節(jié)設(shè)計10個方面。這些梳理和總結(jié)有助于我們拓寬視野,深入了解國外文獻(xiàn)數(shù)據(jù)庫的特色,以開發(fā)更多、更新的數(shù)據(jù)庫資源
國外文獻(xiàn)型數(shù)據(jù)庫歷史悠久,許多數(shù)據(jù)庫源自擁有百年以上歷史的印刷本索引工具書,體現(xiàn)著厚重的歷史的沉淀。隨著因特網(wǎng)的發(fā)展,經(jīng)過了從紙質(zhì)版到電子版的飛躍,許多文獻(xiàn)數(shù)據(jù)庫都有了根本性的變化,越來越多的數(shù)據(jù)庫不斷地得到調(diào)整和改進(jìn)。調(diào)查、歸納和總結(jié)這些數(shù)據(jù)庫的最新發(fā)展現(xiàn)狀,對于我們深入了解國外文獻(xiàn)型數(shù)據(jù)庫有著很大的意義,也有助于拓寬我們的視野,促進(jìn)我們開發(fā)更多更新的數(shù)據(jù)庫資源。

1 資源發(fā)現(xiàn)服務(wù)勢頭迅猛
資源發(fā)現(xiàn)服務(wù)是指數(shù)據(jù)庫系統(tǒng)提供商通過與出版社等內(nèi)容提供商的合作,對海量的、來自異構(gòu)資源的元數(shù)據(jù)和部分對象數(shù)據(jù),采用分析、抽取等手段進(jìn)行預(yù)收集,并將這些數(shù)據(jù)按映射轉(zhuǎn)換規(guī)則轉(zhuǎn)換為標(biāo)準(zhǔn)的格式,納入到元數(shù)據(jù)標(biāo)準(zhǔn)體系中,形成一個預(yù)聚合的元數(shù)據(jù)聯(lián)合索引庫,在本地或者遠(yuǎn)程中心平臺提供統(tǒng)一的搜索服務(wù)。自2007年 OCLC推出第一代資源發(fā)現(xiàn)與獲取平臺——WorldCat Local(簡稱 WCL)以來,資源發(fā)現(xiàn)系統(tǒng)在國內(nèi)外圖書館界引起了廣泛關(guān)注。目前國際上主流的資源發(fā)現(xiàn)系統(tǒng)大約有十多種,其中應(yīng)用最為廣泛的除了前文所提及的 WCL(現(xiàn)升級為World Cat Discovery Service)外,還有PreQuest公司旗下Serials Solution的 Summon 系統(tǒng),EBSCO公司的EBSCO Discovery Service(簡稱EDS),ExLibris公司的Primo系統(tǒng),以及 Innova-tive Interfaces公司的 Encore系統(tǒng)。近來,多數(shù)資源發(fā)現(xiàn)系統(tǒng)進(jìn)一步升級。2015年,ExLibris 公司加入ProQuest,兩家公司目前所擁有的資源發(fā)現(xiàn)系統(tǒng)Primo和Summon已在市場中擁有大量客戶,在資源與系統(tǒng)整合方面對圖書館資源發(fā)現(xiàn)系統(tǒng)產(chǎn)生了很大的影響。資源發(fā)現(xiàn)系統(tǒng)打破了圖書館各種資源的載體限制,實現(xiàn)了所有資源的深度整合,一站式檢索,其一問世便得到了圖書館的青睞和熱捧,展現(xiàn)出了強大的發(fā)展勁頭。

2大力度開發(fā)回溯數(shù)據(jù)資源
(1)開發(fā)專門的過刊數(shù)據(jù)庫
過刊(back issue 或 backfile)是一個相對概念,非當(dāng)前刊期的期刊都可稱之為過刊,但一般指本年度之前的期刊;圖書館習(xí)慣上把已裝訂成冊的期刊稱為過刊。JSTOR(全名為 Journal Storage)就是一個典型的西文過刊數(shù)據(jù)庫。鑒于文科用戶對過刊極高的使用需求,曾任普林斯頓大學(xué)校長的 WilliamG. Bowen最初策劃創(chuàng)建了這一專門的對過刊進(jìn)行數(shù)字化處理的信息資源。該庫最初的目標(biāo)是要建立一個規(guī)模雖小,但包羅各種由創(chuàng)刊號起直到距當(dāng)前3~5年前的重要過刊的數(shù)據(jù)庫,所覆蓋期刊中最早的回溯至1665年。該數(shù)據(jù)庫在創(chuàng)建后的最初幾年里只收錄有幾百種刊物,但近年來該數(shù)據(jù)庫飛速發(fā)展,收錄的數(shù)據(jù)資源大幅度地增長。目前該過刊數(shù)據(jù)庫包含有900多個出版商提供的數(shù)據(jù);從期刊的收錄數(shù)量上來看,該庫現(xiàn)收錄以政治學(xué)、經(jīng)濟學(xué)、哲學(xué)、歷史、語言文學(xué)、法律、教育、音樂和藝術(shù)等人文社科主題為中心,兼有一般科學(xué)性主題共50多個領(lǐng)域的代表性學(xué)術(shù)期刊逾1900種;而從資源的覆蓋面上來看,JSTOR 最新版還收錄有200多種現(xiàn)期期刊,以及15000多種電子圖書。目前該庫幾乎已成為西方國家文科領(lǐng)域無人不曉的網(wǎng)絡(luò)信息資源。類似 JSTOR 這樣的專題回溯數(shù)據(jù)庫還有很多,例如專門收集早年的文科圖書信息的數(shù)據(jù)庫《早年英語圖書數(shù)據(jù)庫》(Early English Books On-line,簡稱EEBO);覆蓋150多個語種的、更側(cè)重于歐洲國家過刊的數(shù)據(jù)“Periodicals Archive Online”(簡稱PAO)等等。
(2)現(xiàn)刊數(shù)據(jù)庫也拓展回溯數(shù)據(jù)
很多現(xiàn)期期刊數(shù)據(jù)庫,包括文科的和一些理科資源的數(shù)據(jù)庫,在不斷增加和更新當(dāng)前數(shù)據(jù)的同時,也紛紛往創(chuàng)刊年之前的文獻(xiàn)資源回溯。其中比較典型的有:美國引文索引數(shù)據(jù)庫、美國科技情報社ISI(現(xiàn)已由湯森路透公司接管)出版的系列引文索引,收錄世界上最有影響的、經(jīng)過影響因子篩選的核心期刊上發(fā)表的研究成果,在一定程度上代表著世界科學(xué)研究的水平,尤其是基礎(chǔ)學(xué)科研究的高水準(zhǔn)。該系列包括 《科學(xué)引文索引》(Science Citation Index,簡稱 SCI)、《社會科學(xué)引文索引》(Social Science Citation Index,簡稱 SSCI)、《藝術(shù)與人文學(xué)科引文索引》(Art & Humanities Citation Index,簡稱 A&HCI)。其中,SCI 創(chuàng)刊于1963年,SSCI創(chuàng)刊于1972年,A&HCI 創(chuàng)刊于1978年。但在2005年左右,湯森路透公司分別將 SCI 和SSCI 收錄文獻(xiàn)的起始年份回溯至1900年,A&HCI的數(shù)據(jù)也回溯到1975年,也就是重新組織了創(chuàng)刊年之前的文獻(xiàn)數(shù)據(jù)。這對人們回顧各學(xué)科的發(fā)展史,了解早年這些領(lǐng)域的核心期刊論文,提供了可能與方便。
美國威爾遜公司系列數(shù)據(jù)庫:成立于 1898年的美國威爾遜公司,是索引類工具書行業(yè)內(nèi)的杰出品牌之一。該公司出版有一系列期刊索引和圖書書目,其中有些資源都有近百年的歷史,比如,《讀者期刊指南》(Readers Guide to Periodi-cal Literature)創(chuàng)刊于 1905 年,其收錄的數(shù)據(jù)始于1900年。進(jìn)入數(shù)字化時代后,威爾遜公司適時地將其印本索引工具書組織成了網(wǎng)絡(luò)數(shù)據(jù)庫 (目前這些網(wǎng)絡(luò)資源合并在 EBSCO 系統(tǒng)平臺上為用戶提供服務(wù))。近來,Wilson 系統(tǒng)中的許多數(shù)據(jù)子庫在更新當(dāng)前數(shù)據(jù)的同時又拓展回溯數(shù)據(jù)。如《讀者期刊指南》的回溯數(shù)據(jù)始于1890年;《圖書館學(xué)文獻(xiàn)索引》(Library Literature)的數(shù)據(jù)已回溯到1905年(其印本數(shù)據(jù)始于1934提供數(shù)據(jù)分析功能,如今數(shù)據(jù)庫的各種個性化功能層出不窮,既增加了產(chǎn)品的競爭力,也有助于產(chǎn)品順應(yīng)時代發(fā)展的趨勢,其中較為顯著的功能即為數(shù)據(jù)庫信息分析功能,如 Web of Science、Scopus、SciFinder等,這些系統(tǒng)目前都提供一定程度的定量分析的功能,即利用排序的方法從多角度對檢索結(jié)果進(jìn)行數(shù)據(jù)挖掘和全景分析,幫助分析某研究領(lǐng)域的發(fā)展趨勢,發(fā)現(xiàn)科學(xué)技術(shù)熱點,揭示論文間的潛在聯(lián)系,并可提供相應(yīng)的引文報告。有的系統(tǒng)結(jié)合可視化技術(shù),將檢索結(jié)果根據(jù)文獻(xiàn)來源、著者、出版年、被引次數(shù)等進(jìn)行歸類和細(xì)化。有的數(shù)據(jù)庫以提供同義詞表的方式進(jìn)行概念分組,并可將檢索結(jié)果細(xì)化到某個特定分類,便于迅速精煉和篩選檢索結(jié)果。

3 提供文獻(xiàn)處理功能
越來越多的文獻(xiàn)型數(shù)據(jù)庫提供可直接導(dǎo)入文獻(xiàn)處理軟件的數(shù)據(jù)下載格式。目前用于文獻(xiàn)處理的軟件主要有 Reference Manager,End Note,Ref Works等。美國湯森路透公司W(wǎng)OK平臺上的多個系統(tǒng),如 Web of Science,Medline 等系統(tǒng)就提供了 End Note 的文獻(xiàn)下載選項,這些下載數(shù)據(jù)還可以應(yīng)用 Reference Manager 軟件來進(jìn)行進(jìn)一步的處理。美國 ProQuest系統(tǒng)提供了能直接導(dǎo)入Easy Bib、End Note或 Ref Works的下載選項。
這些軟件都可以幫助用戶管理從數(shù)據(jù)庫檢索而得的文獻(xiàn)題錄數(shù)據(jù)或參考文獻(xiàn),便于用戶對檢得結(jié)果數(shù)據(jù)的進(jìn)一步處理和自動的序化管理。許多系統(tǒng)還對題錄結(jié)果數(shù)據(jù)提供一定數(shù)量范圍內(nèi)的一攬子下載格式,用戶可通過普通的辦公軟件,如EXCEL、WORD 等,對下載結(jié)果進(jìn)行進(jìn)一步的處理。

4 主題語言檢索體系的應(yīng)用面得到擴展
主題語言是指經(jīng)過控制的,表達(dá)文獻(xiàn)信息內(nèi)容的語詞,主題詞表是主題詞語言的體現(xiàn),詞表中的詞可作為文獻(xiàn)內(nèi)容的標(biāo)識和查找文獻(xiàn)的依據(jù)。最多見的主題語言分為標(biāo)題詞語言、單元詞語言、關(guān)鍵詞語言和敘詞語言等。國外使用主題語言處理文獻(xiàn)的先例很多,早在印刷本時代,1957 年創(chuàng)刊的《美國在版書目主題指南》(Subject Guide to Books in Print)就是對《美國在版書目》中的絕大部分圖書按美國國會圖書館主題詞表 LCSH (Library of Congress Sub-ject Headings)進(jìn)行標(biāo)引和整序。許多印刷本中所使用的主題詞表被沿用到網(wǎng)絡(luò)數(shù)據(jù)庫中,其中就有久負(fù)盛名的美國國立醫(yī)學(xué)圖書館(NLM)出版發(fā)行的《美國醫(yī)學(xué)索引》(Index Medicus,簡稱IM),其標(biāo)題詞表就是我們現(xiàn)在 PubMed 系統(tǒng)中能夠看到的 Medical Subject Headings,簡稱MeSH;美國工程索引(Engineering Index,簡稱Ei)所用的工程敘詞表Ei Thesaurus,也被現(xiàn)在的數(shù)據(jù)庫 Engineering Village 所沿用。而當(dāng)前更多的主題語言檢索體系則完全在網(wǎng)絡(luò)上開發(fā)和應(yīng)用,美國 ProQuest 系統(tǒng)提供的檢索詞庫即為這一類型。以“bibliometrics”一詞為例,通過ProQuest 詞庫檢索出來的與該詞相關(guān)的其他語詞,包括其上位詞、下位詞、相關(guān)詞等,這為用戶后續(xù)的擴檢、縮檢提供了很有價值的參考信息。

5 分類語言檢索體系更具專業(yè)性
國外早期的分類體系主要是針對圖書分類的,如美國的杜威十進(jìn)分類法(Dewey Decimal Classification,簡稱 DDC),國際十進(jìn)分類法(Uni-versal Decimal Classification,簡稱 UDC)等等。在印本書時代,這些分類體系在文獻(xiàn)系統(tǒng)中幾乎是占據(jù)半壁江山的,當(dāng)然這些分類至今仍然在被廣泛地應(yīng)用著,美國國會圖書館的圖書分類中就有DDC分類。但隨著時代的進(jìn)步,尤其是因特網(wǎng)的發(fā)展,更多專業(yè)的更細(xì)化的分類系統(tǒng)出現(xiàn)在文獻(xiàn)系統(tǒng)中,僅在美國的在版書目系統(tǒng) (Books inPrint,簡稱 BIP)中,我們能看到的分類號就有杜威十進(jìn)分類號(DDC),美國國會圖書館分類號(LC Class#);英國BIC主題分類(BIC Subjects Category);美國 BISAC 主題分類(BISAC Subjects Category)。
與國內(nèi)文獻(xiàn)分類法的應(yīng)用有所不同的是,國外圖書分類法的應(yīng)用幾乎被限制在圖書范圍內(nèi),而對于期刊等其他文獻(xiàn)類型,則有更多的專業(yè)分類體系。有些是從早年的印本檢索工具書時產(chǎn)生,又被沿用到如今的網(wǎng)絡(luò)文獻(xiàn)型數(shù)據(jù)庫中,如工程索引分類(Ei Classification),其中包括“工程分類碼”(Ei Classification Code)、科學(xué)文摘分類,包括物理文摘分類(PA Classification)、電工與電子文摘分類(EEA Classification)、計算機與控制文摘分類(CCA Classification)等;有些則直接用于網(wǎng)絡(luò)數(shù)據(jù)庫中,如美國計算機學(xué)會計算分類體系(ACM Computing Classification Sys-tem)。這樣的專業(yè)分類還有很多,如冶金分類、生物分類等。此外還有專類文獻(xiàn)分類,如專利分類、標(biāo)準(zhǔn)分類等等。

6 提供特色檢索途徑
檢索途徑是數(shù)據(jù)庫提供給用戶的檢索入口,也稱檢索字段。一般的檢索途徑包括內(nèi)部特征途徑,如篇名、關(guān)鍵詞、摘要、主題(國內(nèi)數(shù)據(jù)庫設(shè)置的“主題”字段一般是組合“篇名”、“關(guān)鍵詞”、“摘要”三個檢索字段,與國外的依據(jù)主題詞表的主題檢索字段并不等同)、分類等;和外部特征途徑,如著者名、刊名、刊號、會議名、著者機構(gòu)、機構(gòu)地址、一些特定的號碼等。但目前國外有些數(shù)據(jù)庫提供的檢索途徑遠(yuǎn)多于現(xiàn)有的這些我們所熟悉的檢索途徑。

7 引入期刊評價新指標(biāo)
美國《科學(xué)引文索引》創(chuàng)始人尤金·加菲爾特(Eugene Garfield)多年前提出了期刊評價指標(biāo)“影響因子”(Impact Factor,簡稱 IF),并隨著其產(chǎn)品JCR(“期刊引用報告”,Journal Citation Re-ports)的發(fā)行而流行多年。隨著人們對影響因子的認(rèn)識和研究的深入,影響因子的缺陷也逐漸暴露出來。近年來,有多個期刊評價新指標(biāo)被提出,也逐步在數(shù)據(jù)庫中出現(xiàn)。如:美國WOS 數(shù)據(jù)庫在2009 年時推出了如下指標(biāo):
5 年影響因子(5-Year Impact Factor,IF5),即在計算影響因子時采用的是5年數(shù)據(jù),而非一般影響因子的 2 年數(shù)據(jù)。這在一定程度上避免了一般影響因子不能較好衡量被引高峰出現(xiàn)較晚的期刊論文學(xué)術(shù)影響力的問題。相對來說5年的影響因子更能反映期刊近幾年的平均水準(zhǔn)。特征因子(Eigenfactor Score),旨在說明期刊越多地被高影響的期刊所引用,其影響力越高。論文影響分值(Article Influence Score),其意義在于排除同一期刊自我引用,且是經(jīng)過加權(quán)的平均被引用次數(shù)。

8 準(zhǔn)確定位作者信息
在數(shù)據(jù)庫的檢索中,常出現(xiàn)作者重名、或不同語言文化背景下的作者姓名排序差異、或同一作者名字縮寫不一致、或使用不同的姓名順序引起名字變化等現(xiàn)象,影響了檢索結(jié)果的全面性和準(zhǔn)確性。近年來,國外一些文獻(xiàn)數(shù)據(jù)庫結(jié)合社交網(wǎng)絡(luò)等系統(tǒng)平臺,為準(zhǔn)確定位作者做了一定程度的有意義的嘗試。如:Scopus 系統(tǒng)的“作者身份識別系統(tǒng)”(AUTHOR IDENTIFIER)。該系統(tǒng)可以幫助用戶排除容易混淆的作者和確定唯一作者。Scopus 為 2000 萬作者分配了獨有的唯一識別號,將作者身份識別與引文追蹤結(jié)合運用,有助于提高檢索結(jié)果的準(zhǔn)確率以及后續(xù)的檢索結(jié)果數(shù)據(jù)的分析。湯森路透系統(tǒng)的“研究人員標(biāo)識號”(Researcher ID)。每位作者通過注冊都可以建立一個唯一的研究人員標(biāo)識號,作者可以建立自己的著作清單,產(chǎn)生個人的引用信息,不用再擔(dān)心同名同姓的問題。人們也可以通過 Researcher ID 來檢索學(xué)者信息。這個標(biāo)識號也被使用在湯森路透公司的文獻(xiàn)數(shù)據(jù)庫中。湯森路透系統(tǒng)的“開放學(xué)者和貢獻(xiàn)者身份證”(Open Researcher and Contributor ID)。為研究人員配置唯一的并可鏈接到其研究成果的身份標(biāo)識碼,從而解決學(xué)術(shù)文獻(xiàn)中的作者姓名混淆問題,強調(diào)作者的標(biāo)志。

9 注重細(xì)節(jié)設(shè)計
細(xì)節(jié)決定成敗,這在數(shù)據(jù)庫檢索界面設(shè)計中也能有所體現(xiàn)。諸如各種人性化界面設(shè)計;層層縮小檢索范圍的下拉菜單;給用戶多種下載形式的選項;檢索結(jié)果頁面重現(xiàn)用戶的檢索命令,便于用戶核實等等,這些都給用戶利用文獻(xiàn)型數(shù)據(jù)庫帶來了更多的方便。
發(fā)表評論
評論通過審核后顯示。
  銳研中國
移動訪問