資料載入中
跳到主要內容區塊

logo

內文查詢 網站導覽

文字大小

縮小 放大 English 中文
:::

電子報

基礎試驗研究
農村發展及水土保持署
挖掘數據背後的蛛絲馬跡:從資料庫到視覺化
期數 / 第70期
發布日期 / 2023.03.23
主筆 / 林宥伯
責任編輯 / 詹婉妤、高百毅、陳振宇

隨著科技與環境演變,人類所面臨的議題越趨複雜,同時也需要更多跨領域、學科的合作,才能解析問題核心與制定對策,而資料視覺化技術更在其中扮演了關鍵角色。視覺化技術不僅能呈現資料間的抽象概念,也可用於理解脈絡趨勢,藉由開放資料與工具的結合,感興趣的公民也可一窺資料科學的迷人之處,例如近兩年來影響全球甚鉅的新冠肺炎(COVID-19),以案例結合VOSviewer,可呈現出社交媒體上對於疫情出版物關注的趨勢(如圖1右側,傳染狀況與臨床特徵分布)

本期電子報將回顧既有視覺技術的應用案例、資料(庫)搜尋與應用、視覺化研究工具等主題, 一同發掘資料背後的關連與脈絡。

圖1、使用VOSviewer及 Altmetric data做視覺化分析。來源:leidenmadtrics:Delineating COVID-19 and coronavirus research
圖1、使用VOSviewer及 Altmetric data做視覺化分析。來源:leidenmadtrics:Delineating COVID-19 and coronavirus research
知識圖譜與關鍵字網路應用

知識圖譜、文獻計量分析、統計圖表等已是成熟的應用工具,搭配不同領域的議題策略,而有不同的操作案例,比如農業科技研究院於2020年對5個跨領域指標農業期刊(如圖2),以2013年到2019年間超過10萬筆的文獻資料,應用文獻計量分析歸納出205個農業領域關鍵字,並分成十大領域群組(如圖3),同時應用關鍵字分析,也能呈現不同期刊之主要研究議題(如圖4),便於掌握趨勢。

圖2、跨領域指標農業期刊。來源:ATRI-2020農業科技關鍵字
圖2、跨領域指標農業期刊。來源:ATRI-2020農業科技關鍵字
圖3、205個農業關鍵字與10大分群。來源:ATRI-2020農業科技關鍵字
圖3、205個農業關鍵字與10大分群。來源:ATRI-2020農業科技關鍵字
圖4、以關鍵字分析不同期刊特性。來源:ATRI-2020農業科技關鍵字
圖4、以關鍵字分析不同期刊特性。來源:ATRI-2020農業科技關鍵字

而國內學術上亦有許多應用案例,例如政治大學圖書館也應用引文索引資料庫(如:SCOPUS、TCI-HSS),結合VOSviewer提供領域分析成果,投入教育使用。而在影像遙測與深度學習主題上,也應用SCOPUS、TCI-HSS資料庫,對高引用次數之研究,進行關鍵字分析,得出不同的趨勢強度與關連群組(如圖5),或者是於Scopus資料庫中探索2011~2020間資訊學科的研究趨勢,從6000筆文獻中分析其關聯性,並整理出10個大趨勢(如圖6)。這些應用不僅能用於政策參考,也能支援研究者、教學及學習者對學習領域的整體掌握。

圖5、領域關鍵字分析。來源:政大圖書館分館組-蘇倉楠
圖5、領域關鍵字分析。來源:政大圖書館分館組-蘇倉楠
圖6、領域關鍵字分群。來源:政大圖書館推廣諮詢組-潘宣如
圖6、領域關鍵字分群。來源:政大圖書館推廣諮詢組-潘宣如

在視覺化技術中,知識圖譜與地理資訊的各種技術與服務,也在決策輔助以及資料管理上有所助益。例如水土保持局將歷年成果報告書經由資料庫彙整後,針對關鍵詞的關聯性視覺化,便能呈現各業務目標的相關架構。同時許多線上分析服務如Tableau-Public,也大幅簡化資料分析的技術門檻,例如水土保持局將歷年創新研究計畫 (如圖8)以及土砂災害案例等資料,以動態圖表方式呈現出簡單易懂的特徵趨勢(如圖9)。視覺化的資訊不僅能協助機關作為決策參考依據,也能提供不同領域研究者或民眾,從大尺度的綜觀角度入門,快速掌握與認識水土保持的各種議題及現況。

圖7、水土保持核心詞彙關係圖。來源:水土保持局電子圖書管理中心
圖7、水土保持核心詞彙關係圖。來源:水土保持局電子圖書管理中心
圖8、創新研究計畫資訊統計表。來源:水土保持局-https://public.tableau.com/app/profile/.64447005/viz/105-109_16276289962420/Story1
圖8、創新研究計畫資訊統計表。來源:水土保持局-https://public.tableau.com/app/profile/.64447005/viz/105-109_16276289962420/Story1
圖9、歷年土砂災例統計趨勢。來源:水土保持局-https://public.tableau.com/app/profile/.64447005/viz/2005-2020_16305677615460/Story1
圖9、歷年土砂災例統計趨勢。來源:水土保持局-https://public.tableau.com/app/profile/.64447005/viz/2005-2020_16305677615460/Story1
人機協作的開放數據基礎

從前面介紹的案例中,可發現要將概念視覺化應用之前,最重要的工作還是數位基礎資料的建立,之後才會有各種資料庫發展與結合的可能性。以研究所的訓練來說,全國博碩士論文網收錄了所有的學位論文索引資料,並應用各領域的研究資料,建立了關聯性術語(如圖10)、延伸與引用論文,以及產生查詢目標相關的知識圖譜及統計分析(如圖11),當資料建置的越齊全,在統計應用上越能提高代表性。

圖10、論文查詢與關聯性推薦功能。來源:博碩士論文網
圖10、論文查詢與關聯性推薦功能。來源:博碩士論文網
圖11、論文關鍵詞分析。來源:博碩士論文網
圖11、論文關鍵詞分析。來源:博碩士論文網

除了博碩士論文外,近年在全球資料開放浪潮下,臺灣屢獲高開放度國家評比,然而在廣闊的網路世界,以及龐大的數位知識之下,過多的資料常導致搜尋不易,往往知道關鍵字後,卻苦無入門之道,猶如海底撈針,因此,Google在類似需求之下,開發了資料集搜尋引擎(如圖12),不同於一般性搜尋,能夠針對目前資料庫特性、網頁程式標籤等技術,更為精確地搜尋既有數據集,其技術也提供了網頁設計準則(如圖13),方便國際間相關資料庫的建立與索引流通。

圖12、Google資料集搜尋引擎。來源:Google-datasetsearch
圖12、Google資料集搜尋引擎。來源:Google-datasetsearch
圖13、Google資料集搜尋識別方式說明。來源:Google-datasetsearch
圖13、Google資料集搜尋識別方式說明。來源:Google-datasetsearch

除了學術資料庫與搜尋引擎外,許多機關也在響應資料開放浪潮下,以主題的方式進行開放,比如水土保持局將委辦計畫的各式現地調查資料、觀測資料 (如圖14),以及大規模崩塌潛勢區主題區整合在資料平台(https://data.ardswc.gov.tw/),以單一窗口方式對內及對外流通供應(如圖15)。水利署在資料開放與公私協力推動下,將歷年累積的成果以開放資料專區(如圖16)對外提供,水利規劃試驗所則結合QGIS與公私協力發展出主題式情報地圖 (圖如17),這些領域導向式的開放資料庫,不同於廣泛地搜索,能讓使用者更直覺地探索單一領域的使用情境。

圖14、水土保持局資料管理平台整合入口。來源:水土保持局
圖14、水土保持局資料管理平台整合入口。來源:水土保持局
圖15、大規模崩塌潛勢區主題式開放資料。來源:水土保持局
圖15、大規模崩塌潛勢區主題式開放資料。來源:水土保持局
圖16、水利署資料開放整合平台。來源:水利署
圖16、水利署資料開放整合平台。來源:水利署
圖17、公私協力流域環境情報地圖。來源:水利規劃試驗所
圖17、公私協力流域環境情報地圖。來源:水利規劃試驗所
VOS與各種視覺工具

為了活化這些資料與技術,許多視覺化工具也藉由網頁技術導入,從單機應用提升到線上服務的方式,如VOSviewer,支援線上空間分享VOSviewer的json格式檔案,並由線上服務直接視覺化與分享(如圖18)

圖18、應用google空間服務(如附錄),線上共享視覺分析。來源:VOSviewer線上
圖18、應用google空間服務(如附錄),線上共享視覺分析。來源:VOSviewer線上

在文獻引用追蹤上,則有researchrabbita等服務,能從文獻搜尋結果中,直接抽取文獻與作者的關聯性(如圖19);WikiPedia的條目庫,也能藉由www.sigmajs.org的服務,將條目內容中有資料視覺化標籤的部分,列出領域之間的關聯性(如圖20);未來當資料的維度增加,各種知識與資料的關係越趨複雜,也有可能將其結構圖擴展成3D的結構模型(如圖21),呈現其脈絡結構。

圖19、從文獻找出相關的引用與作者群關聯。來源:researchrabbita
圖19、從文獻找出相關的引用與作者群關聯。來源:researchrabbita
圖20、應用維基百科條目,產出領域知識圖譜。來源:www.sigmajs.org
圖20、應用維基百科條目,產出領域知識圖譜。來源:www.sigmajs.org
圖20、3D化知識圖譜技術。來源:Neo4j.com
圖20、3D化知識圖譜技術。來源:Neo4j.com

資料開放時代,逐漸從資料不足,轉向資料過多的問題。如何應用現有技術與開放資料基礎,找出不同議題背後的脈絡,或是尋求跨領域之間的合作機會,是目前資料應用與科技輔助的核心目標。現在就來嘗試這些開放的資料與工具,來探索不同領域與資料間有趣的關聯吧!

相關連結
Back To Top