電子報
隨著科技與環境演變,人類所面臨的議題越趨複雜,同時也需要更多跨領域、學科的合作,才能解析問題核心與制定對策,而資料視覺化技術更在其中扮演了關鍵角色。視覺化技術不僅能呈現資料間的抽象概念,也可用於理解脈絡趨勢,藉由開放資料與工具的結合,感興趣的公民也可一窺資料科學的迷人之處,例如近兩年來影響全球甚鉅的新冠肺炎(COVID-19),以案例結合VOSviewer,可呈現出社交媒體上對於疫情出版物關注的趨勢(如圖1右側,傳染狀況與臨床特徵分布)
本期電子報將回顧既有視覺技術的應用案例、資料(庫)搜尋與應用、視覺化研究工具等主題, 一同發掘資料背後的關連與脈絡。
知識圖譜、文獻計量分析、統計圖表等已是成熟的應用工具,搭配不同領域的議題策略,而有不同的操作案例,比如農業科技研究院於2020年對5個跨領域指標農業期刊(如圖2),以2013年到2019年間超過10萬筆的文獻資料,應用文獻計量分析歸納出205個農業領域關鍵字,並分成十大領域群組(如圖3),同時應用關鍵字分析,也能呈現不同期刊之主要研究議題(如圖4),便於掌握趨勢。
而國內學術上亦有許多應用案例,例如政治大學圖書館也應用引文索引資料庫(如:SCOPUS、TCI-HSS),結合VOSviewer提供領域分析成果,投入教育使用。而在影像遙測與深度學習主題上,也應用SCOPUS、TCI-HSS資料庫,對高引用次數之研究,進行關鍵字分析,得出不同的趨勢強度與關連群組(如圖5),或者是於Scopus資料庫中探索2011~2020間資訊學科的研究趨勢,從6000筆文獻中分析其關聯性,並整理出10個大趨勢(如圖6)。這些應用不僅能用於政策參考,也能支援研究者、教學及學習者對學習領域的整體掌握。
在視覺化技術中,知識圖譜與地理資訊的各種技術與服務,也在決策輔助以及資料管理上有所助益。例如水土保持局將歷年成果報告書經由資料庫彙整後,針對關鍵詞的關聯性視覺化,便能呈現各業務目標的相關架構。同時許多線上分析服務如Tableau-Public,也大幅簡化資料分析的技術門檻,例如水土保持局將歷年創新研究計畫 (如圖8)以及土砂災害案例等資料,以動態圖表方式呈現出簡單易懂的特徵趨勢(如圖9)。視覺化的資訊不僅能協助機關作為決策參考依據,也能提供不同領域研究者或民眾,從大尺度的綜觀角度入門,快速掌握與認識水土保持的各種議題及現況。
從前面介紹的案例中,可發現要將概念視覺化應用之前,最重要的工作還是數位基礎資料的建立,之後才會有各種資料庫發展與結合的可能性。以研究所的訓練來說,全國博碩士論文網收錄了所有的學位論文索引資料,並應用各領域的研究資料,建立了關聯性術語(如圖10)、延伸與引用論文,以及產生查詢目標相關的知識圖譜及統計分析(如圖11),當資料建置的越齊全,在統計應用上越能提高代表性。
除了博碩士論文外,近年在全球資料開放浪潮下,臺灣屢獲高開放度國家評比,然而在廣闊的網路世界,以及龐大的數位知識之下,過多的資料常導致搜尋不易,往往知道關鍵字後,卻苦無入門之道,猶如海底撈針,因此,Google在類似需求之下,開發了資料集搜尋引擎(如圖12),不同於一般性搜尋,能夠針對目前資料庫特性、網頁程式標籤等技術,更為精確地搜尋既有數據集,其技術也提供了網頁設計準則(如圖13),方便國際間相關資料庫的建立與索引流通。
除了學術資料庫與搜尋引擎外,許多機關也在響應資料開放浪潮下,以主題的方式進行開放,比如水土保持局將委辦計畫的各式現地調查資料、觀測資料 (如圖14),以及大規模崩塌潛勢區主題區整合在資料平台(https://data.ardswc.gov.tw/),以單一窗口方式對內及對外流通供應(如圖15)。水利署在資料開放與公私協力推動下,將歷年累積的成果以開放資料專區(如圖16)對外提供,水利規劃試驗所則結合QGIS與公私協力發展出主題式情報地圖 (圖如17),這些領域導向式的開放資料庫,不同於廣泛地搜索,能讓使用者更直覺地探索單一領域的使用情境。
為了活化這些資料與技術,許多視覺化工具也藉由網頁技術導入,從單機應用提升到線上服務的方式,如VOSviewer,支援線上空間分享VOSviewer的json格式檔案,並由線上服務直接視覺化與分享(如圖18)
在文獻引用追蹤上,則有researchrabbita等服務,能從文獻搜尋結果中,直接抽取文獻與作者的關聯性(如圖19);WikiPedia的條目庫,也能藉由www.sigmajs.org的服務,將條目內容中有資料視覺化標籤的部分,列出領域之間的關聯性(如圖20);未來當資料的維度增加,各種知識與資料的關係越趨複雜,也有可能將其結構圖擴展成3D的結構模型(如圖21),呈現其脈絡結構。
資料開放時代,逐漸從資料不足,轉向資料過多的問題。如何應用現有技術與開放資料基礎,找出不同議題背後的脈絡,或是尋求跨領域之間的合作機會,是目前資料應用與科技輔助的核心目標。現在就來嘗試這些開放的資料與工具,來探索不同領域與資料間有趣的關聯吧!
1.leidenmadtrics:Delineating COVID-19 and coronavirus research(資料來源:leidenmadtrics)
2.【研之作作】2020農業科技關鍵字_永續農業,科技如何解答?(資料來源:農業科技研究院)
3.【2020農業科研關鍵字】農業科技研究前沿報告書(資料來源:農業科技研究院)
4.【研之作作】預見科技的未來:農業研究前沿Research Fronts(資料來源:農業科技研究院)
5.學科領域知識圖譜(資料來源:政治大學提書館)
6.水土保持局-Tableau視覺化儀表板(資料來源:水土保持局)
7.全國博碩士論文網
8.datasetsearch入口(資料來源:Google)
9.水土保持局-資料管理平台(資料來源:水土保持局)
10.桃園市-復興區-T002(光華)大規模崩塌潛勢區資料開放專區(資料來源:水土保持局)
11.水利資料開放平台(資料來源:經濟部水利署)
12.流域環境情報地圖基礎地圖包(資料來源:經濟部水利署水利規劃試驗所)
_下載網址:
13.本期電子報示範之VOSviewer線上json檔案(資料來源:水土保持局)
14.本期電子報示範線上服務連結json檔案,視覺成果(資料來源:水土保持局)
15.VOSviewer線上共享視覺化文件(資料來源:VOSviewer)
16.3D知識圖譜-程式工具(資料來源:neo4j)