- +1
2021數據可視化獲獎作品大賞:分析挖掘篇
原創 一頭倭瓜精 一頭倭瓜精
《2021數據可視化獲獎作品大賞》
將數據可視化相關賽事拆分為了三大類:
數據新聞類、藝術設計類、分析挖掘類
分三篇文章進行推送
今天推送的是第三部分:分析挖掘
在數據分析與挖掘過程中,數據可視化常被用來發現數據中的模式、規律、異常。隨著交互技術的發展,數據分析人員還可以通過篩選、拖曳、縮放等操作,對數據可視化進行更深入的探索。這種以交互式可視化界面為基礎來進行分析和推理的學科,也稱可視分析。
01
IEEE VAST Challenge
IEEE VAST Challenge是下設于國際頂級可視化學術會議IEEE VIS的可視分析挑戰賽。每年,組委會會擬定一個數據挖掘的模擬場景,并提供數據集和賽題。
今年的場景是一起公司雇員突然失蹤的案件。第一個賽題要求參賽者利用一系列新聞報告、雇員簡歷、內部郵件數據,挖掘出新聞文本之間的關系、偏見,以及人物/組織實體之間的關系。最終,北京大學和奇安信公司的合作團隊[1]獲得了Award for Effective Design of Interactive Analytics(有效的交互式分析)。其可視分析系統主要是輔助實體之間關系的挖掘。

從文本中挖掘實體之間的關系 [1]
天津大學團隊[2]獲得Award for Effective Combination of Analytics and Visualizations(分析與可視化的有效結合)。這一系統可以幫助分析新聞間的復制關系、報道中的偏見等。

媒介中的偏見識別[2]
第二個賽題要求利用員工駕車數據和信用卡消費數據,找出可疑行為。這個賽題要求把多個源頭的數據整合在一起,還原員工的消費和行為軌跡,并進行時空可視化。最后,復旦大學和觀星公司的合作團隊[3]以及比利時哈塞爾特大學團隊[4]獲得了Award for Outstanding Comprehensive MC2 Submission(對賽題2全面和出色的回答)。

時間線探索、地理探索、消費數據探索界面[3]

在地圖和時間線上交互查看具體事件、探查異常[4]
第三個賽題是利用社交微博、報警電話數據,評估此次事件的發酵和可能存在的公共危機。天津大學團隊設計的系統,可以讓分析人員在探索數據的過程中,記錄下重要的發現,然后形成具有敘事意義的總結視圖。這一系統獲得Award for Innovative Narrative Visualization and Analysis Methodology(創新性的敘事可視化和分析方法)。

輔助文本序列中的故事挖掘[5]
復旦與觀星公司合作的可視分析系統,可以幫助分析人員在挖掘社交媒體數據的時候,去整理和加深自己的知識、發現,最終獲得Award for Strong Human-in-the-Loop Analysis Methodology(較強的“人在回路”交互方法)。

通過豐富的交互手段分析社交媒體數據[6]
由普渡大學、詹姆斯麥迪遜大學等合作的CloudAnnotator系統,主要是輔助對社交媒體數據的主題聚類和標注,獲得Honorable Mention for Effective Visual Design and for Academic Outreach(有效的視覺設計和學術推廣)。

使用可視化輔助文本數據的分組和標注[7]
02
Tableau Iron Viz
Tableau Iron Viz是可視化公司Tableau舉辦的國際化競賽項目,也被稱作是Tableau技術的“終極較量”。今年Iron Viz的主題是“DATA+JOY”(數據+快樂)。參賽者首先需要參加資格賽,優勝者將晉級到 Tableau 全球用戶大會期間舉行的現場決賽。
在評分時,評委會考量3個維度:分析、設計、敘事。最終,10位選手入圍了總決賽,1位成為最終贏家。由于今年的主題是快樂,選手們制作的可視化作品也多與自己的興趣愛好有關(完整作品可移步Tableau Public查看[8]):

第一名:3位在國際范圍內有影響力的歌手[9]

前10名入圍作品:網球名將費德勒[10]

前10名入圍者:探究漫威電影中的性別、種族多元性[11]

前10名入圍者:漫威宇宙里的時間線[12]

前10名入圍者:動畫劇集《降世神通:最后的氣宗》[13]

前10名入圍者:美國男扮女裝綜藝--魯保羅變裝皇后秀[14]
除了Iron Viz以外,Tableau中國社群還會定期推出線上挑戰賽[15]。今年的第一期挑戰賽是碳排放主題。一等獎作品對碳排放數量、各國的減排表現、中國的減排行動等作了清晰梳理:

碳中和議題可視化[16]
04
ChinaVis數據可視化挑戰賽
ChinaVis數據可視化挑戰賽隸屬于國內可視化學術會議ChinaVis,也是一項以可視分析為核心的競賽。今年的賽題是利用2013–2018年中國高分辨率大氣污染再分析開放數據集,探索并發現空氣質量大數據背后隱藏的模式和規律。今年,挑戰賽共收到 96 個作品,32 個作品獲獎,獲獎比例 33.3%[17]。
一等獎由重慶大學團隊獲得,其“全國大氣污染可視分析系統”提供了多個面板,供分析人員探索各地的日均和小時污染數據。

一等獎:重慶大學團隊
二等獎的獲獎團隊包括:上海交通大學、西南科技大學、東北師范大學、重慶大學。完整獲獎名單見[16]。

上海交通大學團隊

西南科技大學團隊

東北師范大學團隊

重慶大學團隊
05
Power BI可視化大賽
Power BI可視化大賽,由商務智能平臺Power BI中國社區主辦,今年是第四屆,共評出1個一等獎、2個二等獎、3個三等獎,以及5個行業特別獎。其獲獎作品也大多面向真實的商用場景和業務場景[18]。
其中,《古城醫院大數據管理運營平臺》獲一等獎。這個儀表板里包含了科室整體概況、運營分析、三公考核、DIP模型、流程管理、影響發展力幾個板塊。

醫院科室數據分析系統[19]
二等獎作品《Adventure Works Sales Analysis》主要為某跨國公司的銷售數據做報表分析:

跨國公司銷售數據分析[20]
另一個二等獎作品《財務杜邦分析模型》用于分析上市公司的經營業績:

財務杜邦分析模型[21]
06
帆軟BI可視化挑戰賽
帆軟BI可視化挑戰賽,由另一家商務智能公司帆軟主辦。該比賽分團隊賽和個人賽兩個賽道,共評出2個“全場最佳作品獎”,11個“最佳行業應用獎”,和3個“最佳展現創意獎”[22]。
團隊賽的一等獎作品,對某連鎖超市的會員數據進行了可視化分析,包括會員的整體狀況、新增會員分析、忠實會員分析、流失會員分析幾大板塊。

某連鎖超市的會員數據分析[22]
個人一等獎作品,主要對工業制藥領域的臨床試驗數據進行了可視化,展示了這些試驗的分布情況和進展情況。

臨床試驗數據分析[22]
07
網易有數可視化大賽
網易有數可視化大賽,由網易旗下的大數據業務品牌主辦,其比賽形式也是交互式儀表盤。本次比賽共評出1個一等獎、5個二等獎、30個三等獎,名單詳見[23]。
一等獎《浙江高速數智報告》,包含了路網運行監測、交通數據規劃、公共運營服務、交管協同優化四大報表,可為道路巡查、事件檢測、路況感知、車流分析、交通預判等場景提供支撐。


浙江高速公路數據分析[23]
08
數字人文開放數據創新研究大賽
數據的分析挖掘當然也不限于商務智能領域。
數字人文開放數據創新研究大賽,由南京大學人文社會科學高級研究院數字人文創研中心主辦,也是第三屆數字人文大會下設的競賽單元。賽事提供了一系列有趣的人文數據挖掘題目,例如明清文獻中的色彩知識探秘、《建康實錄》文本挖掘及六朝人物關系時空分析、南京大屠殺期間《拉貝日記》的文本挖掘等。
彩蛋:倭瓜參加了這個比賽,并收獲一等獎。我們通過對《拉貝日記》的分析,還原了南京大屠殺期間日軍的暴行,。此外,這一比賽還評出了3個二等獎、6個三等獎。完整得獎名單見[24]。

《拉貝日記》文本挖掘[25]
縱觀分析挖掘類的數據可視化競賽,首先是比賽數量多、類型豐富。除了學術界、高校以外,很多公司也會組織這類比賽來擴大知名度、推廣數據產品,提供的獎金也比較豐厚。從上述獲獎作品中,我們也能較清晰地看到數據可視化在真實場景、真實業務中的應用、推廣價值。
當然,就評價標準而言,一些比賽更看重行業的應用性,一些更注重數據挖掘的深度,還有一些則強調可視化美觀性和敘事性。這也反映出,我們此次盤點的三個領域:敘事、設計、分析,仍在持續融合、相互借鑒。
本年度的系列盤點就到這里啦。完結撒花!讓我們期待一個更加有趣的2022年!
_____________
參考文獻:
[1]https://www.youtube.com/watch?v=prqZTuSkmfU&feature=youtu.be
[2]https://virtual.ieeevis.org/year/2021/session_a-vastchallenge.html
[3]https://ieeevis.b-cdn.net/vis_2021/posters/a-vastchallenge-posters-1012.pdf
[4]https://ieeevis.b-cdn.net/vis_2021/posters/a-vastchallenge-posters-1008.pdf
[5]https://virtual.ieeevis.org/year/2021/session_a-vastchallenge.html
[6]https://ieeevis.b-cdn.net/vis_2021/posters/a-vastchallenge-posters-1019.pdf
[7]https://ieeevis.b-cdn.net/vis_2021/posters/a-vastchallenge-posters-1015.pdf
[8]https://www.tableau.com/community/iron-viz
[9]https://public.tableau.com/app/profile/lisa.trescott/viz/BreakthroughArtistsIronViz2021IVLisa/Dashboard1
[10]https://public.tableau.com/app/profile/cj.mayes/viz/ChildhoodHero-IronViz2021/IronViz2021
[11]https://public.tableau.com/app/profile/brian.moore7221/viz/DiversityintheMarvelCinematicUniverse/DiversityintheMCU
[12]https://public.tableau.com/app/profile/sparsonsdataviz/viz/RiversofTimeMarvelStudiosMCUIronviz2021/RiversofTime
[13]https://public.tableau.com/app/profile/pradeepkumar.g/viz/TheShowThatBringsMeJoy/IronViz_2021
[14]https://public.tableau.com/app/profile/lisa.trescott/viz/RuPaulsDragRaceLipSyncs/LipSyncs
[15]https://tableau.headwaymarketing.com.cn/IT2021/Viz.aspx
[16]https://public.tableau.com/profile/yuri.wg#!/vizhome/_16205984439490/CarbonNeutralization
[17]http://www.chinavis.org/2021/challenge.html
[18]http://www.chinapowerbi.com/Works.html?activityId=17
[19]https://app.powerbi.com/view?r=eyJrIjoiZWQwNjI4NWItNmE2My00ZGY0LTkxY2MtZTMyNTcyMDJjYTc3IiwidCI6IjdlMTczODMxLThkZDYtNDlkZC1hY2Q1LTljZTY3ZmQ1ODM5MCIsImMiOjZ9
[20]https://app.powerbi.com/view?r=eyJrIjoiNTJmNDU1N2UtM2IwNi00M2ZlLWExYzItMTk5YjBlYmFmMjk3IiwidCI6IjhlMWJiOWRlLTYzODItNDlmYS05YWJlLTdmYTE1Y2FlNTQ3MiIsImMiOjEwfQ%3D%3D
[21]https://app.powerbi.cn/view?r=eyJrIjoiYjUzMDZmZTctM2Y0NS00NjRmLWFmNmMtZTY5NmI0M2Y1N2Y5IiwidCI6ImRhMGM1ODBmLTEwMzEtNGQ1OC1iYWMyLTc3NTkyNzI0MGQxOCJ9
[22]https://www.shangyexinzhi.com/article/4046115.html
[23]https://mp.weixin.qq.com/s/j9NCbMM8di_gLtruLukq5A
[24]https://www.heywhale.com/home/competition/612a494c39efe300170cdaa6/content/6
[25]https://olivialan.github.io/nanjing/
- the end -
原標題:《2021數據可視化獲獎作品大賞:分析挖掘篇》
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司