- +1
KDD 2021最佳論文等獎項出爐,首爾大學、斯坦福獲獎,北理工上榜
機器之心報道
機器之心編輯部
國際數據挖掘頂會 KDD 2021 剛剛放出了最佳論文等獎項,最受矚目的最佳論文獎由首爾大學和斯坦福大學等機構的研究者分別摘得,最佳學生論文獎由維也納大學的研究團隊獲得。

KDD 會議始于 1989 年,是數據挖掘領域歷史最悠久、規模最大的國際頂級學術會議,也是首個引入大數據、數據科學、預測分析、眾包等概念的會議。
目前,KDD 2021 大會正在線上如火如荼地舉行當中,議程包括主題演講、專題小組、特邀報告、精選研究、workshop 等。大會共計收到 1541 篇有效投稿,其中 238 篇論文被接收,接收率為 15.4%,相比去年的接收率 16.9% 有所下降。
KDD 2021 線上開幕之前,,包括創新獎、服務獎、學位論文獎(亞軍及榮譽提名)、新星獎、時間檢驗研究獎和時間檢驗應用科學獎,其中北航校友 Xia “Ben” Hu (胡俠)獲得了新星獎,字節跳動 AML 研究團隊 Chong Wang 的一篇 KDD 2011 論文獲得了時間檢驗研究獎。
剛剛,KDD 2021 公布了研究方向(research track)和應用數據科學方向(Applied Data Science Track)的最佳論文和最佳學生論文,具體如下:
首爾大學研究者獲得研究方向最佳論文獎
斯坦福大學等機構的研究者獲得應用數據科學方向最佳論文
北京理工大學和美的集團的研究者獲得應用數據科學方向最佳論文亞軍
維也納大學的研究者獲得研究方向最佳學生論文
研究方向最佳論文
今年的「研究方向最佳論文獎」由來自首爾大學的 Jun-gi Jang、U Kang 摘得,獲獎論文是《Fast and Memory-Efficient Tucker Decomposition for Answering Diverse Time Range Queries》。

論文地址:https://dl.acm.org/doi/pdf/10.1145/3447548.3467290
論文摘要:給定一個時間密集張量和一個任意的時間范圍,我們如何有效地在這個范圍內得到潛在因子?Tucker 分解是分析密集張量以發現隱藏因子的基本工具,已在許多數據挖掘應用中得到應用。然而,現有的分解方法不提供分析特定范圍的時間張量的功能。現有的方法是 one-off 形式,主要集中在對整個輸入張量執行一次 Tucker 分解。盡管現有的一些預處理方法可以處理時間范圍查詢,但它們仍然非常耗時,并且準確率較低。
在該論文中,該研究提出了 Zoom-Tucker,這是一種快速且節省內存的 Tucker 分解方法,可用于在任意時間范圍內查找時間張量數據的隱藏因子。Zoom-Tucker 充分利用塊結構來壓縮給定的張量,支持有效查詢并捕獲本地信息。Zoom-Tucker 通過精心解耦包含在該范圍內的預處理結果并仔細確定計算順序,快速且高效地回答各種時間范圍查詢。研究證明,與現有的方法相比 Zoom-Tucker 的速度快 171.9 倍,所需空間少 230 倍,同時提供了相當的準確率。

Zoom-Tucker 預處理過程。

查詢時間和重構誤差之間權衡的比較結果。

空間成本比較:Zoom-Tucker 與其他方法相比,所需空間少 230 倍。
研究方向最佳學生論文
來自維也納大學計算機學院的 Ylli Sadikaj 等人獲得了研究方向最佳學生論文,獲獎論文是《Spectral Clustering of Attributed Multi-relational Graphs》。

論文地址:https://dl.acm.org/doi/pdf/10.1145/3447548.3467381
論文摘要:圖聚類旨在發現節點的自然分組,以便將相似的節點分配到一個公共集群。已有一些研究提出了面向多種圖的多種算法,包括簡單圖、節點含有相關屬性的圖,以及對于邊代表不同類型關系的圖等。然而,許多領域中的復雜數據可以同時表征為屬性網絡和多關系網絡。在該論文中,研究者提出了 SpectralMix,這是一種用于具有分類節點屬性的多關系圖的聯合降維技術。SpectralMix 集成了來自屬性、關系類型和圖結構的所有可用信息,以實現對聚類結果的合理解釋。此外,SpectralMix 泛化了現有方法:當僅應用于單個圖時,它簡化為頻譜嵌入和聚類,當應用于分類數據時轉換為同質性分析。該研究在幾個現實世界的數據集上進行了實驗,以檢測圖結構和分類屬性之間的依賴關系,并展示了 SpectralMix 相比于現有方法的優勢。

上圖是幾種模型在 ACM 數據集上實驗結果的可視化。從中我們可以觀察到 ANRL、CrossMNA、DMGC 和 MARINE 表現不佳,因為屬于不同研究領域的節點被混到了一起;而 SpectralMix、DMGI、HAN 和 DGI 能夠更好地區分不同類型的節點。很明顯,SpectralMix 能夠將不同研究領域的節點以更清晰的邊界和更多的節點數目進行正確的聚類。此外,在圖 4(h) 中嵌入的 SpectralMix 節點上值得注意的是,右側有一組不同的節點,代表噪聲數據或異常值,這表明 SpectralMix 對異常值具有穩健性。
應用數據科學方向最佳論文獎
今年的「應用數據科學方向最佳論文獎」由來自斯坦福大學等機構的 Serina Chang 等人摘得,獲獎論文是《Supporting COVID-19 policy response with large-scale mobility-based modeling》。

論文地址:https://dl.acm.org/doi/pdf/10.1145/3447548.3467182
論文摘要:移動性限制(Mobility restriction)一直是控制 COVID-19 傳播的主要干預措施,但它們也給個人和企業帶來經濟負擔。為了平衡這些相互競爭的需求,決策者需要分析工具來評估不同的移動性措施帶來的成本和收益。
在該論文中,研究者介紹了與弗吉尼亞衛生部在決策支持工具上的互動所激發的工作,該工具利用大規模數據和流行病學模型來量化移動性變化對感染率的影響。該研究模型通過使用細粒度的動態移動網絡來捕獲 COVID-19 的傳播,該網絡對人們每小時從社區到各個地方的移動進行編碼,每小時有超過 30 億條邊。通過擾亂移動網絡,該研究可以模擬各種各樣的重新開放計劃,并預測它們在新感染和每個部門的訪問量損失方面的影響。為了在實踐中部署這個模型,該研究構建了一個具有魯棒性的計算基礎設施來運行數百萬個模型,并且該研究與政策制定者合作開發了一個交互式儀表板(dashboard),用于傳達模型對數千個潛在政策的預測。

方法概覽。

由 5 部分組成的交互式儀表板,分別是 POI 導航欄(左)、地圖面板(右上)、表格面板(中下)、數據面板(右下)和移動性歷史面板(彈出窗口)。
應用數據科學方向最佳論文亞軍
北京理工大學和美的集團的 Hao Wang、Chi Harold Liu 和 Jian Tang 等人獲得了應用數據科學方向最佳論文亞軍,獲獎論文是《 Energy-Efficient 3D Vehicular Crowdsourcing For Disaster Response by Distributed Deep Reinforcement Learning 》。

論文地址:https://dl.acm.org/doi/pdf/10.1145/3447548.3467070
論文摘要快速有效地訪問環境和生活數據是成功應對災害的關鍵。由無人機和無人駕駛汽車等無人駕駛交通工具 (UV) 組成的車輛眾包 (VC) 從興趣點 (PoI) 收集數據,例如可能有幸存者的地點和火災現場,這提供了一種有效的方式來協助災難救援。在該論文中,研究者考慮了在 3D 災難工作區中導航一組 UV,以最大限度地提高收集的數據量、地理公平性、能源效率,同時最大限度地減少由于傳輸速率有限而導致的數據丟失。
該研究提出了一種分布式深度強化學習框架 DRL-DisasterVC(3D),該框架帶有重復經驗回放 (RER) 以提高學習效率,并使用裁剪目標網絡來提高學習穩定性。該研究使用具有多頭關系注意力 (MHRA) 的 3D 卷積神經網絡進行空間建模,并且添加輔助像素控制 (PC) 進行空間探索。研究者設計了一種名為「DisasterSim」的新型災難響應模擬器,并進行了大量實驗,以表明當改變 UV、PoI 和 SNR 閾值的數量時,DRL-DisasterVC(3D) 在能效方面優于實驗中所有 5 個基線方法。

研究者提出的 DRL-DisasterVC(3D)。
NVIDIA對話式AI開發工具NeMo實戰分享
開源工具包 NeMo 是一個集成自動語音識別(ASR)、自然語言處理(NLP)和語音合成(TTS)的對話式 AI 工具包,便于開發者開箱即用,僅用幾行代碼便可以方便快速的完成對話式 AI 場景中的相關任務。
8月26日20:00-21:00,系列分享第2期:使用NeMo快速構建智能問答系統。
智能問答系統簡介
智能問答系統的工作流程和原理
構建適合于NeMo的中文問答數據集
在NeMo中訓練中文問答系統模型
使用模型進行推理完成中文智能問答的任務
直播鏈接:https://jmq.h5.xeknow.com/s/how4w(點擊閱讀原文直達)
報名方式:進入直播間——移動端點擊底部「觀看直播」、PC端點擊「立即學習」——填寫報名表單后即可進入直播間觀看。
交流答疑群:直播間詳情頁掃碼即可加入。
? THE END
轉載請聯系本公眾號獲得授權
投稿或尋求報道:content@jiqizhixin.com
原標題:《KDD 2021最佳論文等獎項出爐,首爾大學、斯坦福獲獎,北理工上榜》
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司