- +1
數據中心運維時人與機器誰重要?阿里巴巴和騰訊高管展開辯論
人工智能(AI),機器學習(ML),大數據和其他增強學習技術如何在數據中心中應用?機器和人類如何合作管理基礎設施?
6月25日,DCD數據中心國際峰會上海站在上海中心大廈舉行。針對上述議題的一場分論壇中,騰訊和阿里巴巴的高管分別對這一議題給出了不同的詮釋。
騰訊數據中心研發總監岳上對騰訊研發的智能化管理數據中心軟件平臺——騰訊智維平臺做出了介紹,解釋了騰訊如何利用新技術管理巨大數據,并保證數據準確性。阿里基礎設施一體化架構師汪剛則表示,在數據中心的運維中,AI只是手段,在梳理數據邏輯時,人起到的作用更大。
目前,騰訊智維管理了騰訊內部約80個數據中心,超過百萬臺服務器設備。如今,騰訊的數據中心測點數超過600萬,每分鐘可收集千萬條現場數據、150G視頻數據,從80個數據中心上送到平臺上,騰訊智維就是基于這些數據進行著管理工作。
談到具體實踐時,岳上介紹,騰訊在保證數據準確性上從五個方面入手。
1.測點側,監控MDC測點接入率;2.網絡側,通過技術手段,自動識別問題并判斷根因,進而自動切換或者人工干預;3.視頻側,實時檢查視頻參數、視頻格式和碼率,發現問題及時告警;4.服務器側,一旦服務器進風溫度異常,及時告警;5.異常數值,對數值做了合理區間設定,系統算出異常值會預警開發者。
汪剛則認為,在數據中心的運維中,AI只是手段。“并不是說在一個數據中心里布點越多、數據越多就越好。在梳理數據邏輯時,人起到的作用更大。”
汪剛向參會觀眾介紹:“業界講AI有時會把AI當作一個目的,但它只是一個手段,更重要的是數據。在使用機器學習和AI等技術之前,首先要明確數據是為了解決什么問題,數據來源是否準確。”
汪剛介紹,在采集數據之后,怎么把數據邏輯梳理清楚非常重要。數據中心運維過程中會出現假報警的情況,這種情況數據可能本身是準確的,但對場景的解釋是有錯誤的。通過邏輯把報假警的情況輸送到機器學習之前提前剔除,機器學習的效率會提高很多。
汪剛總結道:“所以并不是說在一個數據中心里布點越多、數據越多就越好,把邏輯梳理清楚,明白在什么關鍵的地方布什么點,傳感器得到的數據才是對你來說最好的,這里面比起機器學習,人起到的作用更大。”





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司