- +1
借哈佛這件事兒,我們來談談百度指數該怎么用
6月8日,哈佛大學在其學術社區平臺“DASH”公布了一篇論文。這篇新聞一開頭就用了一個令人震驚的標題——武漢在2019年秋天就可能有(新冠)病毒跡象。
標題令人震驚,內容卻十分滑稽。在這篇論文中,作者僅僅通過對比2018年10月和2019年10月這兩個時間段內,武漢多家醫院停車場車輛數量,以及這兩個時間段內百度搜索“腹瀉”“咳嗽”等詞的搜索數量,就得出所謂“武漢在2019年秋天就可能有(新冠)病毒跡象”的結論。

又由于在這篇論文中,哈佛cue到了百度搜索指數,所以百度在6月11日緊急回應:從武漢醫院附近交通車流量和百度上關于“咳嗽”與“腹瀉”的搜索數據來得出關于病毒的結論,這是非常牽強和不嚴謹的。
事實上,武漢地區“咳嗽”的整體搜索量峰值跟每年的流感季是吻合的,而“腹瀉”的搜索量與往年相比并沒有明顯變化。同時百度指數顯示,2019年12月左右“腹瀉”搜索量還有輕微下降。
百度方面也同時呼吁,相關研究需要更加科學嚴謹地引用百度數據。
說到底,哈佛作為國際知名學府,在甩鍋這件事兒上表現得過于急躁了些,以至于連百度指數都還沒搞清楚就出來寫稿子,這樣的內容比起國內的許多自媒體小編吹起牛來都要不負責任。
不過這件事情也并非完全的負能量。
事實上,通過哈佛這件事情也給我們所有人做了一個提醒,那就是那些聽起來就十分高大上的大數據也并非完全就掌握在高科技企業的實驗室里,其實在我們的日常生活中,我們就能通過這樣的大數據來獲取行業觀察、了解輿情狀態。
那么今天,我也借著這次機會,以百度指數為例和大家分享一下:在日常生活中,我們該怎樣正確使用大數據洞察,好讓大家在擴大自身視野的同時又不至于鬧出像哈佛一樣的笑話。
作者 / 指北BB組 大淺
編輯 / 蒲凡
百度指數是個啥
前面我們提了那么多,那么哈佛吹牛逼都用的百度指數究竟是個啥玩兒意呢?
其實,百度指數還真不是個玩意兒。根據百度官方介紹:百度指數是以百度海量網民行為數據為基礎的數據分享平臺。在這里,你可以研究關鍵詞搜索趨勢、洞察網民興趣和需求、監測輿情動向、定位受眾特征。
百度指數能夠告訴用戶:某個關鍵詞在百度的搜索規模有多大,一段時間內的漲跌態勢以及相關的新聞輿論變化,關注這些詞的網民是什么樣的,分布在哪里,同時還搜了哪些相關的詞。
2006年7月29日,百度指數1.0測試版上線,到2007年11月29日,經過一年多的優化,百度指數1.0正式上線。此后,經過6年多的發展,到2013年12月23日,百度指數完成升級,2.0版本正式上線,在當時也引起了不少用戶的關注。

到今天,百度指數已經形成了包括趨勢研究、需求圖譜、人群畫像三大板塊為主的7大數據分析模塊,成為了當前互聯網乃至重要的統計分析平臺之一。
那么,百度指數究竟怎么用呢?
百度指數怎么用
2019年以來,直播電商十分火熱,成為去年以來最大的風口。而作為站在風口上的男人和女人,薇婭和李佳琦在直播電商發展的進程中同樣獲得了巨大的關注。而正好指北團隊最近就在關注直播電商行業,所以我們今天就以李佳琦和薇婭為例,來看看百度指數都反應了一些什么信息。
使用百度指數十分簡單,通過百度搜索關鍵詞“百度指數”,點擊搜索結果的第一個鏈接就能進入百度指數的主頁面。隨后在搜索框中輸入我們這次要探究的關鍵詞“李佳琦”,點擊開始探索,便能正式進入數據頁面了。

進入數據頁面之后,我們還需要在關鍵詞欄目再添加一個關鍵詞“薇婭”作為對比詞匯。此外,我們還需要根據情況設置時間范圍,數據來源和地域范圍。
在這里,我們將時間范圍設置為半年,其他保持默認。這樣,我們就算是完成了前期設置,下面可以正式開始關于這兩大當紅主播的數據探索了。

當然我們也可以輸入更多的關鍵詞作為對比,例如抖音帶貨的羅永浩羅老師,或者之前在快手直播的帶貨一哥辛巴,只要添加關鍵詞,我們就能看到在整個時間線上,每個關鍵詞的搜索熱度。

而當我們觀察這些關鍵詞在近半年以來的搜索峰值就會發現,在4月1日這一天,羅永浩的搜索指數達到420179,是近半年以來的最高峰值。
看到這個情況,對直播電商或者羅永浩比較了解的朋友就會知道,這一天是羅永浩正式入駐抖音,開始人生的第一場直播帶貨的日子。
當然,如果你不清楚也沒關系,根據時間點,我們可以在百度再次進行搜索,同樣能明白在4月1日這一天,在羅老師身上究竟發生了什么。

所以,你明白了百度指數的基本玩法了嗎?
趨勢探索
好了,再回到李佳琦和薇婭。通過移動下方的藍色橫條,我們就可以以半年為單位對所搜索的關鍵詞進行橫向查看。
通過對比我們會發現,薇婭比李佳琦“出圈”更早。在2018年3月31日,在網上就已經有了薇婭的相關報道,而李佳琦第一次出現在網上(有相關新聞)則要等到2019年1月24日。

雖然李佳琦出名更晚,但顯然李佳琦團隊更懂得媒體公關和品牌營銷。
因此,在2019年1月正式“出道”之后,李佳琦的百度指數熱度迅速超過薇婭,并在2019年5月12日這天達到第一個峰值。通過搜索我們知道,在這一天,李佳琦將自己的口頭禪“oh my god”注冊成了聲音商標,這也代表著他向著自己的夢想“做一個享譽全球的中國品牌”又邁進了一步。

而當我們把時間線再往前移,我們會發現直到2019年10月,薇婭團隊在才正式開始在品牌公關上發力。此后,從2020年4月24日開始,李佳琦的熱度開始消退,薇婭開始反超,到4月底,薇婭的熱度全面超過李佳琦,正式成為帶貨直播電商領域的一姐。

而在百度指數趨勢圖下方,百度指數也給了我們更為直觀的整體數據描述。通過這組數據我們可以看出,在最近半年的這段時間,李佳琦和薇婭無論是整體日均值還是移動日均值都相差不大。但是在增長趨勢上,無論是在同比(與去年同期相比)還是環比(與上一個相鄰時間段相比),是整體還是移動端,薇婭的熱度增長速度都遠遠高于李佳琦。
所以我們不妨猜想一下,如果李佳琦不努力的話,在今年下半年結束的時候,薇婭可能就會遠遠將他甩在身后了。
媒體資訊指數
聊完了搜索指數我們再往下翻,會發現在下方還會有一個資訊關注欄目。這個欄目分為兩類,一類是資訊指數,一類是媒體指數。
所謂資訊指數是指以百度智能分發和推薦內容數據為基礎,將網民的閱讀、評論、轉發、點贊、不喜歡等行為的數量加權求和得出資訊指數;而媒體指數則是以各大互聯網媒體報道的新聞中,與關鍵詞相關的,被百度新聞頻道收錄的數量,采用新聞標題包含關鍵詞的統計標準,數據來源、計算方法與搜索指數無直接關系。

這樣聽起來可能比較復雜,所以講人話就是:資訊指數更側重網友對這個關鍵詞的關注程度,而媒體指數更偏向新聞報道對這個關鍵詞的關注程度。
那么再回到數據上看,我們能夠直觀感受到的是媒體指數和資訊指數基本呈正相關的趨勢,媒體指數越高,用戶的關注程度也越多,但如果我們將媒體指數和搜索指數相對比,我們又會發現,在網上投放更多的新聞內容并不一定會提高用戶的搜索反饋。

以2020年5月14日為例,李佳琦的媒體指數這一天達到半年以來的峰值,但這一數據卻并沒有在搜索指數上得到應有的反應。
所以我們或許可以判斷,在李佳琦團隊長期的公關策略中,單純的媒體內容投放已經并不能達到預期的效果,反而是薇婭在4月份以來更頻繁的參加社會公益活動更能引起廣大網友的關注和共鳴。
需求圖譜
聊完了趨勢研究這一欄,我們再往右邊就是關于搜索關鍵詞的用戶需求圖譜。而這一欄可能會比剛才單純枯燥的數據來的更有趣一些。
我們先以李佳琦為例,可以看到在關鍵詞李佳琦之外,會有三個深淺不一的圓圈,而顏色越深,越靠近李佳琦就說明這個搜索與它的相關程度越高。

除此之外,綠色的表示搜索趨勢下降,而黃色的則表示搜索熱度上升,再加上最下方的時間線,整個用戶需求圖譜就十分清晰了。
通過這些關鍵詞,我們大概可以了解到,用戶搜索李佳琦除了關注他和薇婭的競爭之外,廣大網友還關心李佳琦是哪里人、李佳琦的個人資料;而相比于李佳琦,網友對于薇婭的關心則會顯得更為八卦一些,例如網友除了會關心薇婭的個人資料,還會關心薇婭的老公是誰,并試圖通過專程搜索董海峰去更多的了解這個薇婭背后的男人。

所以,通過這樣的對比,我們似乎也能推測出一些關于廣大網友在關注名人這件事背后的邏輯,當一個帥氣的男性事業成功的時候,人們往往會關注這個男性本身;而當一個漂亮的女性事業成功的時候,人們卻總會想要去窺探這個女性背后的男人。
人群畫像
聊完了需求圖譜再往右邊就進入了百度指數的最后一欄,人群畫像。在這一欄中,我們能夠看到搜索關鍵詞的用戶包括地域、年齡、性別、興趣的基本分布情況。
可以看到,在地域分布上,李佳琦和薇婭的主要關注者都來自東部沿海城市、華中地區和四川等地。這些數據也同時反映了,在我國廣大的土地上究竟哪些省份對直播帶貨的接受程度更高。
另一方面,在右邊的排行欄中,我們不僅能夠看到在各地區對于關鍵詞的關注程度,而且還能通過對比關鍵詞看到,近半年時間,在廣東和上海關注李佳琦的人要遠遠超過關注薇婭的人,而在浙江、河南、安徽、山東等地,薇婭的關注度會更有優勢。

而在年齡分布上,我們還能看到,關注李佳琦和薇婭的網友當中,年齡主要集中在20-39歲,其中20-29歲年齡層次的用網友明顯占比更多。
同時,面對李佳琦和薇婭兩個不同風格和不同性別的主播,李佳琦明顯的更受女性用戶和年輕用戶的喜愛,而關注薇婭的用戶在性別和20-39歲之間的年齡分布相對更為均衡。
另一個比較有意思的是,無論是關注李佳琦還是薇婭,女性用戶都高于男性用戶。所以,對于買買買這件事兒,女性或許真的比男性更有天賦也說不定。

最后,在地域、年齡和性別分布之后,百度指數最后一欄的最后一項就是,關于搜索關鍵詞的用戶的興趣畫像。
這個興趣畫像同樣分為兩個部分,一個是用戶搜索占比,另一個是TGI。
不知道什么是TGI?沒關系,我也不知道什么是TGI。所以我又用百度查了一下。所謂TGI,又叫目標群體指數,可反映目標群體在特定研究范圍內的強勢或弱勢。
說人話就是:TGI指數越高,目標群體相關性越強,反之則越弱。

所以,通過搜索占比我們可以看到,關注李佳琦和薇婭的網友在整體興趣點上是基本一致的。但是如果我們再通過TGI來觀察的話,就會發現,在關注李佳琦的用戶中,熱愛游戲的用戶的TGI明顯要高于關注薇婭的用戶。
所以如果有一天你打算找李佳琦或者薇婭幫你直播帶貨,而你的產品又剛好是一款游戲相關產品的時候,那么我肯定會強烈建議你選擇李佳琦。
結語
最后,在明白了百度指數的使用方法之后,我們還應該知道,在百度指數之外,還有許多平臺數據分析工具,例如微信就有微信指數,微博也有自己的微博指數,而這些數據其實也都能夠被用戶公開查詢。
所以,在如今的互聯網世界中,信息的門檻被踏平,當一個新聞出現的時候,每一個身處互聯網世界的人都可以通過自己的方式去求證。
而這也同樣告訴那些一心甩鍋,或者一心想要搞個大新聞的人,新時代的人們已經不再像之前那么好欺騙,而你們如果還想搞個大新聞,那起碼也得先學會基本功是吧。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司