- +1
韭菜防割手冊:投資不懂“貝葉斯”,買遍A股也枉然
原創 愚老頭 錦緞 收錄于話題#A股40#投資策略1

本文基于公開資料撰寫,僅作為信息交流之用,不構成任何投資建議。
股票投資這個事情,到了最后,你就會發現,一切都是數學。
雖然很多人不喜歡這個結論,但我還是要說,一個人在股市的上限,是由他的數學水平決定的。
那么下限呢?
顯而易見,現在的我們就是啊。
股價在某一段時間內的上下波動,就是數學上的時間序列分析,我們每一次的買入賣出,都遵循典型的概率論理論?,F在還活躍在市場上的那些老策略分析師,都會經歷一次從信仰到算命再到量化的心靈洗禮,無他,這個市場太反人性了。
我知道,有那么一些文章,非常擅長把一些淺顯的道理用很深奧的理論說出來,貌似深刻,實則賣弄風騷。我們當然也有這么一個嫌疑,但我還是覺得,下面的這個數學原理,對我們提高下限,不再老是被割,有那么一點點借鑒,值得大家花時間去了解下。
投資,就是一場貝葉斯。
貝葉斯定理,大學中的概率論和數理統計這一門課程有講,一般專業只要有數學課,都會有這么一門課。這個定理,聽上去很高大上,其實蘊含的道理卻很簡單樸實。
這個公式要解決的問題,是如何評估你新獲得的信息對當前狀態的影響。
大家可能會覺得有些繞,我這么說,大家就明白了。你最近關注的一只股票,突然周末發公告,10送10轉10,現在讓你判斷,周一股價會漲會跌?高送轉這個事件,就是你新得到的信息,貝葉斯定理,可以用來判斷這個信息對股價的影響,或者說周一股價漲跌的概率。
貝葉斯定理,作為概率論的一個重大理論支柱,是因為提出了逆向概率的解題思路。
所謂的正向概率,邏輯上叫做演繹,就是你自己是上帝,你就是規則,你決定了結果,比如擲色子,你知道只要擲出足夠多的次數,出現其中一個面的概率會是六分之一。
而逆向概率,與正向概率正相反,邏輯上對應的是歸納,就是你知道了其中的一次,或者多次結果,讓你猜規則是什么。對應到股市就是,當你看到股市漲了或者跌了,就去找有什么新的信息出現,進而研究這個消息背后的規律,如此反復不斷豐富這個規律,逐漸就能判斷信息出現后股市的漲跌。
雖然我們不喜歡公式,但圖窮匕見,最后還是要走到這一步,貝葉斯定理的公式如下:

P是英文probability的簡寫,P(A)代表A事件發生的概率,P(A/H)代表在H發生的情況下A發生的概率。P(A)被稱為先驗概率,P(A/H)則被稱為后驗概率,上面這個公式同樣可以定義成:
后驗概率 = 先驗概率 * 似然估計 ,其中似然估計=P(H/A)/P(H)
怎么理解呢?
先驗概率可以理解成當前的狀態,在你得到某個信息之前的狀態。用開頭那個高送轉的案例就是,你關注了一只股票,你拿不準這只股票將來是不是要漲,也就是說在你的心里,這只股票上漲的概率可能有,但并不足以讓你下注。這個時候的P(A)就可以解釋成當前狀態下,這只股票上漲的概率。
后驗概率呢?這是你得到新信息之后對原有狀態的判斷進行更新,這個新的信息可能增強,也可能削弱了你原先的判斷。用剛才的例子來說就是,周末公告了高送轉的信息,這個信息用H代表,按照我們剛才的定義,P(A/H)意思就是在高送轉發生的情況下,這只股票上漲的概率。
似然估計代表了信息引進之后,在多大程度上增強還是削弱了原事件發生的概率。在這個例子中,似然估計就是高送轉公告之后,是增強還是弱化了這只股票可能上漲的概率。
似然估計是這個公式的核心,也是最容易讓人迷惑的地方,從案例的角度,分子P(H/A)代表的是窮舉所有股票上漲的情況,因為高送轉引起的占比有多大,分母P(H)代表的是,在所有的股票中,高送轉的比例有多大。
為什么要這么設計呢?我們在研究所有股票上漲的例子時,統計這其中高送轉的所占的比例,這個比例越高,代表似然估計的值越大,也就是支持上漲的概率越大,但這其中可能存在一種情況,那就在總體,也就是所有股票中高送轉的比例就很高,就會造成高送轉這個新的信息支撐上漲的依據不成立。
那怎么辦呢?需要我們用分母,也就是P(H)來除一下。這是一個最容易出邏輯錯誤的地方,如果單看公式,似乎是P(H)越低,P(H/A)越高,似然估計的值就越高。這會鼓勵我們去尋找一個較低的P(H),也就是一個小概率出現的信息。顯然這是一個明顯的錯誤,似然估計需要從一個整體來考慮。

我們用一個圖來表示,在上圖中,整個大正方體方框代表的是整體,橢圓形部分代表的是H,心形這部分是A,中間紅色的代表的是A和H重合的部分。我們的似然估計要的是什么呢?
是重合部分比例占A的比例,明顯的比H占總體的比例要大,這個是似然估計要表達的意義。在上圖中,重合部分占A的比例明顯要大于二分之一,而H占到整體的比例顯然小于二分之一,因此似然估計的值必然要大于1。

換一個角度理解,似然估計的意義是評估H因素在總體的影響力,在A中是不是得到強化了。我們研究A這個心形,發現其中重合部分的H占到的比例超過二分之一,看上去H非常顯著,但我們怕出現上圖的情況。
上圖中正方體方框依舊代表整體,我們發現H占總體的比例已經達到四分之三,但與A重合部分在A中占的比例顯然只有二分之一多一點,并不到四分之三,這說明在A中H的影響力量是相對弱化了,似然估計反而是小于1的,也就是新信息的加入,反而減小了先驗事件發生的可能性。
通過這兩個圖,我們對似然估計有了一個相對初步的認識,這就足夠了。
總結一下,在這個案例中,我們想要求出高送轉公告發生之后,這只股票上漲的概率,也就是后驗概率,可以通過分別估計先驗概率與似然估計的值來得出。先驗概率就是這只股票在高送轉公告之前上漲的概率,似然估計的值可以用所有股票上漲的原因中高送轉所占的比例,除以全部股票中發生高送轉的概率來得到。
貝葉斯定理的描述基本結束,回到我們選股上。
貝葉斯定理,為我們提供了一個很好的思維框架,這個框架對于東亞做題家是非常友好的,將選股完全轉化為兩個方向的工作。
具體的說,要想提高勝率,也就是后驗概率,無非兩個方向:
第一個是提高先驗概率P(A),就是在最容易上漲的時機入手,這個好理解,牛市的時候雞犬升天,你在牛市的時候賺錢總是比在熊市的可能性要大很多。
第二個是增大似然估計,重點是P(H/A),也就是研究上漲的股票都有什么特征,盡量找共性大的特性。注意避免一個陷阱,就是我們上圖中出現的情況,這個特性在上漲的股票中出現的特別多,但所有的股票也基本都有這個特性,反而意義不大。
比如“股災”期間,很多上市公司都回購,你統計在這一段時間內表現優秀的公司的時候,發現回購的比例非常大,你興沖沖的把這個要素作為選股的一個重要標準,結果發現那段期間基本上所有公司都回購,那這個信息在選股的時候意義就不大了。
反之,如果那段時間,上市公司總體回購的比例很低,但在表現優秀的公司中比例很高,那這個要素的選股價值就真的體現出來了。
要想提高先驗概率,真的只能是”日拱一卒,功不唐捐“了。雖然判斷是不是牛市,可能成功率比算命還要低,但這個市場已經運行很多年了,總會有一些規律,只要你不斷開拓,總會知道哪些地方容易有魚,在魚多的地方釣魚,你釣到魚的概率總會大一些。
提高先驗概率目前看大致有三個方向。
方向一:日歷效應
在我們A股,總有那么幾個月市場表現要好一點,某些行業,在一年里也總有某個月表現出色,你在這些月份做多,成功的概率總要大一些。

上圖是中證1000指數過去10年的月度漲跌幅。中證1000指數是全部A股剔除中證800之后,剩下的市值最大的1000只股票組成的指數,基本上可以代表市場中位數,或者說散戶喜歡的中小票的走勢。
分月度看,在二月份,中證1000指數在過去10年里,有8年是上漲的,哪怕是下跌的那兩年,跌幅也不大。真是二月不做多,一年活白干。

上圖是申萬銀行指數過去10年的分月度漲跌幅。我們不好解釋為什么,可在過去10年,10月份有9次是上漲的,肯定是在這個月份發生了什么,銀行才會漲的吧。

各個工作日指數的表現也有一些規律。我們列出了從2005年以來,中證1000指數分工作日的上漲概率,非常明顯的是,周二上漲的概率很大,而周三周四下跌的概率則相對較大。也就是說,如果想要調倉,周二賣出,周三四買入,長期看調倉的成本要小一些。
方向二:協整效應
還有一種思路在量化上叫協整,就是找兩個歷史上同漲同跌的股票,在走勢出現大的分歧的時候賭他們將來走勢會一致。因為A股不好做空,一般就是其中一個股票漲上去了,而另一只股票卻沒怎么動,就買入這只趴著不動的股票。

典型的比如隆基股份和通威股份,這兩個光伏的龍頭,自2017年以來,基本上同漲同跌,在今年2月份的時候隆基的漲幅顯然大大跑贏通威股份,但是這個差距只用了一個月的時間就通過通威的暴漲被消滅,當然現在兩只股票的走勢也出現大的分野,但我們總體上還是認為這種走勢的差別最后會消失。
方向三:估值的歷史比較
中國股市的歷史也有快三十年了,市場正常的估值水平大家還有有數的,在一個過高的估值買入,虧錢的概率顯然要比賺錢的概率要大。

上圖是創業板指當前的歷史估值對應的未來一年收益率統計。從市凈率的角度看,當前創業板指估值已經非常高,歷史上超過這個估值的月份寥寥無幾。創業板市凈率的下限在2.5左右,當創業板指市凈率低到3左右時,未來一年盈利的概率非常大。至于現在,未來一年賺錢的概率相當小吧。想在創業板買到好股票,這個先驗概率,確實不太大。
至于提高似然估計的值, 當前主要還是要靠發掘牛股的基因,最簡單粗暴的做法是研究十倍股的特征。

跟大家印象里不太一樣的是,十倍股,真的是太稀缺了。從2016年至今,都快5年了,滿打滿算只有4只10倍股,其中從2016年至今,山西汾酒和恒立液壓漲幅超過10倍,從2019年至今,又出現了2只10倍股,英科醫療和堅朗五金,嚴格意義上,今年的10倍股只有一只,那就是英科醫療。
從特征上看,這四只股票所處的行業并不性感,四只股票,一只白酒股,一只醫藥股,一只機械,還有一只是建材。
這其中,山西汾酒和堅朗五金情況類似,在過去五年里,業績增長了約三倍,剩下的全靠估值帶動。恒立液壓,過去五年業績漲了20倍,但基數也低,從市凈率的角度,估值確實也提升了三倍左右。
至于英科醫療,一個生產醫用手套的公司,因為疫情原因業績直接原地爆炸,前三季度歸母凈利潤44個億,預計全年至少60個億,而正常年份一年才不過是2個億的樣子,漲10倍也合理,只不過市場認為這種情況不可持續,并沒有給太高的估值,今年的市盈率7倍左右。
從個股的邏輯上看,山西汾酒講的是混改、以及渠道從省內向省外擴張的故事,山西汾酒的牌子硬,問題不大。恒立液壓,處于液壓賽道,國產替代的動力足,英科醫療業績高增,至于堅朗五金,還是要再想想為什么。

如果我們把時間拉長,剔除那些2011年以后才上市的股票,在總共1993只股票中,過去十年十倍的股票,也只有15只,這其中漲幅最大的是立訊精密,接近30倍,這就是為什么我們說,立訊精密是公募的信仰。
剩下的十倍股還有億緯鋰能、通策醫療、東方財富、愛爾眼科、雙林生物、華夏幸福、同花順、智飛生物、貴州茅臺、贛鋒鋰業、片仔癀、長春高新、中國中免、聞泰科技。各有的原因,其中有些是借殼,嚴格意義上不能算十倍股,這些留待讀者自己去分析。
有一種說法是,假如一個人在自己領域工作、研究用不到線性代數和微積分,那么敢肯定,他的工作不夠前沿、不夠出色,甚至不夠專業。
說到線性代數和微積分,我們可能確實離的有些遠,但概率,確實是投資的主場。貝葉斯定理可能從公式上不太好理解,可他提供的框架,還是給了我們提高勝率指明了方向。
本文首發于作者同名雪球專欄
原標題:《韭菜防割手冊:投資不懂“貝葉斯”,買遍A股也枉然》
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司