
財富中心99號
東?h股票配資:【 139 k 1313 k 4668 】 【宏發(fā)投資專注股票配資|期貨配資,獨立賬戶交易,歡迎電詢合作】!
假設檢驗的基本思想:假設檢驗的統(tǒng)計思想是:概率很小的事件在一次試驗中可以認為基本上是不會發(fā)生的,即小概率原理。例如,某一事件出現(xiàn)的概率是0.001時,那么平均在1000次重復試驗中可能才出現(xiàn)一次。因此,...[詳細]
東?h股票配資:【 139 k 1313 k 4668 】 【宏發(fā)投資專注股票配資|期貨配資,獨立賬戶交易,歡迎電詢合作】!
假設檢驗的基本思想:假設檢驗的統(tǒng)計思想是:概率很小的事件在一次試驗中可以認為基本上是不會發(fā)生的,即小概率原理。例如,某一事件出現(xiàn)的概率是0.001時,那么平均在1000次重復試驗中可能才出現(xiàn)一次。因此,概率很小的事件在一次試驗中幾乎是不可能發(fā)生的,于是,我們把“小概率事件在一次試驗中發(fā)生了”看成是不合理的現(xiàn)象。為了檢驗一個假設是否成立,我們就先假定這個假設是成立的,如果根據(jù)這個假定導致了一個不合理的小概率事件發(fā)生,那就表明原來的假定是不正確的,我們就拒絕這個接受這個假設。如果由此沒有導出不合理的現(xiàn)象,則不能拒絕接受這個假設。這個小概率到底多小才算是不合理的小概率事件,一般統(tǒng)計學用的最多是0.05,也有更嚴格的用0.01的,也有寬松的用0.1的,這個可以試個人對于風險的偏好,風險偏好高的朋友可以用0.1的標準,這樣的好處就是可以比較容易拒絕原假設,代價就是發(fā)生錯誤的幾率也增大。風險偏好低的朋友可以用0.01的標準,這樣的好處就是可以不易發(fā)生原假設被錯誤拒絕的情況,代價就是發(fā)生拒絕原假設的難度大大增加,可能會發(fā)生原假設實際上不成立但由于拒絕假設的標準過于嚴格導致無法拒絕原假設的情況。實際應用舉例:上面說的很是抽象,下面我們說個具體的例子來看一下假設檢驗如何應用。問題:一枚來歷不明的硬幣,據(jù)說硬幣的某一面可能摻加進去了某種密度不同的雜質(zhì)導致硬幣兩面的重量不一致,現(xiàn)在在不使用任何檢驗儀器的情況下,如何判斷這個消息的真?zhèn)涡?統(tǒng)計學解決方案:反復的隨機拋這枚硬幣,統(tǒng)計其正面朝上和朝下的次數(shù),通過此數(shù)字來判斷。具體步驟如下:1.假設硬幣沒有問題,是標準的硬幣,那么硬幣隨機拋后每次正面朝上和朝下的概率是各50%,多次隨機的拋硬幣n次后,正面朝上為m次的概率是可以計算出來的。具體而言,比如連續(xù)隨機拋10次硬幣,那么出現(xiàn)正面朝上的多少次的概率如下:0次,概率為1/1024;1次,概率為10/1024;2次,概率為45/1024;3次,概率為120/1024;4次,概率為210/1024;5次,概率為252/1024;6次,概率為210/1024;7次,概率為120/1024;8次,概率為45/1024;9次,概率為10/1024;10次,概率為1/1024;從以上數(shù)據(jù)可以看出,如果硬幣是標準的,那么連續(xù)隨機拋十次硬幣后,正面向上的次數(shù)為{0,1,9,10}集合中的某一個數(shù)字的概率均低于5%(即0.05)。如果我們選取0.05的顯著性檢驗標準,那么如果連續(xù)拋10次硬幣后硬幣正面朝上的次數(shù)為{0,1,9,10}集合中的某一個數(shù)字,那么,我們可以說在0.05的顯著性水平下,這枚硬幣是標準硬幣的假設不成立。2.連續(xù)的拋10次此枚硬幣,觀察其正面向上的次數(shù),如果其次數(shù)為{2,3,4,5,6,7,8}集合中的某個數(shù)字,則我們無法拒絕標準硬幣這一假設。如果其次數(shù)為{0,1,9,10}集合中的某一個數(shù)字,那么,我們可以說在0.05的顯著性水平下,這枚硬幣是標準硬幣的假設不成立。以上便是假設檢驗的基本流程。接著這個話題我談談樣本數(shù)對于假設檢驗的影響。拋10次硬幣必須得8次以上或2次以下才能拒絕標準硬幣的假設,那么拋100次硬幣是不是必須得80次以上或者20次以下才可以呢?不是的。有興趣的朋友可以自己去計算或者用統(tǒng)計學的假設檢驗分布表,我用分布表計算出來的數(shù)據(jù)如下:20次時,15次以上或者5次以下即可拒絕假設;50次時,32次以上或者18次以下即可拒絕假設;100次時,60次以上或者40次以下即可拒絕假設;1000次時,531次以上或者469次以下即可拒絕假設;從上面的數(shù)據(jù)可以看出,隨機抽樣的樣本數(shù)越大,偏離均值的難度越高,也越容易做假設檢驗,比如扔一個硬幣10次,即使8次朝上仍無法拒絕硬幣是標準硬幣這一假設,但是,扔100次,只需60次就可以拒絕了。小結:假設檢驗的基本原理:如果假設A成立,那么事件B發(fā)生的概率低于5%(當然也可以用10%或者1%等標準)。實際隨機抽樣檢測中B發(fā)生了,我們可以在0.05的顯著性下認為假設A不成立。在實際應用中我們要注意的是,第一,樣本書越大,越容易驗證條件A是否成立;第二,觀察事件B是否發(fā)生時,一定是要隨機抽樣的。比如上面那個硬幣的例子,如果不是隨機拋硬幣,而是由一個硬幣拋擲高手來有認為控制硬幣拋擲后的結果,那么得出來的結論對于硬幣是否標準這一假設是沒有參加價值的。為什么很多歷史數(shù)據(jù)中表現(xiàn)很好的交易系統(tǒng)在后期的實盤時效果很差,很大一個原因就在于針對歷史數(shù)據(jù)所設計的交易系統(tǒng)不符合抽樣隨機性。交易應用示例:寫了這么多,還沒有寫到交易上,可能有些朋友急了。稍安勿躁,有了上面的基礎,再來談交易模型的假設檢測,就很容易了。先看一種最簡單的交易模型,就是止盈和止損是同樣比例的模型。比如西蒙斯曾經(jīng)談到過八十年代他們曾經(jīng)靠一個很簡單的模型賺過很多錢,就是跳空高開(或低開)后短時間內(nèi)價格反向運動的概率很高,他們的交易策略就是高開后做空,低開后做多,F(xiàn)在我們來根據(jù)這個思路嘗試做一個交易模型:跳空高開(或低開)x%后開盤入場做空(或做多),盈利或者虧損y%后就出場。為了便于討論,我們先假設不存在滑點、手續(xù)費等問題,同時假設當天價格日內(nèi)離開盤價的波動幅度必然會超過y%,也就說日內(nèi)該筆交易一定會結束,要么是盈利y%后出場,要么是虧損y%后出場。這么簡化后,大家再拿這個和拋硬幣的例子對比,是不是完全一樣了,F(xiàn)在來運用假設檢驗的方法來驗證這個模型。如果這個交易模型是無效的,那么交易盈利或者虧損y%的概率應該是各50%(如果虧損大于50%可以反向做的),和硬幣的例子中兩種結果的概率完全一樣。現(xiàn)在我們拿檢驗硬幣的思路來檢驗這個模型到底是不是無效的。我們拿這個交易模型去歷史數(shù)據(jù)中測試,假如總共有50次交易記錄,其中盈利的次數(shù)達到了32次以上或者18次以下(這樣情況就把模型反著寫,即高開后做多低開后做空),那么,在5%的顯著性下我們可以拒絕模型無效這一假設,這個交易模型是有效的。有的朋友可能會問了,這個模型中的x和y這兩個參數(shù)到底取什么值呢?這就涉及到模型訓練的問題了。x和y具體取什么值最合適,不通過數(shù)據(jù)測試,我們是無法知道的。通用的統(tǒng)計學方法(通訊、搜索引擎等領域也是這個方法)是,選取大量的訓練數(shù)據(jù),對模型各個參數(shù)進行測試,選擇表現(xiàn)最佳的參數(shù)。具體到交易上,就是選取足夠多的歷史數(shù)據(jù),進行參數(shù)優(yōu)化,綜合考慮收益率、最大回撤、穩(wěn)定性等因素,選擇相對最合適的。不同參數(shù)之間的好壞差異的比較在統(tǒng)計學上也是有方法的,相對復雜一點,以后有機會再寫一篇詳談這個。既然是模型訓練后的最佳參數(shù),問題也就來了,這個最佳參數(shù)是非隨機產(chǎn)生的,而是人為訓練選擇的,這違背了我們在做硬幣檢測時所強調(diào)的隨機抽樣。那么,如何驗證這個模型的有效性呢?統(tǒng)計學的方法是拿這個模型對新的數(shù)據(jù)(與原有訓練數(shù)據(jù)完全獨立)做測試,如果測試的結果仍然拒絕模型無效這一假設,那么,我們可以認為模型在很大的概率上是有效的。具體到交易而言,就是把歷史數(shù)據(jù)分為訓練數(shù)據(jù)和盲測數(shù)據(jù)兩部分,訓練數(shù)據(jù)用于模型訓練,如果在訓練數(shù)據(jù)上訓練好的拒絕無效假設的交易模型在盲測數(shù)據(jù)中仍然表現(xiàn)為拒絕無效假設,那么,可以認為模型在很大的概率上有效。當然,還有進一步更嚴格的方式是,讓模型繼續(xù)在未來的新的數(shù)據(jù)上測試,如果表現(xiàn)仍然很好,則再可以考慮分配一定比例的資金開始實際運作。我們在做程序化交易中經(jīng)常談到模型的衰敗。那么,用什么標準來判斷模型的衰敗呢?我的個人思路是:繼續(xù)用假設檢驗這個方法來檢驗。就是如果你在不斷的交易過程中你的后期的一系列交易數(shù)據(jù)已經(jīng)無法拒絕交易模型無效這一假設了,那么,這個時候即便你的交易模型仍然還是盈利的,你也要小心了,至少應該降低倉位了。這個高低開的日內(nèi)交易模型是很簡單的一種模型了,止盈止損都是一個額度,50%對半開的隨機假設,這個直接套用硬幣的例子就可以。還有更復雜一點的,比如趨勢交易模型,這種模型由于其趨勢交易追求高盈虧比的理念,這種模型的勝率是低于50%的,一般在35%左右,但是盈虧比可能高于3:1。這種模型就不同于硬幣的例子了,無法直接套用硬幣的計算結果,但是思路是一致的,有興趣的朋友可以自己思考一下這種情況下應該如何計算。注意事項:1.不可忘記或者因為某些利益因素故意忘記抽樣統(tǒng)計中的隨機原則。概率法則有效的前提是隨機抽樣。如果人為影響樣本的抽取過程甚至制造假的樣本,則樣本對于總體的預測價值是0甚至是相反的。在做模型測試時,務必至少要有訓練數(shù)據(jù)和盲測數(shù)據(jù),在訓練數(shù)據(jù)上表現(xiàn)優(yōu)異的模型必須在盲測數(shù)據(jù)上也能足夠優(yōu)秀到可以拒絕模型無效的假設,才可以考慮將模型運用到實戰(zhàn)中。網(wǎng)上有不少賣模型的人,給出的模型在歷史數(shù)據(jù)上的交易曲線幾乎是一條無回撤的上漲直線,但是,一旦實盤交易,就開始大幅度回撤,很大的可能就是在于這個模型針對歷史數(shù)據(jù)做了非隨機性的定向優(yōu)化,同時因為利益的關系模型開發(fā)者故意沒有做盲測這一個過程。2.牢記假設檢驗的原則,寧可錯過,不可做錯。任何一個模型,在沒有足夠的數(shù)據(jù)證明這個模型是有效前,均假設該模型為無效的。這就是量化交易的痛苦的地方,量化交易者最容易出現(xiàn)的情況是,花了很多時間,在訓練數(shù)據(jù)上挖掘出了一系列的可以拒絕無效假設的交易模型,跑到盲測數(shù)據(jù)上一一測試,均無法在0.05的顯著性水平上拒絕模型無效的檢驗,心拔涼拔涼的,感覺這么多時間的付出浪費了,心有不甘。再怎么心有不甘,也不能自欺欺人的把沒有拒絕無效假設的模型上線,心有不甘總比虧錢好。3.要有風險意識。即便是在0.05的顯著性水平下在訓練數(shù)據(jù)、盲測數(shù)據(jù)甚至是新的實盤交易數(shù)據(jù)上全部拒絕無效假設,也不代表這個模型一定是永遠有效的。一方面,這是由于這種將低概率事件近視為“不可能事件”的假設檢驗方式?jīng)Q定的。另一方面,也是很重要的一方面,就是可能隨著時間的變遷,市場本質(zhì)特征發(fā)生變化了,你這個模型背后所體現(xiàn)的那個影響市場的因素發(fā)生變化了。說到模型背后所體現(xiàn)的因素,我展開多說一點。近幾日和小魚在微博上討論了概率是否在金融市場上可以運用和市場是否可以預測的問題。否認市場可以預測的一個很有力的論據(jù)就是影響市場走勢的因素千千萬,交易者根本無法一一識別這些因素,更加難以識別這些因素中每個因素的權重影響,故無法預測。那么,有沒有可能存在這樣一種情況,就是我無法直接知道是哪些因素影響了市場,但是我可以間接的通過一種方式預測市場會以什么樣的概率運動。我先說統(tǒng)計學上一個有趣的例子。在美國的中西部的一個小鎮(zhèn)上,人們發(fā)現(xiàn)一個很有趣的不合邏輯的現(xiàn)象,就是冰激淋的消費量越高,犯罪率越高。這個具體的兩個變量間的線性相關程度統(tǒng)計學里面是有專門的公式的。總之,就是經(jīng)過統(tǒng)計發(fā)現(xiàn),犯罪率的高低與冰激淋的消費量存在強的正相關,即冰激淋銷量高時犯罪率高,冰激淋銷量低時犯罪率低,F(xiàn)在兩個問題:1.冰激淋銷量是否可以預測犯罪率;2.如果人為控制改變冰激淋銷量,是否可以改變犯罪率。對于第2個問題,我想任何一個有生活常識的人都會知道,犯罪率與冰激淋銷量完全無關,人為改變冰激淋銷量并不能改變犯罪率。對于第1個問題,就會比較困惑了。因為常識告訴我們,冰激淋與犯罪無關,但是統(tǒng)計學的數(shù)據(jù)又表明二者是正相關,那么到底是什么原因呢?慢慢的,人們終于想到了天氣這一共同因素。冰激淋的銷量與天氣緊密相關,天氣越熱銷量越高,同時,天氣越熱,人越容易在室外活動,越容易開窗(導致偷盜概率增加),女性越容易穿著暴露(導致性犯罪增加),人的心情也越煩躁(導致沖動型犯罪增加)。于是,我們知道了,因為天氣這一共同因素,只要沒有人為的刻意影響冰激淋的消費量,冰激凌的消費量是可以預測犯罪率的。其實,只要我們沒有人為的刻意影響冰激淋的消費量,即使我們不知道是因為天氣這一共同因素,我們也可以用冰激淋銷量來預測犯罪率。現(xiàn)在說回到交易。假如,有這樣一個量化模型,無論是在訓練數(shù)據(jù)上還是盲測數(shù)據(jù)上還是在新的實盤交易數(shù)據(jù)上,均可以在0.05的顯著下拒絕模型無效的假設,那么,我們有必要認為,在95以上的概率上,這個量化模型背后存在一種共同的影響因子能夠較大的影響市場的短期走勢,盡管,這個影響因子到底是什么我們不知道,但只要這個因子在,這個量化模型就仍然有效。因為我們不知道這個因子是什么,所以我們更加不可能直接的發(fā)現(xiàn)這個因子是否已經(jīng)變化了,我們?nèi)匀恢荒芡ㄟ^這個量化模型的之后的表現(xiàn)來間接預測。如果量化模型一直在0.05的顯著下拒絕無效的假設,那么可以認為這個因子仍然存在,如果無法拒絕了,則可以認為這個因子可能消失了或者至少沒以前那么重要了通過上段分析,可以看出時間對于模型有效性的重要性。我想這也是高頻交易開始流行一個很重要的原因。因為高頻交易的模型,訓練和盲測所需要的時間周期很短,那么模型背后的那個影響因素仍然存在的概率很高,而低頻交易,訓練和盲測所需要的時間可能需要半年甚至更長時間,很可能那個影響因素已經(jīng)變化了。不知不覺,寫了這么多了,回頭看,盡管為了這篇文章做了幾天的準備,以至于這幾天夢里都是概率的事,仍然寫的非;靵y,有看不明白的朋友請留言我會一一解釋。我本人并不是數(shù)學專業(yè)的,對于概率也僅僅是個人的片面理解,概率如何應用到金融交易中,目前市面上的書幾乎沒有,我是一本都沒有找到,以上所寫全部為個人的一次嘗試,肯定有不少錯誤的地方,歡迎大家猛拍。
http://www.hfbhhr.com/company/company-show.php?id=233
http://job.qilindao.com/company/company-show.php?id=4118
http://www.jsjpb.com/e/space/UserInfo.php?userid=3756
https://www.cowscafe.com/?dwqa-question=海安縣股票配資 判斷市場多空
http://www.tlrcw.net.cn/company/company-show.php?id=8548
http://www.msyrc.com/company/company-show.php?id=6223
http://www.hzwxqhr.com/company/company-show.php?id=35419
http://www.0573ol.com/company/company-show.php?id=4137 [收起]
財富中心99號

服務熱線
400-0473-006