用頻數分佈匯總數據(2)

2013-10-19 19:11:54

  正如上述步驟所明確表述的,一個頻數分佈將數據歸入到一系列區間之中。(區間有時也被稱為組別(classes)、範圍(ranges)或者箱體(bins)。)一個區間(interval)是指一對數值,在這對數值的範圍之内會包含落入其中的觀測值。每個觀測值只會落入一個區間之中,並且整個區間應該包含數據中所有觀測值。實際落入一個給定區間的觀測值數量被稱為絕對頻數(absolutefrequency),或者簡稱為頻數。頻數分佈是反映一組區間以及各個區間相對應的頻數度量指標的一個列表。

  為了說明操作的基本步驟,假設我們有12個觀測值,以升序排列為:-4.57,-4.04,-1.64,0.28,1.34,2.35,2.38,4.28,4.42,4.68,7.16和11.43。最小的觀測值為-4.57,而最大的觀測值為+11.43,因此,極差為+11.43-(-4.57)=16。如果我們設定k=4,那麼區間寬度為16/4=4。

  因此,所得到的區間分別為[-4.57,-0.57),[-0.57,3.43),[3.43,7.43)和[7.43,11.43)。([-4.57,-0.57)的記法是指-4.57≤觀測值<-0.57。在文中,方括号表示该端点包含在区间内。)

  在實務中,我們可能想要將上述的基本步驟加以簡化。例如,我們可能為了解釋方便,想讓區間以整數開始與結束。另外,我們也需要對區間數k的選擇予以解釋。我們將在對於標準普爾500數據建立頻數分佈的過程中,對於這些問題進行讨論。

  註:這裡的區間之間不會相互重疊,所以每個觀測值只能唯一地落入其中的某一區間之中。

  我們首先讨論如何對1926~2002年區間段的標準普爾500年收益率建立頻數分佈。在這個區間中,標準普爾500收益率的最小值為-43.34%(在1931年),最大值為+51.99%(在1933年)。因此,該數據的極差近似為+54%-(-43%)=97%。現在的問題是我們用來歸類觀測值的區間數k應該選擇多少。雖然在統計學的文獻中有一些對於k選擇的建議,但是設置一個有用的k值經常涉及對於數據仔細的觀察與審慎的判斷。那麼我們應該要包含多少具體細節呢?如果我們使用過少的區間,那麼我們將匯總得過於粗略,從而失去數據相關的特徵。而如果我們使用過多的區間,那麼我們可能根本就沒有起到匯總的效果。

  我們可以通過比較劃分不同區間寬度所產生的效果,來選擇一個適當的k值。大量的空白區間可能意味著我們過分想要將數據進行分類,以至於反映了過多的細節。我們可以從一個相對較小的區間寬度開始著手,來觀察它是否使得大部分區間是空白的,以及判斷與區間寬度相關的k值是否取得過大。如果區間大部分都是空白的或者k值非常大,那麼我們可以考慮逐步增大區間寬度(減小k值),直至產生一個能有效匯總數據分佈的頻數分佈。對於標準普爾500年度序列來說,1%的收益率區間寬度將形成97個區間,並且其中很多區間是空白的,因為我們只有77個年度觀測值。我們需要記住建立頻數分佈的目的在於匯總數據。假如為了解釋簡單,我們想要使用以整數而不是分數百分比表述的區間寬度。一個2%的區間寬度可能會比1%的區間寬度擁有更少的空白區間,並且能更有效地匯總數據。一個2%的區間寬度將會有97/2=48.5個區間,我們可以將其四舍五入成49個區間。總區間的寬度將為2%×49=98%。我們可以肯定,如果我們從最小的整數-44%開始,不斷增加2%的區間,最終區間的端點將位於-44.0%+98%=54%,該區間就包含了樣本中最大的收益率53.99%。在通過這種方式建立該頻數分佈過程中,我們也得到以數值0%結束和以0%開始的兩個區間,這樣就使得我們可以計算數據中負的和正的收益率的數量。不需要太多的工作量,我們就找到了匯總數據的有效方法。我們將使用2%的區間,從-44%≤Rt<-42%开始(在表中给出的是"-44.0%到-42.0%")一直到52%≤Rt≤54%结束。

  註:每個區間的下限取的是不嚴格不等號(≤),而每個區間的上限取的是嚴格不等號(<)。

  資料來源:由伊博森協會EnCorrAnalyzec產生的頻數分佈。

  相對頻數的定義。相對頻數(relativefrequency)是指每個區間的絕對頻數除以整個樣本觀測值的數量。

本文摘自《定量投資分析》


   作為CFA協會投資學系列叢書中的一本,無論是關註金融的學生,還是從事投?的業界人士,《定量投資分析》(原書第2版)適合每一位對該領域有興趣的讀者。本書所介紹的全球通用的準則將幫助你理解定量投資方法,並將這些方法應用到當今的投資過程中。

 承諾與聲明

兄弟財經是全球歷史最悠久,信譽最好的外匯返佣代理。多年來兄弟財經兢兢業業,穩定發展,獲得了全球各地投資者的青睞與信任。歷經十餘年的積澱,打造了我們在業内良好的品牌信譽。

本文所含内容及觀點僅為一般信息,並無任何意圖被視為買賣任何貨幣或差價合約的建議或請求。文中所含内容及觀點均可能在不被通知的情況下更改。本文並未考 慮任何特定用戶的特定投資目標、財務狀況和需求。任何引用歷史價格波動或價位水平的信息均基於我們的分析,並不表示或證明此類波動或價位水平有可能在未來 重新發生。本文所載信息之來源雖被認為可靠,但作者不保證它的準確性和完整性,同時作者也不對任何可能因參考本文内容及觀點而產生的任何直接或間接的損失承擔責任。

外匯和其他產品保證金交易存在高風險,不適合所有投資者。虧損可能超出您的賬戶註資。增大槓桿意味著增加風險。在決定交易外匯之前,您需仔細考慮您的財務目標、經驗水平和風險承受能力。文中所含任何意見、新聞、研究、分析、報價或其他信息等都僅 作與本文所含主題相關的一般類信息.

同時, 兄弟財經不提供任何投資、法律或稅務的建議。您需向合適的顧問徵詢所有關於投資、法律或稅務方面的事宜。