統計學的基本概念
一萬年太長,只爭朝夕
概率論主要研究隨機變量的方法論和理論模型,統計學利用概率論研究隨機現象(結果的不確定性)。研究這些隨機現象最重要的方法是通過大量的重復試驗找到統計規律。一般步驟是:統計中樣本的概念
重復試驗,記錄試驗結果,然后整理、分析和建模試驗數據,最終預測和指導隨機現象的一些規律。本部分簡要總結了統計學中的一些基本概念。
1.1概率論與數理統計的異同
概率論和數理統計都是研究隨機現象的統計規律學科,但研究角度不同。
概率論:統計中樣本的概念
研究隨機變量X數學特征、分布性質等。
數學統計:統計中樣本的概念
研究對象X未知的分布需要通過分析樣本數據來確定X服從什么分布來推斷對象的整體規律。數學統計研究主要是通過推斷樣本信息的整體信息來完成的。
1.2總體與樣本
顧名思義,整體是研究或調查對象的整體,整體中的每個成員都被稱為個人。整體中包含的個人數量稱為整體容量。在實踐中,人們通常只關注一個(或幾個)指標的整體,可以用一個或多個隨機變量來表示它們。根據整體中包含的個分為有限的整體和無限的整體。
在實際應用中,為了研究整體特征,總是從整體中提取一些個體進行觀察和測試,并根據觀察或測試獲得的數據推斷整體性質。從整體中提取的一些個體稱為樣本。樣本中包含的個人數量稱為樣本容量。觀察或測試樣本的過程稱為抽樣。從觀察或測試中獲得的數據稱為樣本觀測值(樣本值)。通常,容量是n樣本用隨機變量表示。
例如,假設學校所有男孩的身高都是隨機變量X,為了研究X通過某種方式從學校的所有男生中找到100名,這100名男生是整體樣本。
簡單隨機樣本本:如果樣本是完全隨機的,相互獨立和整體的X具有相同分布的樣本來自整體X簡單隨機樣本。簡單隨機樣本的抽樣稱為簡單隨機抽樣。
1.3統計量
樣本中存在統計量的概念。統計量包含樣本的所有信息。只要確定樣本,就可以直接計算統計值。常用的統計量如下。
樣本均值;
樣本方差;
樣品標準差;
樣本k階原點矩;
樣本k階中心矩。
樣本平均值等于樣本的一階原點矩。
統計分布稱為抽樣分布。X服從一般分布(如指數分布、均勻分布等。),統計分布比較困難,但當整體分布時X服從正態分布時,可以計算統計量,服從一定的分布。本部分將介紹三種統計抽樣分布-分布、分布和分布。我們常說的測試、測試和測試與這三種分布有關。
2.1分位數的概念
分位數是指將隨機變量的概率分布范圍分為幾個等級的值點,以分析數據變量的趨勢。分位數是在特定分布的概率密度函數曲線下的面積。常用的有中位數、四分位數、百分位數等。
假設連續隨機變量的分布函數為,滿足條件的稱為或分布的四分位數。也就是說,對于概率密度函數,四分位點是將概率密度曲線下的面積分為四個部分。
上分位數:該值沿概率密度函數曲線下的面積x軸分為概率密度函數曲線和兩部分x軸圍成的面積等于。
對于概率密度函數曲線,其下面的區域是概率,因此上分位數不僅是該點右側區域的區域,而且是在該分位數中獲得所有大于該點的值的概率。在上圖中,公式中和確定了兩個值中的一個和另一個。
2.2分布
(1)定義:如果一個相互獨立的隨機變量服從標準正態分布(獨立分布在標準正態分布中),那么這個服從標準正態分布的隨機變量的平方,構成一個新的隨機變量,其分布規律稱為分布,自由度為,記錄。
注:自由度是指獨立隨機變量的數量。
(2)性質:
設置,然后,分布的可加性:設置,相互獨立,然后。這種性質可以推廣到一個有限的隨機變量。當它很大時,自由分布類似于正態分布。Python實現代碼如下。
卡方分布對比不同參數,代碼如下。
(3)上分位數的計算:按照上分位數定義,如果要計算的值,只需要計算即可。函數有兩個參數,第一個是的值,第二個是。另一種計算方式是函數,該函數在值較小的情況下(的值在圖像中比較靠右時),計算結果比函數更精確。代碼示例:
函數也可以根據上分位數值計算對應值:
這里的值相當于假設檢驗中的值。
2.3分布
定義:服從標準正態分布,服從自由分布,相互獨立,稱為變量服從自由分布,記錄。
特點:以0為中心,左右對稱單峰分布;分布是一簇曲線,其形態變化與自由度有關。自由度越小,分布曲線越低;自由度越大,分布曲線越接近標準正態分布曲線。當自由度無限大時,分布變成正態分布,如圖所示:
性質:設,則
當時,期望并不存在;
當時方差不存在。
分布的Python實現代碼如下。
2.4分布
定義:設服從自由度為的分布,服從自由度為的分布,且、相互獨立,則稱變量所服從的分布為分布,其中第一自由度為,第二自由度為。
特點:一般來說,分布是右偏分布,但當自由度接近無限時,分布會接近正常分布。
,否則期望就不存在了。
,否則方差不存在。
,也就是說,分布的倒數也是分布(參數交換)。在99872086個原始統計中找到樣本的概念設計圖片,包括概念圖片、材料、海報、證書背景和源文件PSD、PNG、JPG、AI、CDR等格式素材!
畢業證樣本網創作《統計中樣本的概念(統計學的基本概念)》發布不易,請尊重! 轉轉請注明出處:http://www.fangrui88.com.cn/180910.html