了解整體和樣本
大家好,我是老喬。這是超智星球的《超智星球》·統計系列課程。
統計學分主要分為描述統計和推理統計。
在前面的十幾篇文章中,我們總體上講述了統計的全部內容:統計中什么是整體和樣本?
本文一章中,我們將開始學習推理統計。本文2717字,預計需要7分鐘。
在學習之前,讓我們回顧一下這個系列的開頭。在《超級智能星球》統計系列開頭的第一篇文章中,我們談到了統計研究的不確定性。
從另一個角度來看,不確定性是一個概率問題。從研究概率問題的角度來看,概率論與統計學密切相關。
兩者都是研究隨機現象數量規律的學科。兩者的區別可以用一張圖片來形象地反映:統計學中什么是整體和樣本?
也就是說,概率論是——我知道盒子里是什么樣的,我想知道我手里的球有多可能。統計學是——我不知道盒子里是什么樣的,但我已經知道我手里的球是什么樣的,我想推斷盒子是什么樣的。
在這里,桶里的球可以稱為整體。手中的球可以稱為樣本(樣本量為1)。
總體(population)它是指許多個別單位在同一性質的基礎上客觀存在的整體。它通常由研究過的個體組成。
*每個企業都是由多個企業組成的個體;
*一般來說,由多戶組成的每戶都是個體;
*一般來說,每個人都是由多個人組成的個體。
要確定整體和個體,必須注意兩個方面:
1.構成總體的個體必須是同質的,不能把不同質的個體混在總體之中。
例如,研究工人的工資水平,只能將工資收入的工人納入總體統計范圍。同時,只能調查員工的工資收入,排除員工從其他方面獲得的收入,正確反映員工的工資水平。
2.隨著研究任務的變化,總體上與個體相對。
同一個人可以是一個整體,也可以是一個整體單位。例如,為了了解全國工業企業員工的工資收入,所有工廠都是一個整體,每個工廠都是一個個體。如果目的是了解企業員工的工資收入,企業將成為一個整體,每個員工的工資都是個體。
明確上述基本概念后,將其聯系起來觀察,對整體有深入的了解??梢钥闯?,統計總體具有三個主要特點:同質性、大量性和差異性。
1.同質性:同質性是指一般單位必須具有一定的共同屬性或標志值。例如,國有企業的共同標志屬性屬于國家。同質性是整體的基本特征。只有個體單位是同質的,統計才能通過觀察和研究個體特征來總結和揭示整體的綜合特征和規律。
2.大量性:大量性是指有足夠數量的整體單位。一般來說,它是由許多個體在相同性質的基礎上組合起來的。個人或少數單位不能形成一個整體。整體的大量性可以影響個別單位的一些偶然因素——數量的高低差異——相互抵消,從而顯示整體的本質和規律性。
3.差異:差異是指各單位之間的一個或多個可變質量標志或數量標志的整體差異。例如,在某一領域的員工中,各單位之間存在男女性別屬性差異,包括20歲、21歲、22歲、23歲、24歲、25歲和26歲。
樣本(sample)它是從整體中提取的一部分元素的集合本的元素數稱為樣本量(samplesize),也稱為樣本大小或樣本水平。在數學上,樣本是一個整體的子集。
例如,為了了解某個地區10~15該地區隨機選擇3000名血鈣水平的兒童10~15并進行血鈣檢測的兒童:
*一般屬于該地區10~15兒童血鈣檢測值
*樣本為3000名兒童的血鈣檢測值
*樣本量/樣本大小/樣本水平為3000例
樣本從整體中提取,作為整體代表,由一些單位組成。抽樣樣本應注意以下問題:
1.樣本單位必須取自總體
2.一個樣本一取多個樣本
3.確保樣品的客觀性和代表性
選擇樣品的過程稱為抽樣,其基本要求是確保提取的樣品單位對所有樣品都具有充分的代表性。抽樣方法也因物體不同而不同。我們稍后將討論抽樣方法和大小。
抽樣的目的是根據樣本提供的信息推斷整體特征。例如,從一批燈泡中隨機抽取100個,構成樣本,然后根據100個燈泡的平均使用壽命推斷這些燈泡的平均使用壽命。
當我們研究一個問題時,一般來說,如何全面收集數據的特征是全面調查,獲得全面的統計數據,所以使用描述統計方法是理解總體目的。
如果整體數據非常大,進行如此全面的調查所需的人力、物力和財力時間是不經濟和不現實的。此時,可以抽樣統計。獲得樣本信息的方法是從樣本中推斷整體,這是推斷統計需要解決的問題。
兩部分的核心區別在于我們觀察到的樣本是否等于整體。
樣本=總的來說,描述統計可以用來描述我們研究的現象。
樣本≠總的來說,使用推斷統計可以更準確地描述我們所研究的現象。
推斷統計也應收集數據,并進行必要的處理方法。描述統計方法是整個統計學的基礎。這兩個分支結構經常交叉使用,而不是絕對孤立的。逐步發展相互統一的關系。
事實上,近年來,由于技術(傳感器等)的發展,熱門大數據足以獲足以獲得由數據驅動的于所有樣本的數據,而不是由以前的樣本數據引起的變化,即由數據驅動的變化。
如果你看到了這里,那我真的是很開心了。如果您覺得本文有所收獲。
請幫忙轉發,讓更多的人看到這篇文章,讓我收到更多的反饋;還要關注,一起學習人工智能和統計,Python、R。
本章從統計與概率論的區別出發,介紹了兩個基本概念:總體概念和樣本,并進一步介紹了描述統計與推理統計的區別。
1.張湘平、張金槐、謝紅衛.樣本容量、驗前信息和Bayes討論決策風險[J].2003年31(4)電子學報:536-538.
2.[美]科時.抽樣調查.北京:中國統計出版社,1997:25
3.儲全滋.抽樣方法.三民書局,1993.
4.2009年,中國人民大學畢業證出版社賈俊平、何曉群、金勇統計學(第四版):7
5.王梓坤.概率論基礎及其應用[M].北京師范大學畢業證出版社,2007.
6.吳楊陳兆榮.統計學.合肥:2013年安徽大學文憑出版社:13
7.佚名.總體與樣本[J].2017(19)檢驗醫學與臨床:2093-2093.在76600138個原始統計學中找到什么是總體和樣本設計圖片,包括統計學中什么是總體和樣本圖片、材料、海報、證書背景源文件PSD、PNG、JPG、AI、CDR等格式素材!
畢業證樣本網創作《統計學中的總體和樣本是什么(推理統計學:理解總體和樣本)》發布不易,請尊重! 轉轉請注明出處:http://www.fangrui88.com.cn/176858.html