ap統計學知識點
AP統計學考試知識點一、描述統計
* 數據(data)分為定性數據(qualitative or categorical data)與定量數據(quantitativedate)。
定性數據:按照類別進行劃分,展示對象的屬性;
定量數據:展示對象的數值特征。
* 圖(graph):分為bar chart, pie chart, dotplot, stemplot, histogram, boxplot
* 通過圖形可以看出數據的分布特征:
(1)對稱(symmetric)
(2)偏態(skewed)
左偏(skewed to the left)
右偏(skewed to the right)
(3)集中趨勢
(4)異常值
* histogram的畫法:
(1)以個數作為高度
(2)以百分比作為高度
(3)以百分比作為面積。
* 概率密度(probability density function, pdf)
描繪以百分比作為面積的histogram的曲線。
* 累積分布(cumulative distribution function, cdf)
以小于等于該數的數據所占百分比作為該數的縱坐標繪制出的曲線。
* 數字特征(numerical value)
(1)描述集中趨勢
(2)描述離散趨勢
(3)描述位置
(4)標準化變量(z-score)
* 眾數(mode)
一組數據中出現次數最多的數;
* 平均數(mean)
數據求和后除以數據個數。
* 方差(variance)與標準差(standard deviation)
衡量數據與平均值偏離程度平方和的平均值。
* 標準化變量(z-score)
計算方式是將原始數據減去平均數之后再除以標準差,用它可以展示不同度量單位數據的偏離程度。
* 散點圖(scatterplot)
以一個變量作為橫坐標、另一個變量作為縱坐標繪制出的圖形,以散點的形式表現在坐標軸中。變量選用單位不同,會造成圖形有差異。
* 相關系數(linear correlation coefficient)
衡量兩個量之間線性關系的指標,介于-1和1之間,負數代表兩個變量之間是反向變化的,正數代表兩個變量之間是同向變化的,越靠近0代表線性關系越弱,越靠近-1和1代表線性關系越強。它只能衡量線性關系,不能衡量非線性關系;只反應關系,不代表因果。
* 回歸(regression)
尋找代表變量之間關系的數學表達式。
* 線性回歸
假定變量之間存在一次函數的關系(形如y=kx+b)。此函數在坐標系中圖像是一條直線,因此稱作線性回歸。
* 殘差(residual)
真實值與估計值之間的差。
* 殘差圖(residual plot)
以一個變量作為橫坐標、該變量所對應的殘差為縱坐標繪制出的圖形。若兩變量之間存在線性關系,則殘差圖應為無規則的散點。
* 最小二乘法(least square)
利用殘差平方和最小求出直線斜率與截距(k和b)的方法。
* 線性化(linearity)
將非線性關系轉換為線性關系的方法,常用有對數變換、指數變換等。
AP統計學考試知識點二、抽樣方法
* 總體(population):
研究對象的全體。
* 樣本(sample):
總體中的一部分。
* 參數(parameter):
描述總體特征的指標,一般用希臘字母表示。
* 統計量(statistics):
描述樣本特征的指標,一般用拉丁字母表示。
* 普查(census):
對總體中的每一個個體都進行研究。
* 抽樣(sample):
對總體中的部分個體進行研究。
* 實驗法(experiment):
對目標群體進行干預而得到數據。