變量間的相關關系教學設計
《變量間的相關關系》教學設計
3、知道最小二乘法思想,了解其公式的推導。會求回歸方程,相關系數。
[教學 實 踐情況]:
一、 問題引出:請同學們如實填寫下表(在空格中打“√” )
好 | 中 | 差 | |
你的數學成績 | |||
你的物理成績 |
然后回答如下問題:①“你的數學成績對你的物理成績有無影響?”②“ 如果你的數學成績好,那么你 的物理成績也不會太差,如果你的數學成績差,那么你的物理成績也不會太好。”對你來說,是這樣嗎?同意這種說法的同學請舉手。
根據同學們回答的結果,讓學生討論:我們可以發現自己的數學成績和物理成績存在某種關系。(似乎就是數學好的,物理也好; 數學差的,物理也差,但又不全對。)教師總結如下:
物理成績和數學成績是兩個變量,從經驗看,由于物理學習要用到比較多的數學知識和數學方法。數學成績的高低對物理成績的高低是有一定影響的。但決非唯一因素,還有其它因素,如圖所示(幻燈片給出):
因此,不能通過一個人的數學成績是多少就準確地斷定他的物理成績能達到多少。但這兩個變量是有一定關系的,它們之間是一種不確定性的關系。如何通過數學成績的結果對物理成績 進行合理估計有非常重要的現實意義。
二、 引出相關關系的概念
教師提問:“像剛才這種情況在現實生活中是否還有?”
學生甲:糧食產量與施肥用量的關系;
學生乙:人的體重與食肉數量的關系。
……
從而得出:兩個變量之間的關系可能是確定的關系(如:函數關系),或非確定性關系。當自變量取值一定時,因變量也確定,則為確定關系;當自變量取值一定時,因變量帶有隨機性,這種變量之間的關系稱為相關關系。相關關系是一種非確定性關系。
三、探究線性相關關系和其他相關關系
問題:在一次對人體脂肪和年齡關系的研究中,研究人員獲得了一組樣本數據:
人體的脂肪百分比和年齡
針對于上述數據所提供的信息,你認為人體的脂肪含量與年齡之間有怎樣的關系?教師特別向學生 強調在研究兩個變量之間是否存在某種關系時,必須從散點圖入手(向學生介紹什么是散點圖)。并且引導學生從散點圖上可以得出如下規律:
1、如果所有的樣本點都落在某一函數曲線上,那么變量之間具有函數關系(確定性關系);
2、如果所有的樣本點都落在某一函數曲線的附近,那么變量之間具有相關關系(不確定性關系);
3、如果所有的樣本點都落在某一直線附近,那么變量之間具有線性相關關系(不確定性關系)。
引導學生觀察作出的散點圖,體會現實生活中兩個變量之間的關系存在著不確定性。散點圖中的散點并不在一條直線上,只是分布在一條直線的周圍,即為線性相關關系。
注:“回歸”這個詞是有英國著名的統計學家 Francils Galton 提出來的。1889年,他在研究祖先與后代身高之間的關系時發現,身材較高的父母,他們的孩子也較高,但這些孩子的平均身高并沒有他們的父母平均身高高;身材較矮的父母,他們的孩子也較矮,但這些孩子的平均身高卻比他們的父母平均身高高。Galton 把這種后代的身高向中間值靠近的趨勢稱為“回歸現象”。后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱為“回歸方法”。
那么如何求回歸直線方程呢?人們在思考這個問題的時候,常用以下3種方法:
1、采用測量的方法,先畫一條直線,測量出各點到它的距離,然后移動直線,到達一個使距離之和最小的位置,測量出此時直線的斜率和截距,就得到回歸方程。
2、在圖中選取兩點畫直線,使得直線兩側的點的個數基本相同。
3、在散點圖中多取幾個點,確定幾條直線的方程,分別求出各條直線的斜率和截距的平均數,將這兩個平均數作為回歸方程的斜率和截距。
上面的這些方法雖然有一定的道理,但總讓人感覺到可靠性不強。統計學中,科學家們經過研究后于是得出了如下方法:求回歸方程的關鍵是如何用數學的方法來刻畫“從整體上看各點與此直線的距離和最小”。現在,我們來看一下數學家解決這個問題的思維過程吧。
設已經得到具有線性相關關系的一組數據: ,所要求的回歸直線方程為: ,其中, 是待定的系數。當變量 取 時,可以得到 。求 的最小值,其步驟為:
四、相關系數及其含義
從圖象和回歸方程可知:人的脂肪含量與人的年齡是正相關關系,那么人的年齡多大程度上決定人體的脂肪含量?這就是相關強弱的問題。如何解決這一問題,統計學家們引進相關系數這一概念,用相關系數 來衡量兩個變量之間的線性關系的強弱。若相應于變量 的取值 ,變量 的觀測值為 ,
則兩個變量的相關系數的計算公式為:
相關關系的強弱給出具體的判斷標準:首先 的符號決定正、負相關關系;當 時,相關關系很強;當 時,相關關系一般;此外,相關關系很弱或者幾乎不能用線性相關來描述。通過計算,我們得到探究問題中的 ,所以我們說人的脂肪含量與人的年齡正相關關系很強。
最后,我們得到問題的主要結論:
1、 人體的脂肪與年齡之間是線性相關關系,而且正相關關系很強( )。
2、這種相關關系可以用回歸方程: 來刻畫。
3、人在62、63、64歲時,人體的脂肪含量百分比大約為:35.26、35.84、36.42。
六、求直線回歸方程,相關系數和作圖,這些EXCEL 可以方便地做到。仍以上題的數據為例。于 EXCEL表 中的空白區,選用"插入"菜單命令中的"圖表",選中 XY散 點圖類型,在彈出的圖表向導中按向導的要求一步一步地 操作,如有錯誤可以返回去重來或在以后修改。適當修飾 圖的大小、縱橫比例、字體大小、和圖符的大小等,使圖 美觀,最后得到圖1,圖中有直線稱為趨勢線,還有直線方程和相關系數。圖中的每一個部份如坐標、標題、圖例 等都可以分別修飾,這里主要介紹趨勢線和直線方程。
圖1散點圖
鼠標右鍵點擊圖中的數據點,出現一個對話框,選 " 添加趨勢線" ,圖中自動畫上一條直線,再以鼠標右擊此線,出現趨勢線格 式對話框,選擇線條的粗細和顏色,在選項中選取顯示公式和顯示R 平方值,確定后即在 圖中顯示回歸方程和相關系數。
小結:經歷用不同估算方法描述兩個變量線性相關的過程。知道最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程。
《變量間的相關關系》知識點總結
一、變量間的相關關系
1.常見的兩變量之間的關系有兩類:一類是函數關系,另一類是相關關系;與函數關系不同,相關關系是一種非確定性關系.
2.從散點圖上看,點分布在從左下角到右上角的區域內,兩個變量的這種相關關系稱為正相關,點分布在左上角到右下角的區域內,兩個變量的相關關系為負相關.
二、兩個變量的線性相關
1.從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有線性相關關系,這條直線叫回歸直線.
當r>0時,表明兩個變量正相關;
當r<0時,表明兩個變量負相關.
r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0時,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于0.75時,認為兩個變量有很強的線性相關性.
三、解題方法
1.相關關系的判斷方法一是利用散點圖直觀判斷,二是利用相關系數作出判斷.
2.對于由散點圖作出相關性判斷時,若散點圖呈帶狀且區域較窄,說明兩個變量有一定的線性相關性,若呈曲線型也是有相關性.
3.由相關系數r判斷時|r|越趨近于1相關性越強.
看了“變量間的相關關系教學設計”