Mở cửa: Từ 8:00 đến 18:00 (Tất cả các ngày trong tuần)

banner
banner
banner
banner
icon next
icon prev

Hồi quy và tương quan

Hồi quy và tương quan Hồi quy và tương quan

Hồi quy và tương quan

 

Hồi quy và tương quan

 

Thống kê: Tương quan và Hồi quy

 

Phần này bao gồm:

  •        Hệ số tương quan
  •        Hồi quy tuyến tính cơ bản

 

Hệ số tương quan

Kỹ thuật thống kê được sử dụng để đo độ mạnh của liên kết tuyến tính giữa hai biến liên tục, tức là độ gần mà các điểm nằm dọc theo đường hồi quy (xem bên dưới). Hệ số tương quan ( r ) nằm giữa -1 và +1 (bao gồm).

  •        Nếu r = 1 hoặc -1, có mối quan hệ tuyến tính hoàn hảo (1) hoặc âm (-1)
  •        Nếu r = 0, không có mối quan hệ tuyến tính giữa hai biến

Khi tính toán bằng cách sử dụng dữ liệu quan sát, nó thường được gọi là hệ số tương quan Pearson (sau khi Karl Pearson người đầu tiên xác định nó). Khi sử dụng thứ hạng của dữ liệu, thay vì dữ liệu được quan sát, nó được gọi là tương quan thứ hạng của Spearman.

Thông thường

       0,8 ≤ | r | ≤ 1,0 => mối quan hệ rất mạnh
       0,6 ≤ | r | <0,8 => mối quan hệ bền chặt
       0,4 ≤ | r | <0,6 => quan hệ vừa phải
       0,2 ≤ | r | <0,4 => quan hệ yếu
       0,0 ≤ | r | <0,2 => mối quan hệ rất yếu

… Ở đâu | r | (đọc “môđun của r ”) là giá trị tuyệt đối (không âm) của r .

Người ta có thể kiểm tra xem r có khác 0 có ý nghĩa thống kê hay không (giá trị không có tương quan). Lưu ý rằng mẫu càng lớn thì giá trị r càng nhỏ càng có ý nghĩa. Ví dụ, với n = 10 quan sát được ghép đôi, r là có ý nghĩa nếu nó lớn hơn 0,63. Với n = 100 cặp, r là có ý nghĩa nếu nó lớn hơn 0,20.

Bình phương của hệ số tương quan ( 2 ) chỉ ra bao nhiêu sự thay đổi trong biến y được chiếm (hay “giải thích”) bởi biến x . Ví dụ, nếu r = 0,7, thì 2 = 0,49, điều này cho thấy 49% sự biến thiên của y được giải thích bởi x .

 

Điểm quan trọng:

  •        Tương quan chỉ đo lường sự liên kết tuyến tính. Mối quan hệ hình chữ U có thể có mối tương quan bằng không.
  •        Nó là đối xứng về các biến x và y - tương quan của ( x và y ) cũng giống như tương quan của ( y và x ).
  •        Mối tương quan có ý nghĩa giữa hai biến không nhất thiết có nghĩa là chúng có quan hệ nhân quả.
  •        Đối với các mẫu lớn có thể phát hiện ra các mối quan hệ rất yếu.

 

Hồi quy tuyến tính cơ bản

Hồi quy tuyến tính đơn giản được sử dụng để mô tả mối quan hệ giữa hai biến trong đó một biến (biến phụ thuộc, ký hiệu là y ) sẽ thay đổi khi biến kia (biến độc lập, giải thích hoặc dự đoán, ký hiệu là x ) thay đổi.

Kỹ thuật này phù hợp với một đường thẳng với dữ liệu, trong đó cái gọi là "đường hồi quy" này có một phương trình có dạng:

      y = a + b x

      a = hằng số (chặn y)
      b = gradient (hệ số hồi quy)

Mô hình được điều chỉnh bằng cách chọn a và b sao cho tổng bình phương của các sai số dự đoán (sự khác biệt giữa các giá trị y quan sát được và các giá trị được dự đoán bởi phương trình hồi quy) được giảm thiểu. Đây được gọi là phương pháp bình phương nhỏ nhất.

Phương pháp này tạo ra một ước lượng cho b, cùng với sai số chuẩn và khoảng tin cậy. Từ đó, người ta có thể kiểm tra ý nghĩa thống kê của b. Trong trường hợp này, giả thuyết rỗng là b = 0, tức là sự biến thiên theo y không được dự đoán bởi x .

Hệ số hồi quy b cho chúng ta biết rằng cứ thay đổi 1 đơn vị x (biến giải thích) thì y (biến phản hồi) sẽ thay đổi trung bình b đơn vị.

Lưu ý rằng giá trị hằng số a cho giá trị dự đoán của y khi x = 0.

 

Điểm quan trọng:

  •        Mối quan hệ được giả định là tuyến tính, có nghĩa là khi x tăng một lượng đơn vị, y tăng một lượng cố định, bất kể giá trị ban đầu của x .
  •        Độ biến thiên của sai số được giả định là không thay đổi theo x (độ co giãn đồng biến).
  •        Không giống như mối tương quan, mối quan hệ không đối xứng, vì vậy người ta sẽ nhận được một phương trình khác nếu người ta trao đổi các biến phụ thuộc và độc lập, trừ khi
           tất cả các quan sát nằm trên đường thẳng hoàn hảo y = x .
  •        Kiểm định ý nghĩa đối với b cho cùng giá trị P với kiểm định ý nghĩa đối với hệ số tương quan r .
  •        Hệ số hồi quy có ý nghĩa thống kê không bao hàm mối quan hệ nhân quả giữa y và x.

 

Thẩm quyền giải quyết

  •        Campbell MJ. Số liệu thống kê tại Square Two. Ed thứ 2. Blackwell: BMJ Books, 2006

                                                                                               

© MJ Campbell 2016, S Shantikumar 2016

Tin tức mới nhất