Tương quan

Tương quan là gì:

Tương quan có nghĩa là sự tương đồng hoặc mối quan hệ giữa hai thứ, con người hoặc ý tưởng . Đó là một sự tương đồng hoặc tương đương tồn tại giữa hai giả thuyết, tình huống hoặc đối tượng khác nhau.

Trong lĩnh vực thống kê và toán học, mối tương quan đề cập đến một thước đo giữa hai hoặc nhiều biến liên quan.

Thuật ngữ tương quan là một danh từ nữ tính có nguồn gốc từ tương quan Latin .

Tương quan từ có thể được thay thế bằng các từ đồng nghĩa như: quan hệ, phương trình, nexus, tương ứng, tương tự và kết nối.

Hệ số tương quan

Trong thống kê, hệ số tương quan Pearson (r), còn được gọi là hệ số tương quan thời điểm sản phẩm, đo lường mối quan hệ giữa hai biến trong cùng một thang đo.

Chức năng của hệ số tương quan là xác định cường độ của mối quan hệ tồn tại giữa các bộ dữ liệu hoặc thông tin đã biết.

Giá trị của hệ số tương quan có thể khác nhau giữa -1 và 1 và kết quả thu được xác định xem tương quan là âm hay dương.

Để giải thích hệ số cần biết rằng 1 có nghĩa là mối tương quan giữa các biến là dương hoàn hảo và -1 có nghĩa là nó là âm hoàn hảo . Nếu hệ số bằng 0 có nghĩa là các biến không phụ thuộc vào nhau.

Trong thống kê cũng có hệ số tương quan Spearman, mang tên này để vinh danh nhà thống kê Charles Spearman. Chức năng của hệ số này là đo cường độ của mối quan hệ giữa hai biến, cho dù chúng có tuyến tính hay không.

Tương quan Spearman phục vụ để đánh giá xem cường độ của mối quan hệ giữa hai biến được phân tích có thể được đo bằng một hàm đơn điệu (hàm toán học bảo tồn hoặc đảo ngược quan hệ thứ tự ban đầu).

Tính toán hệ số tương quan Pearson

Phương pháp 1) Tính toán hệ số tương quan Pearson bằng cách sử dụng hiệp phương sai và độ lệch chuẩn.

Ở đâu

S XY là hiệp phương sai;

S xS y tương ứng là độ lệch chuẩn của các biến x và y.

Trong trường hợp này, phép tính bao gồm đầu tiên tìm hiệp phương sai giữa các biến và độ lệch chuẩn của từng biến. Sau đó, hiệp phương sai được chia cho phép nhân độ lệch chuẩn.

Thông thường, câu lệnh đã cung cấp độ lệch chuẩn của các biến hoặc hiệp phương sai giữa chúng, chỉ bằng cách áp dụng công thức.

Phương pháp 2) Tính toán hệ số tương quan Pearson với dữ liệu thô (không có hiệp phương sai hoặc độ lệch chuẩn).

Với phương pháp này, công thức trực tiếp nhất như sau:

Ví dụ: giả sử rằng chúng ta có dữ liệu với n = 6 quan sát của hai biến: mức glucose (y) và tuổi (x), phép tính theo các bước sau:

Bước 1) Xây dựng bảng với dữ liệu hiện có: i, x, y và thêm các cột trống cho xy, x² và y²:

Bước 2: Nhân x và y để điền vào cột "xy". Ví dụ: trong dòng 1 chúng ta sẽ có: x1y1 = 43 × 99 = 4257.

Bước 3: Nâng các giá trị của cột x và ghi lại kết quả vào cột x². Ví dụ: trong dòng đầu tiên, chúng ta sẽ có x 1 2 = 43 × 43 = 1849.

Bước 4: Thực hiện tương tự như trong Bước 3, bây giờ sử dụng cột y và ghi lại bình phương các giá trị của bạn trong cột y². Ví dụ: trong dòng đầu tiên, chúng ta sẽ có: y 1 2 = 99 × 99 = 9801.

Bước 5: Lấy tổng của tất cả các số cột và đặt kết quả vào phần chân cột. Ví dụ: tổng của cột Age X bằng 43 + 21 + 25 + 42 + 57 + 59 = 247.

Bước 6: Sử dụng công thức trên để có được hệ số tương quan:

Như vậy, chúng ta có:

Hệ số tương quan của Spearman

Việc tính toán hệ số tương quan của Spearman có phần khác nhau. Đối với điều này, chúng ta cần tổ chức dữ liệu của mình trong bảng sau:

1. Đã liệt kê 2 cặp dữ liệu, chúng ta phải giới thiệu chúng trong bảng. Ví dụ:

2. Trong cột "Xếp hạng A", chúng tôi sẽ phân loại các quan sát trong "Ngày A" theo cách tăng dần, với "1" là giá trị thấp nhất trong cột, vi (tổng số quan sát), giá trị cao nhất trong cột "Ngày A ". Trong ví dụ của chúng tôi, đó là:

3. Chúng tôi làm tương tự để có được cột "Xếp hạng B", hiện đang sử dụng các quan sát trong cột "Dữ liệu B":

4. Trong cột "d", chúng tôi đặt sự khác biệt giữa hai Xếp hạng (A - B). Ở đây tín hiệu không quan trọng.

5. Nâng từng giá trị trong cột "d" và ghi vào cột d²:

6. Thêm tất cả dữ liệu từ cột "d²". Giá trị này là Σd². Trong ví dụ của chúng tôi Σd² = 0 + 1 + 0 + 1 = 2

7. Bây giờ chúng tôi sử dụng công thức của Spearman:

Trong trường hợp của chúng tôi, n bằng 4, khi chúng tôi xem xét số lượng hàng dữ liệu (tương ứng với số lượng quan sát).

8. Cuối cùng, chúng tôi thay thế dữ liệu trong công thức trước:

Hồi quy tuyến tính

Hồi quy tuyến tính là một công thức được sử dụng để ước tính giá trị có thể của một biến (y) khi biết các giá trị của các biến khác (x). Giá trị của "x" là biến độc lập hoặc giải thích và "y" là biến phụ thuộc hoặc đáp ứng.

Hồi quy tuyến tính được sử dụng để xác minh giá trị của "y" có thể thay đổi như một hàm của biến "x". Dòng chứa các giá trị của kiểm tra phương sai được gọi là đường hồi quy tuyến tính.

Nếu biến giải thích "x" có một giá trị duy nhất, hồi quy sẽ được gọi là hồi quy tuyến tính đơn giản .