Hiểu về z-score?
“Lứa trước giỏi hơn lứa sau này vì điểm thi hồi đó cao hơn.”
…
Anh trai: Hồi đấy anh thi đại học, toán anh được 9/10 điểm.
Em gái: Em thì chỉ thi được 8.5 điểm thôi nhưng đề năm của em khó hơn năm anh nhiều. Vậy nên tính ra là em giỏi hơn anh.
…
Một cuộc đối thoại hàng ngày đơn giản và thường kết thúc là không ai giỏi hơn ai… Nếu chỉ nhìn điểm thôi thì rõ ràng ai cao hơn thì người đó “giỏi” hơn. Nhưng liệu việc so sánh điểm có thật sự đúng khi bối cảnh khác nhau?
Thống kê có thể trả lời được câu hỏi này bằng cách tính z-score.

Z-score và Ý nghĩa
z‑score đo khoảng cách giữa một điểm dữ liệu và trung bình, sử dụng đơn vị là độ lệch chuẩn; giá trị dương cho biết điểm đó nằm phía trên trung bình, giá trị âm cho biết nó nằm phía dưới, và z = 0 nghĩa là đúng bằng trung bình. Công thức tính z-score:

z‑score đặc biệt hữu ích khi dữ liệu ban đầu tuân theo phân phối chuẩn, bởi khi đó các z‑score cũng sẽ tuân theo phân phối chuẩn hóa với trung bình bằng 0 và độ lệch chuẩn bằng 1, cho phép bạn sử dụng các bảng z hoặc mô hình xác suất để tính phần trăm, xác suất hoặc mức độ bất thường của một quan sát.
Giờ chúng ta thử áp dụng cho trường hợp đầu bài:
- Năm thi của anh trai có điểm trung bình là 7.2 và độ lệch chuẩn là 1. Vậy nên z-score của anh trai sẽ là (9-7.2)/1 = 1.8
- Năm thi của em gái có điểm trung bình là 6.4 và độ lệch chuẩn là 0.7. Vậy nên z-score của em gái sẽ lf (8.5-6.4)/0.7 = 3
Nếu nhìn bằng z-score có thể thấy em gái nổi bật hơn trong năm thi của mình dù điểm thấp anh trai.
z-score được ứng dụng trong phân tích tài chính như thế nào?
Trong tài chính, dữ liệu thường có độ biến động cao, phân phối lệch, hoặc khác nhau về đơn vị đo. Z‑score giúp bạn vượt qua những rào cản này bằng cách:
- So sánh các biến khác thang đo — ví dụ so sánh mức tăng giá của hai cổ phiếu có độ biến động khác nhau.
- Phát hiện outliers — những điểm có z lớn (thường > 2 hoặc 3) có thể là tín hiệu bất thường trong giá, khối lượng giao dịch hoặc chỉ số tài chính.
- Chuẩn hóa dữ liệu trước mô hình — nhiều thuật toán machine learning hoạt động tốt hơn khi dữ liệu được chuẩn hoá.
- Đánh giá mức độ “bất thường” của biến động — ví dụ một phiên tăng giá 4% có thể bình thường với cổ phiếu biến động mạnh, nhưng lại rất bất thường với cổ phiếu ổn định.
Z‑score là một trong những khái niệm nền tảng nhưng lại có sức mạnh đặc biệt trong phân tích dữ liệu, bởi nó giúp chúng ta nhìn thấy vị trí của một điểm dữ liệu trong toàn bộ phân phối theo một cách trực quan và nhất quán. Khi bạn làm việc với dữ liệu tài chính—vốn luôn biến động, nhiều nhiễu và khác biệt về thang đo—z‑score trở thành công cụ giúp bạn “chuẩn hoá” mọi thứ về cùng một ngôn ngữ: khoảng cách tính bằng số độ lệch chuẩn.
Một cách thi vị, ý nghĩa của z-score là:
Các con số, dữ liệu luôn cần được đặt trong bối cảnh.