BIỂU ĐỒ SCATTER – TÌM HIỂU MỐI QUAN HỆ GIỮA CÁC BIẾN

Phân tích dữ liệu đúng bản chất, không “nhìn biểu đồ rồi đoán”


🎯 MỤC TIÊU BÀI HỌC

Sau bài này, bạn sẽ:

  • Hiểu bản chất biểu đồ Scatter (XY Plot) – khi nào nên dùng, khi nào không
  • Biết cách dùng Scatter để phân tích mối quan hệ giữa các biến
  • Tránh các lỗi rất phổ biến khi vẽ Scatter trong Excel
  • Áp dụng Scatter để:
    • Đánh giá hiệu suất nhân sự
    • Phân tích chi phí – doanh thu
    • Phát hiện dữ liệu bất thường (outliers)
  • Chuẩn bị dữ liệu đúng chuẩn cho Power BI & phân tích nâng cao

⚠️ VẤN ĐỀ THỰC TẾ: VÌ SAO NHIỀU BIỂU ĐỒ SCATTER “NHÌN CHO VUI”?

Trong doanh nghiệp, Scatter thường bị:

  • Vẽ cho có, không trả lời câu hỏi gì
  • Trộn nhầm:
    • Category
    • Thời gian
    • Số đo
  • Kết luận kiểu:“Thấy có vẻ tăng”
    “Hình như liên quan”

👉 Scatter không dùng để trang trí, nó dùng để trả lời câu hỏi về mối quan hệ.


🧠 TƯ DUY ĐÚNG KHI DÙNG BIỂU ĐỒ SCATTER

Trước khi vẽ Scatter, phải trả lời được:

  1. Biến X là gì? (nguyên nhân / yếu tố tác động)
  2. Biến Y là gì? (kết quả)
  3. Mình muốn tìm:
    • Có mối quan hệ không?
    • Thuận hay nghịch?
    • Tuyến tính hay phi tuyến?
    • Có điểm bất thường không?

Nếu không trả lời được → đừng vẽ Scatter.


🧪 DỮ LIỆU MẪU THỰC TẾ (≥ 15 DÒNG)

Ví dụ: Phân tích mối quan hệ giữa số giờ làm thêm và hiệu suất công việc

employee_iddepartmentovertime_hoursproductivity_score
E001Nhân sự572
E002Nhân sự878
E003Kế toán265
E004Kế toán1082
E005Kinh doanh1590
E006Kinh doanh1288
E007Kho460
E008Kho666
E009Nhân sự980
E010Kế toán1485
E011Kinh doanh2092
E012Kho358
E013Nhân sự775
E014Kế toán1889
E015Kinh doanh155

👉 Đây là dạng dữ liệu chuẩn để vẽ Scatter:

  • X: overtime_hours
  • Y: productivity_score

🛠️ STEP BY STEP: PHÂN TÍCH MỐI QUAN HỆ BẰNG SCATTER

🔹 STEP 1: Xác định đúng biến X và Y

  • X (Horizontal): Số giờ làm thêm
  • Y (Vertical): Điểm hiệu suất

⚠️ Sai lầm phổ biến:

  • Dùng department (text) cho Scatter ❌
  • Dùng thời gian nhưng không chuẩn hóa ❌

🔹 STEP 2: Vẽ Scatter trong Excel (đúng cách)

  • Chọn 2 cột:
    • overtime_hours
    • productivity_score
  • Insert → Scatter (XY)

👉 Không dùng Line Chart trong trường hợp này.


🔹 STEP 3: Đọc Scatter đúng cách (quan trọng hơn vẽ)

Quan sát:

  • Điểm có xu hướng đi lên không?
  • Có cụm (cluster) không?
  • Có điểm lệch hẳn ra ngoài không?

Ví dụ từ dữ liệu:

  • Nhóm overtime 10–15 giờ → productivity cao
  • Có điểm overtime thấp nhưng productivity thấp rõ rệt

🔹 STEP 4: Thêm Trendline để kiểm chứng

  • Add Trendline (Linear)
  • Hiển thị R²

👉 Giúp trả lời:

  • Mối quan hệ có đủ mạnh để kết luận không?
  • Hay chỉ là cảm giác “nhìn thấy”?

🔹 STEP 5: Chuẩn bị dữ liệu cho Power BI / Automation

Sau khi hiểu logic:

  • Giữ dữ liệu ở dạng bảng phẳng
  • Không gộp trước
  • Để Power BI xử lý nâng cao:
    • Color theo phòng ban
    • Filter theo kỳ

📊 PHÂN TÍCH KẾT QUẢ TỪ SCATTER

Từ ví dụ:

  • xu hướng thuận giữa overtime và productivity
  • Nhưng:
    • Không phải overtime càng nhiều càng tốt
    • Xuất hiện điểm hiệu suất thấp dù overtime cao → cần điều tra

👉 Scatter giúp đặt câu hỏi đúng, không phải đưa kết luận vội.


🧾 KẾT LUẬN & ĐÁNH GIÁ

  • Scatter là công cụ:
    • Rất mạnh
    • Rất dễ dùng sai
  • Giá trị của Scatter nằm ở:
    • Cách chọn biến
    • Cách đọc dữ liệu
    • Cách đặt câu hỏi

👉 Nếu bạn dùng Scatter chỉ để “cho đẹp”, bạn đang lãng phí dữ liệu.


🚀 GỢI Ý ÁP DỤNG THỰC TẾ

👥 Nhân sự

  • Overtime vs hiệu suất
  • Thâm niên vs năng suất
  • Phát hiện nhân sự quá tải

💰 Kế toán

  • Chi phí vs doanh thu
  • Thời gian xử lý vs số lỗi
  • Phát hiện giao dịch bất thường

📦 Quản lý kho

  • Tồn kho vs tốc độ bán
  • Thời gian lưu kho vs hao hụt
  • Nhận diện hàng tồn rủi ro

📊 Quản lý & phân tích

  • Scatter là bước đầu trước:
    • Hồi quy
    • Dự báo
    • Dashboard nâng cao

Scroll to Top