MỐI LIÊN HỆ GIỮA MỤC TIÊU – GIẢ THIẾT – BIẾN SỐ
Trong nghiên cứu, ba thành phần này gắn chặt với nhau quanh câu hỏi nghiên cứu:
Câu hỏi nghiên cứu → quyết định giả thiết (nếu có) → chi tiết hóa thành các mục tiêu → dẫn tới hệ thống biến số phải đo lường.
Thiết kế nghiên cứu (cắt ngang, bệnh–chứng, thuần tập, thử nghiệm lâm sàng…) và kế hoạch phân tích cũng dựa trên bộ ba này.
Ví dụ:
Câu hỏi: “Ở bệnh nhân tăng huyết áp điều trị ngoại trú tại BV X, tỷ lệ kiểm soát huyết áp là bao nhiêu và yếu tố nào liên quan?”
Mục tiêu: “Xác định tỷ lệ kiểm soát huyết áp…”, “Xác định một số yếu tố liên quan…”.
Giả thiết (cho mục tiêu phân tích): “Bệnh nhân tuân thủ điều trị tốt có khả năng kiểm soát huyết áp cao hơn nhóm không tuân thủ.”
Biến số: huyết áp kiểm soát (có/không), mức tuân thủ (cao/thấp), tuổi, giới, thời gian mắc bệnh, BMI…
Đề tài mẫu xuyên suốt: "Thực trạng và yếu tố liên quan đến tuân thủ điều trị ở bệnh nhân tăng huyết áp ngoại trú tại BV Y năm 2026".
Ba thành phần gắn chặt: Câu hỏi → Giả thiết → Mục tiêu → Biến số → Phân tích (bằng R, Stata, SPSS…)
2. MỤC TIÊU NGHIÊN CỨU
2.1. Khái niệm
Mục tiêu nêu rõ những gì nghiên cứu làm về (ví dụ “tuân thủ điều trị”), quyết định biến số và phương pháp phân tích.
2.2. Nguyên tắc viết mục tiêu
Rõ ràng, đo lường được (SMART), gắn với biến cụ thể.
2.3. Phân loại mục tiêu
Mục tiêu chung: Khảo sát thực trạng tuân thủ và yếu tố liên quan ở bệnh nhân tăng huyết áp ngoại trú.
Mục tiêu cụ thể:
Xác định tỷ lệ tuân thủ tốt.
Phân tích mối liên quan thu nhập với tuân thủ.
Mục tiêu chính để tính cỡ mẫu: Tỷ lệ tuân thủ.
3. Giả thiết nghiên cứu
3.1. Khái niệm
Phát biểu về mối quan hệ giữa tuân thủ và yếu tố khác, kiểm định giả thiết.
3.2. Các loại
H₀: Không khác biệt tỷ lệ tuân thủ giữa thu nhập thấp/cao.
H₁ (hai phía): Có khác biệt.
H₁ (một phía): Thu nhập thấp → tuân thủ kém cao hơn.
3.3. Phân tích giả thiết bằng R
Hướng dẫn test thống kê, cỡ mẫu → R code thực hành kiểm định giả thiết (dữ liệu mẫu 200 bệnh nhân):
# Cài đặt và load thư viện cần thiết
install.packages(c("AdhereR", "epitools", "ggplot2"))
library(AdhereR); library(epitools); library(ggplot2)
# Tạo dữ liệu mẫu: tuân thủ (1=tốt, 0=kém), thu_nhập (1=thấp, 0=cao)
set.seed(123)
tuanhieu <- data.frame(
tuanhieu = rbinom(200, 1, 0.65), # 65% tuân thủ tốt
thu_nhap_thap = rbinom(200, 1, 0.4), # 40% thu nhập thấp
tuoi = rnorm(200, 60, 10)
)
# 1. Thống kê mô tả
table(tuanhieu$tuanhieu) # Tỷ lệ tuân thủ
prop.table(table(tuanhieu$tuanhieu))
# 2. Kiểm định giả thiết H0 vs H1 (Chi-bình phương)
test <- chisq.test(tuanhieu$tuanhieu, tuanhieu$thu_nhap_thap)
print(test) # p-value <0.05 → bác bỏ H0
# Odds Ratio (OR) và CI
epitools::oddsratio(tuanhieu$tuanhieu ~ tuanhieu$thu_nhap_thap)
# 3. Hồi quy logistic đa biến (điều chỉnh tuổi - nhiễu)
model <- glm(tuanhieu ~ thu_nhap_thap + tuoi, family=binomial(), data=tuanhieu)
summary(model) # OR thu nhập thấp: exp(coef)
# 4. Vẽ biểu đồ
ggplot(tuanhieu, aes(x=thu_nhap_thap, fill=factor(tuanhieu))) +
geom_bar(stat="count", position="fill") +
labs(title="Tỷ lệ tuân thủ theo thu nhập", y="Tỷ lệ tuân thủ tốt")
Kết quả mẫu: p<0.05 → thu nhập thấp liên quan tuân thủ kém (OR ~1.8).
4. Biến số nghiên cứu
4.1. Khái niệm
Đặc tính đo mức độ (tuân thủ) và yếu tố liên quan.
4.2. Phân loại theo vai trò
Vai trò | Tên biến | Ví dụ |
Phụ thuộc | Tuân thủ | Cao/thấp (Morisky-8 ≥6) |
Độc lập | Thu nhập | Thấp (<5tr)/Cao |
Nhiễu | Tuổi | <60/≥60 |
4.3. Theo bản chất
Định lượng: Tuổi (liên tục), số viên thuốc quên (rời rạc).
Định tính: Tuân thủ (nhị phân), lý do không tuân thủ (đa trị).
4.4. Định nghĩa và Xử lý biến (vd trong R)
Tên biến | Định nghĩa | Kiểu | Code R |
Tuân thủ | MMAS-8 ≥6 | Nhị phân | tuanhieu <- ifelse(MMAS_score >=6, 1, 0) |
Thu nhập thấp | <5tr/tháng | Nhị phân | thu_nhap_thap <- ifelse(thu_nhap <5e6, 1, 0) |
Package đặc biệt cho tuân thủ: AdhereR tính PDC/MPR từ dữ liệu kê đơn.
# Ví dụ AdhereR tính tỷ lệ tuân thủ từ dữ liệu thuốc
library(AdhereR)
# Giả sử data có cột: patient_id, treatment_date, supply_days
measure <- CMA1(data) # Proportion of Days Covered
summary(measure)
5. Thiết kế đầy đủ đề tài tuân thủ tăng huyết áp với R
Giả thiết: H₀ không khác biệt thu nhập-tuân thủ.
Biến số: Bảng trên.
Nhập dữ liệu: read.csv("data.csv").
Mô tả: table(), prop.table(), summary().
Kiểm định: chisq.test(), t.test(), wilcox.test().
Mô hình: glm() hồi quy logistic.
Vẽ đồ: ggplot2 barplot, boxplot.
Báo cáo: p-value, OR, CI 95%.
Lợi ích R trong nghiên cứu y Việt Nam: Miễn phí, reproducible, package y khoa phong phú (epitools, AdhereR, EpiR). Dùng cho luận văn, bài báo.
Tài liệu học R thêm:
Book: "R for Data Science" (Hadley Wickham).
Khóa học: DataCamp "Hypothesis Testing in R".
- Đăng nhập để gửi ý kiến