Phương pháp dự đoán

Hybrid Stats + AI — minh bạch hoàn toàn, mọi công thức + data + backtest đều công khai.

🎯 Giải thích đơn giản (cho mọi người)

Hãy tưởng tượng dự đoán mỗi trận giống như hỏi ý kiến một hội đồng chuyên gia:

Kết quả: xác suất thắng/hòa/thua + tỉ số dự đoán + phân tích bằng tiếng Việt. Mọi con số đều dựa trên dữ liệu thật, không phải "phán đại". Phần bên dưới giải thích chi tiết từng bước.

Pipeline tổng quan

Mỗi trận đi qua 6 layer: 3 mô hình thống kê → aggregator → tầng điều kiện & bối cảnh → AI Chuyên gia bóng đá → kết quả cuối.

Input
Trận: Đội A vs Đội B
3 mô hình thống kê chạy song song
ELO Rating
Chấm điểm sức mạnh từng đội
47.980 trận lịch sử
K-factor theo giải · MOV multiplier · Host boost
→ P(W/D/L)
Poisson Model
Đoán khả năng ghi bàn & tỉ số
6.000 trận major
α attack, δ defense per team · Time decay
→ λ_A, λ_B, top scores
WC Overlay
Điều chỉnh theo lịch sử World Cup
1.069 trận WC
WCOI · Conf×Stage matrix · Stage params
→ adjustments
Aggregator
Gộp ý kiến 3 mô hình thành con số gốc
Weighted ensemble
Elo 35% · Poisson 35% · Conf×Stage 20% · WCOI 10%
→ P_baseline + expected score
Tầng điều kiện & bối cảnh
🌡️ Điều kiện thi đấu
Nhiệt độ lúc đá · độ cao sân
Giờ địa phương + mái che → heat-stress · độ cao (vd Mexico City 2.240m)
→ điều chỉnh thể lực/cường độ
📰 Bối cảnh hiện tại
Đội hình · phong độ 2025-26
Chấn thương, treo giò, HLV, động lực, tactical
→ tinh chỉnh định tính
Tầng AI
AI Chuyên gia bóng đá · Bayesian Updater
Neo vào baseline, điều chỉnh ±15% theo điều kiện + bối cảnh
(±25% nếu lý do định tính rõ ràng) · dự đoán sinh sẵn, nhất quán mọi người
Kết quả cuối
Xác suất 3 chiều · Tỉ số · Confidence · Phân tích VN

Backtest WC2018 + WC2022 (kiểm chứng không gian lận)

💡 Nói đơn giản: Để chứng minh không "chém gió", bọn mình bắt hệ thống dự đoán lại 2 kỳ World Cup gần nhất (2018 & 2022), chỉ cho nó dùng dữ liệu có trước mỗi trận. Kết quả đoán đúng ~55,5% — cao hơn hẳn đoán mò.

Rebuild Elo + Poisson chỉ với data TRƯỚC mỗi trận, predict 128 trận của 2 kỳ WC gần nhất.

1. Elo Rating — điểm sức mạnh đội (35%)

💡 Nói đơn giản: Giống điểm xếp hạng trong cờ vua hay game online. Mỗi đội có một số điểm sức mạnh; thắng đội mạnh được cộng nhiều, thua đội yếu bị trừ nhiều, thắng đậm cộng thêm. Đội chủ nhà được cộng điểm lợi thế sân nhà.

FIFA-style Elo update sau mỗi trận của 47.980 trận quốc tế 1872-2025. K-factor theo mức độ quan trọng giải đấu.

R'_A = R_A + K × m × (W_actual - W_expected)
W_expected = 1 / (1 + 10^((R_B - R_A)/400))
K = 55 (WC) | 45 (Euro/Copa) | 35 (WC qualifier) | 20 (friendly)
m = log(|GD| + 1) × damp(rating_diff) (margin of victory)
Host boost: +200 Mexico Azteca, +100-150 USA/Canada venues

2. Poisson — mô hình ghi bàn (35%)

💡 Nói đơn giản: Dựa trên việc mỗi đội thường ghi và thủng bao nhiêu bàn, mô hình tính ra tỉ số nào dễ xảy ra nhất (vd 2-0, 1-1...) và khả năng thắng/hòa/thua. Đội tấn công mạnh gặp đội thủ yếu → kỳ vọng ghi nhiều bàn.

Cho mỗi đội, fit attack (α) và defense (δ) strength so với mean toàn cầu. λ = expected goals.

λ_home = α_home × δ_away × home_boost × global_avg
λ_away = α_away × δ_home × global_avg
P(score=i,j) = Poisson(i; λ_home) × Poisson(j; λ_away)
α > 1 → ghi nhiều hơn TB. δ < 1 → thủ tốt hơn TB.
Data: 6.028 trận major tournaments 2014+. Time-decay exp(-0.10 × age).

3. Sức mạnh theo châu lục (20%)

💡 Nói đơn giản: Lịch sử World Cup cho thấy các châu lục không ngang nhau — đội châu Âu, Nam Mỹ thường đá tốt hơn đội châu Á, châu Phi, Bắc Mỹ ở các vòng tương ứng. Mô hình phản ánh đúng thực tế đó thay vì coi mọi đội như nhau.

Lịch sử WC cho thấy các liên đoàn không bình đẳng tại WC. Matrix trích từ 1.069 trận WC 1930-2022.

4. "Chất World Cup" — WCOI (10%)

💡 Nói đơn giản: Có đội cứ tới World Cup là "lên đồng", đá hay hơn ngày thường (Argentina, Đức, Croatia); ngược lại có đội hay gây thất vọng ở sân chơi lớn (Iran, Hàn Quốc, Ả Rập Xê Út). Chỉ số này thưởng/phạt theo thói quen đó.

Đo: 1 đội có "đá hay hơn bình thường" khi vào WC không?

WCOI = WC_win_rate − All_time_win_rate

5. Tầng điều kiện thi đấu (nhiệt độ & độ cao)

WC2026 đá tháng 6-7 ở Bắc Mỹ — nắng nóng giữa trưa và độ cao là yếu tố thật ảnh hưởng thể lực. Mỗi trận được tính bối cảnh môi trường từ sân thi đấu + giờ địa phương.

Cách tính
  • Nhiệt độ cảm nhận lúc đá = nhiệt độ điển hình của sân (tháng 6-7) điều chỉnh theo khung giờ (giữa trưa nóng nhất, tối mát ~−6°C) + bù độ ẩm. Sân có mái che/điều hòa → môi trường kiểm soát ~22°C.
  • Heat-stress: Thấp / Trung bình / Cao / Khắc nghiệt — nóng bào mòn thể lực, lợi cho đội đá chậm kiểm soát.
  • Độ cao: ≥1.200m ảnh hưởng đáng kể, ≥2.000m (Mexico City 2.240m) ảnh hưởng mạnh — lợi cho đội quen độ cao, đối thủ dễ đuối hiệp 2.
16 sân chủ nhà đều có dữ liệu khí hậu + thông số mái che. Xem chi tiết ngay trên mỗi trang trận đấu.

6. Tầng AI — Chuyên gia bóng đá làm Bayesian Updater

Stats baseline là điểm neo. AI nhận thêm điều kiện thi đấu (mục 5) + bối cảnh hiện tại (đội hình, phong độ 2025-26, chấn thương) và được constraint chỉ adjust ±15% trừ khi có lý do định tính rõ ràng (max ±25%).

Why constraint?
  • No constraint → AI hay overconfident, predict bừa (90%, 5%, 5%)
  • Too tight (±5%) → AI thành no-op, chỉ copy stats
  • ±15% sweet spot → giữ statistical rigor + thêm qualitative (nhiệt độ/độ cao, form 2025, chấn thương, motivation, tactical)
Dự đoán được sinh sẵn → mọi người vào đều thấy kết luận nhất quán, không tốn API runtime. Tỉ số hiển thị dao động nhẹ quanh kịch bản khả năng cao nhất.