Atlas AEC chạy mọi tính năng AI bằng mô hình open-source, tự host. Trang này công khai danh sách model, dataset huấn luyện, kết quả benchmark, và mức độ trôi (drift) trong 30 ngày gần nhất — để bạn kiểm tra trước khi tin AI.
daily_log.transcribe
faster-whisper-mediumv2025-09
Mục đích sử dụng
Chuyển voice memo công trường (tiếng Việt) → text để dựng nhật ký.
Dữ liệu huấn luyện
OpenAI Whisper medium (OSS weights) via faster-whisper, tự host.
Hạn chế đã biết
Tiếng địa phương mạnh / nhiễu công trường có thể giảm độ chính xác.
Trích dẫn dataset
OpenAI/whisper-medium
Công bố: 10:19 19/05/2026
ncr.assess_photo
qwen2.5-vl:7bv2025-10
Mục đích sử dụng
VLM đánh giá ảnh sai khác chất lượng theo NĐ 06/2021 Điều 12 (MINOR/MAJOR/CRITICAL).
Dữ liệu huấn luyện
Qwen2.5-VL OSS weights, tự host. Suggestion-only, TVGS phải xác nhận.
Hạn chế đã biết
Ảnh thiếu ánh sáng / chụp xa khó đánh giá chính xác.
Trích dẫn dataset
alibaba/qwen2.5-vl-7b
Công bố: 10:19 19/05/2026
rfi.classify
qwen2.5:7b-instructv2025-10
Mục đích sử dụng
Phân loại RFI theo chuyên ngành (KT/KC/MEP/ATLĐ) và mức ưu tiên dựa trên nội dung tiếng Việt.
Dữ liệu huấn luyện
Mô hình OSS Qwen 2.5 7B (Alibaba) chạy tự host bằng Ollama. Atlas chỉ dùng zero-shot, không fine-tune.
Hạn chế đã biết
Có thể nhầm RFI có ngữ cảnh chuyên sâu MEP cao tầng. Engineer luôn xác nhận.
Trích dẫn dataset
alibaba/qwen2.5-7b (open weights)
Công bố: 10:19 19/05/2026
siteeye.ppe
qwen2.5-vl:7b (PPE prompt)v2025-10
Mục đích sử dụng
Phát hiện vi phạm PPE (mũ, áo phản quang, dây an toàn) từ frame camera.
Dữ liệu huấn luyện
VLM zero-shot. Production sẽ chuyển sang YOLOv8 PPE weights.
Hạn chế đã biết
Người trong bóng / khuất một phần có thể không nhận diện.
Trích dẫn dataset
alibaba/qwen2.5-vl-7b
Công bố: 10:19 19/05/2026
spec.embed
bge-m3v2024-07
Mục đích sử dụng
Embedding tiếng Việt + tiếng Anh cho RAG trên SpecPage.