Claude Opus 4.7 vs 4.6 — Nâng cấp toàn diện: coding +13%, vision tăng 3.3×, giá giữ nguyên

Bài viết này do AI tạo ra, có thể mắc sai sót.

Mở bài

Ngày 16/04/2026, Anthropic phát hành Claude Opus 4.7 — bản nâng cấp lớn so với Opus 4.6. Video từ kênh Aviz Academy đã test trực tiếp cả hai model bằng cùng một prompt tạo UI, và kết quả khiến nhiều người bất ngờ. Bài viết này tổng hợp những khác biệt quan trọng nhất giữa hai phiên bản.

Video đang nói gì?

Video cho cả Claude Opus 4.6 và 4.7 chạy cùng một prompt yêu cầu tạo giao diện UI. Kết quả cho thấy Opus 4.7 tạo ra UI đẹp hơn, chi tiết hơn, và hoàn thiện hơn hẳn — đặc biệt về bố cục, màu sắc, và responsive design. Điều này phản ánh khả năng "taste" (thẩm mỹ) và coding frontend được cải thiện đáng kể ở phiên bản mới.

Giải thích bản chất

Claude Opus 4.7 không chỉ nhanh hơn mà thực sự thông minh hơn ở nhiều khía cạnh:

Coding: +13% trên benchmark 93 bài coding nội bộ, giải được 4 bài mà cả Opus 4.6 lẫn Sonnet 4.6 đều bó tay
SWE-bench Verified: 87.6% (vs 80.8% của 4.6) — tăng 6.8 điểm
SWE-bench Pro: 64.3% (vs 53.4%) — tăng gần 11 điểm
CursorBench (IDE thực tế): 70% (vs 58%) — tăng 12 điểm
Vision: Độ phân giải ảnh tăng 3.3× (lên 3.75 MP), visual acuity 98.5% vs chỉ 54.5% trên 4.6
Self-verification: Tự lên kế hoạch → thực thi → kiểm tra → báo cáo, giảm lỗi đáng kể
Instruction following: Hiểu prompt chính xác hơn, literal hơn — không còn diễn giải lung tung
xhigh effort level: Mức nỗ lực mới giữa high và max, cho phép kiểm soát chi tiết hơn
Giá: Giữ nguyên $5/$25 per million tokens — low-effort 4.7 cho chất lượng bằng medium-effort 4.6

Sơ đồ minh hoạ

So sánh benchmark chính:

SWE-bench Verified: 80.8% → 87.6% (+6.8pp)
SWE-bench Pro: 53.4% → 64.3% (+10.9pp)
CursorBench: 58% → 70% (+12pp)
Visual Acuity: 54.5% → 98.5% (+44pp)
Coding benchmark (93 tasks): +13% resolution lift

Lưu ý: Long-context needle retrieval (MRCR) giảm từ 91.9% xuống 59.2% ở 256K tokens — đây là regression đáng chú ý.

Áp dụng thực tế

Lập trình viên: Opus 4.7 xử lý được các task coding phức tạp mà trước đây cần giám sát — từ refactoring codebase lớn đến fix race condition, concurrency bugs
Thiết kế UI/UX: Tạo giao diện đẹp hơn, chi tiết hơn từ prompt — phù hợp dùng với Claude Design
Agentic workflow: Self-verification + file-system memory giúp chạy agent tự động nhiều giờ/nhiều ngày mà ít lỗi hơn
Phân tích tài liệu/ảnh: Vision 3.75 MP cho phép đọc screenshot, sơ đồ, bản vẽ kỹ thuật chi tiết pixel-perfect
Tiết kiệm chi phí: Low-effort 4.7 = medium-effort 4.6 chất lượng, giảm token sử dụng thực tế
Lưu ý khi migrate: Prompt cũ viết cho 4.6 có thể cần chỉnh lại vì 4.7 hiểu literal hơn — từ "consider" sẽ được coi là yêu cầu bắt buộc

Kết luận

Claude Opus 4.7 là bản nâng cấp toàn diện so với 4.6: coding mạnh hơn 13%, vision tăng 3.3×, self-verification giảm lỗi, giá giữ nguyên. Nếu đang dùng 4.6, nên migrate lên 4.7 — đặc biệt nếu làm coding agent, phân tích ảnh, hoặc agentic workflow dài. Chỉ cần lưu ý audit lại prompt cũ vì 4.7 hiểu chính xác hơn.