Bài viết này do AI tạo ra, có thể mắc sai sót.
AI đang chuyển từ giai đoạn huấn luyện (training) sang triển khai (inference) — tức là chạy model phục vụ người dùng thực. Inference chiếm phần lớn chi phí vận hành AI, và nhu cầu đang tăng theo cấp số nhân. Trong khi đó, chip silicon đang chạm giới hạn vật lý: mỗi thế hệ mới chỉ cải thiện nhỏ nhưng tốn nhiều điện và tiền hơn đáng kể. Theo IEA, nhu cầu điện của data center toàn cầu sẽ tăng gấp đôi vào 2030. Đây là lý do ngành cần một kiến trúc tính toán hoàn toàn mới.
Lumai xuất thân từ nghiên cứu quang học tại Đại học Oxford. Công nghệ của họ dùng ánh sáng (photon) thay vì điện tử (electron) để thực hiện các phép tính tensor — phép tính cốt lõi của AI. Điểm đặc biệt: ánh sáng di chuyển trong không gian 3 chiều, cho phép xử lý song song hàng triệu phép tính cùng lúc, trong khi chip silicon bị giới hạn ở mặt phẳng 2D. Kết quả: nhanh hơn, tiết kiệm điện hơn, và không bị nóng như GPU.
Khác với nhiều startup quang học chỉ dừng ở demo, Lumai đã chạy thành công Llama 8B và 70B (model mã nguồn mở của Meta) theo thời gian thực trên Iris Nova. Server dùng kiến trúc hybrid: phần điều khiển và phần mềm vẫn chạy trên chip số, nhưng phần tính toán nặng (tensor) được chuyển sang engine quang học. Điều này giúp tích hợp dễ dàng vào data center hiện có mà không cần thay đổi toàn bộ hạ tầng.
Lumai được ARIA (cơ quan nghiên cứu tiên tiến của chính phủ Anh) tài trợ, từng tham gia Intel Ignite, đoạt giải "Science Breakthrough of the Year 2025" của Falling Walls và "Best Overall Technology" tại OCP Future Technologies Symposium. CEO Dr. Xianxin Guo là alumni của Royal Academy of Engineering. Đây không phải startup vô danh — họ có backing nghiêm túc từ cả giới học thuật lẫn công nghiệp.
Nếu quang học tính toán thực sự scale được, đây sẽ là thay đổi lớn nhất trong hạ tầng AI kể từ khi GPU trở thành tiêu chuẩn. Giảm 90% năng lượng nghĩa là data center có thể chạy gấp 10 lần workload với cùng lượng điện — giải quyết đồng thời bài toán chi phí, môi trường và khả năng mở rộng. Iris Nova mới ở giai đoạn đánh giá, nhưng việc đã chạy được model tỷ tham số theo thời gian thực cho thấy đây không còn là lý thuyết.