Jeremy Hadfield và câu hỏi sảng ngang: ai không đọc lại code trước khi merge?
Khoảnh khắc đó được xem như một dấu mốc - không phải vì AI đã mạnh đến mức nào, mà vì hành vi của con người đang thay đổi theo hướng mà chúng ta chưa từng chuẩn bị. Hadfield sau đó còn nói thêm một câu ngắn, nhưng nặng hơn rất nhiều:
"Most software at Anthropic is now written by Claude." Hầu hết phần mềm tại Anthropic hiện nay được viết bởi Claude.
Để hiểu tại sao điều đó đáng lo hơn là đáng mừng, cần nhìn lại một chút lịch sử nghề lập trình. Khi IDE (môi trường phát triển tích hợp) ra đời vào thập niên 1990, lần đầu tiên lập trình viên có thể dùng autocomplete - gợi ý tên hàm, tự hoàn thành cú pháp. Không ai đọc từng ký tự nữa. Rồi đến Stack Overflow vào 2008, anh em nào lập trình chắc cũng đã từng kiểu lên đây, tìm kiếm thread nào đó giống vấn đề mình đang gặp, chọn cái giải pháp được vote nhiều nhất rồi copy-paste đoạn code từ câu trả lời đó, đôi khi không hiểu rõ toàn bộ cơ chế. Sau đó,
GitHub Copilot ra mắt năm 2021, tự hoàn thành cả hàm dựa trên comment. Và bây giờ, năm 2026, chúng ta đã đi từ "hoàn thành một dòng" đến “viết toàn bộ pull request.”
Anh em chắc cũng từng lên Stack overflow để đọc code rồi copy về thử để coi nó hoạt động thế nào
Mỗi bước trong chuỗi sự kiện đó đều có những lời biện hộ rất hợp lý: tiết kiệm thời gian, giảm lỗi nhập liệu, tăng năng suất. Nhưng đồng thời, mỗi bước cũng dịch chuyển thêm một chút ranh giới giữa "tôi hiểu code này" đến "tôi tin code này chạy đúng mà không cần kiểm tra". Khoảnh khắc ở London tháng 5 năm nay không phải bước đột biến, nó chỉ là cái điểm mà cái ranh giới đó đã di chuyển đủ xa để trở thành câu chuyện đáng nói.
Thật ra với mình thì Claude không sai, mà vấn đề nằm ở cách vận hành khi chúng ta ngừng kiểm tra các thông tin mà AI tạo ra. Có một điều cần phân biệt rõ ở đây: Claude viết code tốt. Trên benchmark SWE-Bench Verified, bộ đánh giá khả năng giải quyết lỗi phần mềm thực tế, Claude Opus 4.7 đạt 87.6%, GPT-5.5 đạt 88.7%. Đây là những con số ấn tượng, và không có lý do gì để cho rằng code do AI sinh ra tự động kém chất lượng hơn code do người viết vội trong trạng thái thiếu ngủ lúc 11 giờ đêm.
Ngoài ra, vấn đề không nằm ở chất lượng trung bình của code mà Claude viết, mà nằm ở bản chất của lỗi khi nó xảy ra. Khi một lập trình viên viết code và đọc lại trước khi hoàn thành, họ hiểu logic của đoạn đó. Khi có bug xuất hiện ba tháng sau, họ có khả năng trace ngược lại được quyết định kỹ thuật ban đầu. Khi một lập trình viên ship code do Claude viết mà không đọc, đoạn code đó có thể hoạt động đúng, nhưng không ai trong team thực sự hiểu tại sao nó hoạt động, và quan trọng hơn, không ai hiểu nó sẽ fail theo cách nào trong điều kiện edge-case chưa được kiểm tra. Trong kỹ thuật phần mềm, đây là vấn đề của epistemic ownership: không phải ai viết code, mà là ai chịu trách nhiệm hiểu và bảo trì nó. Khi code được ship mà không được đọc, việc ai đó phải chịu trách nhiệm trở nên mờ nhạt