Code with Claude: thấy gì khi code được đẩy đi nhưng không được review?

Đăng lúc 23:42 02.06.2026

Tháng 5 năm 2026, tại một sự kiện dành cho lập trình viên ở London mang tên Code with Claude, một kỹ sư của Anthropic tên Jeremy Hadfield đứng trước phòng và đặt một câu hỏi đơn giản: "Ai trong phòng này đã ship một pull request trong tuần vừa rồi - được viết hoàn toàn bởi Claude?"

Gần một nửa căn phòng giơ tay.

Rồi ông hỏi tiếp: "Và trong số đó, ai đã không đọc lại đoạn code đó trước khi merge?"

Phần lớn tay vẫn ở nguyên vị trí.

[IMG]

Jeremy Hadfield và câu hỏi sảng ngang: ai không đọc lại code trước khi merge?

Khoảnh khắc đó được xem như một dấu mốc - không phải vì AI đã mạnh đến mức nào, mà vì hành vi của con người đang thay đổi theo hướng mà chúng ta chưa từng chuẩn bị. Hadfield sau đó còn nói thêm một câu ngắn, nhưng nặng hơn rất nhiều: "Most software at Anthropic is now written by Claude." Hầu hết phần mềm tại Anthropic hiện nay được viết bởi Claude.

Để hiểu tại sao điều đó đáng lo hơn là đáng mừng, cần nhìn lại một chút lịch sử nghề lập trình. Khi IDE (môi trường phát triển tích hợp) ra đời vào thập niên 1990, lần đầu tiên lập trình viên có thể dùng autocomplete - gợi ý tên hàm, tự hoàn thành cú pháp. Không ai đọc từng ký tự nữa. Rồi đến Stack Overflow vào 2008, anh em nào lập trình chắc cũng đã từng kiểu lên đây, tìm kiếm thread nào đó giống vấn đề mình đang gặp, chọn cái giải pháp được vote nhiều nhất rồi copy-paste đoạn code từ câu trả lời đó, đôi khi không hiểu rõ toàn bộ cơ chế. Sau đó, GitHub Copilot ra mắt năm 2021, tự hoàn thành cả hàm dựa trên comment. Và bây giờ, năm 2026, chúng ta đã đi từ "hoàn thành một dòng" đến “viết toàn bộ pull request.”

Anh em chắc cũng từng lên Stack overflow để đọc code rồi copy về thử để coi nó hoạt động thế nào

Mỗi bước trong chuỗi sự kiện đó đều có những lời biện hộ rất hợp lý: tiết kiệm thời gian, giảm lỗi nhập liệu, tăng năng suất. Nhưng đồng thời, mỗi bước cũng dịch chuyển thêm một chút ranh giới giữa "tôi hiểu code này" đến "tôi tin code này chạy đúng mà không cần kiểm tra". Khoảnh khắc ở London tháng 5 năm nay không phải bước đột biến, nó chỉ là cái điểm mà cái ranh giới đó đã di chuyển đủ xa để trở thành câu chuyện đáng nói.

Thật ra với mình thì Claude không sai, mà vấn đề nằm ở cách vận hành khi chúng ta ngừng kiểm tra các thông tin mà AI tạo ra. Có một điều cần phân biệt rõ ở đây: Claude viết code tốt. Trên benchmark SWE-Bench Verified, bộ đánh giá khả năng giải quyết lỗi phần mềm thực tế, Claude Opus 4.7 đạt 87.6%, GPT-5.5 đạt 88.7%. Đây là những con số ấn tượng, và không có lý do gì để cho rằng code do AI sinh ra tự động kém chất lượng hơn code do người viết vội trong trạng thái thiếu ngủ lúc 11 giờ đêm.

Ngoài ra, vấn đề không nằm ở chất lượng trung bình của code mà Claude viết, mà nằm ở bản chất của lỗi khi nó xảy ra. Khi một lập trình viên viết code và đọc lại trước khi hoàn thành, họ hiểu logic của đoạn đó. Khi có bug xuất hiện ba tháng sau, họ có khả năng trace ngược lại được quyết định kỹ thuật ban đầu. Khi một lập trình viên ship code do Claude viết mà không đọc, đoạn code đó có thể hoạt động đúng, nhưng không ai trong team thực sự hiểu tại sao nó hoạt động, và quan trọng hơn, không ai hiểu nó sẽ fail theo cách nào trong điều kiện edge-case chưa được kiểm tra. Trong kỹ thuật phần mềm, đây là vấn đề của epistemic ownership: không phải ai viết code, mà là ai chịu trách nhiệm hiểu và bảo trì nó. Khi code được ship mà không được đọc, việc ai đó phải chịu trách nhiệm trở nên mờ nhạt

KPMG đã triển khai Claude cho toàn bộ 276 ngàn nhân viên

Có một ví dụ cụ thể cho góc nhìn này. Cùng ngày diễn ra sự kiện London, KPMG, một trong bốn công ty kiểm toán lớn nhất thế giới thông báo triển khai Claude cho toàn bộ 276.000 nhân viên. PwC, Deloitte cũng đã có thỏa thuận tương tự trước đó. Những sự kiện này cho thấy đây không còn là thí nghiệm nội bộ tại một startup AI, mà là hạ tầng của toàn bộ nền tài chính doanh nghiệp toàn cầu đang được vận hành một phần bởi AI tạo sinh.

Khi đó, rủi ro là có thật: khi một đoạn code liên quan đến quy trình kế toán, kiểm toán, hay quản lý rủi ro tài chính được sinh ra bởi Claude và không được đọc lại kỹ càng trước khi deploy, câu hỏi về trách nhiệm pháp lý trở nên thực sự phức tạp. Phần mềm tài chính không có khái niệm “lỗi nhỏ” và một sai sót trong logic tính toán có thể gây ra thảm hoạ rất lớn. Chính vì thế, không phải ngẫu nhiên mà tuần đó, song song với Code with Claude London, Anthropic cũng phát hành bản beta công khai của “self-hosted agent sandboxes”, cho phép các doanh nghiệp giữ các công cụ thực thi nằm trong hệ thống bảo mật của chính họ thay vì trên hạ tầng Anthropic. Đây là tín hiệu rằng chính Anthropic hiểu rằng ở quy mô doanh nghiệp, kiểm soát và trách nhiệm không thể nhường toàn bộ cho tính tiện lợi với AI.

Claude code tốt quá vậy nghề lập trình sẽ đi về đâu?
Câu hỏi tiếp theo có lẽ là nghề lập trình sẽ đi về đâu? Câu trả lời mà nhiều người mong muốn nghe là: "Lập trình viên sẽ làm những việc cấp cao hơn, thiết kế hệ thống, định nghĩa yêu cầu, giám sát AI." Câu đó đúng về lý thuyết. Nhưng khoảnh khắc ở London chỉ ra một thực tế khó chịu hơn: việc chuyển đổi đó không xảy ra tự động.

Khi các kĩ sư giao cho AI viết code và không đọc lại, họ không đang làm việc ở cấp độ cao hơn mà là đang làm việc ít hơn khi ít kiểm tra hơn, tốc độ làm việc tăng lên như như một phần thưởng ngắn hạn. Nếu không có cơ chế buộc người dùng AI vẫn phải duy trì hiểu biết kỹ thuật như thông qua code review bắt buộc, documentation giải thích các quyết định kĩ thuật, hay các quy trình kiểm thử nghiêm túc hơn, thì điều đang xảy ra không phải là nâng cấp kỹ năng. Đó là sự bào mòn dần dần của năng lực kỹ thuật trong một tổ chức, được che giấu bởi velocity tốt trên báo cáo của Sprint, anh em nào làm phần mềm chắc hiểu.

Cuối cùng, Andrej Karpathy gia nhập Anthropic ngay tuần đó cũng là một tín hiệu đáng chú ý. Karpathy là người đã nói từ năm 2023 rằng “the hottest new programming language is English”, lập trình tương lai là diễn đạt bằng ngôn ngữ tự nhiên cho AI thực thi. Ông ấy giờ đang làm research scientist tại công ty mà phần mềm của chính họ chủ yếu do AI viết. Vòng tròn đó khép lại rất gọn gàng. Đáng lo hay đáng mừng, có lẽ còn tùy vào cách anh em đang đứng và đứng ở đâu trong vòng tròn đó.