Đầu tiên cần hiểu cách AI đọc text khác cách mắt người scan trang. Khi anh em nhìn một bài blog, mắt sẽ tự lướt qua tiêu đề lớn, dừng lại ở đoạn in đậm, quét các bullet point hay các phần nổi bật mà bỏ qua phần menu điều hướng hay các nội dung quảng cáo. Não anh em quen với việc xử lý layout, font size, khoảng cách trắng để hiểu cấu trúc mà tác giả muốn truyền tải.
Trong khi đó, AI không có mắt. Thay vào đó, nó đọc text như một chuỗi token, từ trái sang phải, không có khái niệm "to chữ này", "bullet này". Nếu anh em paste một đoạn text raw không có tag gì, AI phải tự suy ra đâu là tiêu đề, đâu là danh sách, đâu là code, đâu là chú thích bên lề. Suy đoán này tốn token để xử lý và rất dễ sai.
![[IMG]](https://photo2.tinhte.vn/data/attachment-files/2026/05/9016265_mark-down.jpeg)
Còn khi anh em đưa Markdown hoặc HTML, các tag # ## bold code và code block đóng vai trò "móc câu". Heading nói "đây là chủ đề mới, các phần dưới sẽ liên quan". Hay list nói “đây là các mục song song, không phải là văn xuôi liên tục” hay block code nói với AI rằng đây không phải đoạn văn mô tả, đây là code, đừng paraphrase nội dung bên trong. Mỗi tag trong cái cấu trúc Markdown là một tín hiệu rõ ràng để AI hiểu nó là gì mà không phải đoán.
Nói đơn giản: text thuần anh em cung cấp buộc AI phải đoán cấu trúc trong khi file markup cho AI cấu trúc sẵn. Sự khác biệt này nghe nhỏ trên giấy, nhưng quy ra token và quy ra chất lượng output thì rất lớn.
Một sự trùng hợp tình cờ của lịch sử
Phần thú vị nhất của câu chuyện mà mình thấy được là cả hai format quan trọng nhất với AI hiện nay đều ra đời trong thời đại AI chưa tồn tại.
Đầu tiên là HTML xuất hiện năm 1993, do ông Tim Berners-Lee tạo ra ở CERN. Mục đích gốc rất đời thường: cho các nhà khoa học share tài liệu nghiên cứu lẫn nhau qua mạng, để render được trên trình duyệt cho con người đọc bằng mắt. Lúc đó Berners-Lee không nghĩ đến chuyện một ngày nào đó AI agent sẽ đọc HTML.
Trong khi đó, Markdown ra đời 11 năm sau, năm 2004, do ông John Gruber tạo ra với đóng góp đáng kể từ ông Aaron Swartz. Vấn đề họ giải quyết cũng đơn giản: viết blog HTML mệt vì phải gõ tag, có cách nào viết nhanh kiểu plain text mà vẫn convert được sang HTML không? Markdown là câu trả lời. Cũng chẳng liên quan gì đến AI.