Hiện NotebookLM được Google trang bị các mô hình ngôn ngữ tiên tiến của họ, bao gồm cả Gemini 1.5 Pro, không chỉ có khả năng suy luận, xử lý tốt thông tin mà ngoài ra, nó còn hỗ trợ windows context rất lớn nên rất thích hợp để phân tích các tài liệu dài.
Về mặt kỹ thuật, NotebookLM hoạt động giống như một hệ thống RAG (Retrieval-augmented generation), sử dụng khả năng suy luận và "kiến thức nền tảng" của model đã được train là Gemini Pro để đọc những data của người dùng đưa vào. Do đó, có thể thấy từng Notebook nói riêng hay cả hệ thống NotebookLM của tài khoản người dùng là một hệ thống RAG dành riêng cho người đó để xử lý những tài liệu cụ thể.
Google khẳng định rằng toàn bộ những nội dung mà người dùng đăng tải lên Notebook phân tích sẽ không bị sử dụng để huấn luyện AI. Bởi thế nên nỗi lo về tính riêng tư của những dữ liệu nhạy cảm cũng sẽ đỡ hơn rất nhiều so với việc đưa tài liệu lên các hệ thống chatbot công cộng khác.
Các tính năng chính của NotebookLM
![[IMG]](https://photo2.tinhte.vn/data/attachment-files/2024/10/8482856_Screenshot_2024-10-14_at_15.34.34.png)
Một số khái niệm cơ bản trong các tính năng của NotebookLM:
- Notebook: Một notebook tương ứng với một chủ đề mà người dùng đang nghiên cứu. Trong đó sẽ bao gồm mọi nguồn thông tin xoay quanh chủ đề đó.
- Nguồn: Nguồn thông tin do người dùng đưa vào cho model AI để phân tích. Hiện tại có thể đưa các nguồn vào bao gồm: File Doc hoặc Slide từ Google Drive, file PDF, file text, URL trang web (hiện các trang web cho phép thì NotebookLM mới đọc được, cái này phụ thuộc vào chính sách của từng trang web), các file markdown, link Youtube, file âm thanh. Đầy đủ các định dạng hỗ trợ gồm: “pdf, txt, md, 3g2, 3gp, aac, aif, aifc, aiff, amr, au, avi, cda, m4a, mid, midi, mp3, mp4, mpeg, ogg, opus, ra, ram, snd, wav, weba, wma”
Google NotebookLM cho phép người dùng đăng lên tổng cộng 50 tài liệu vào trong một Notebook, mỗi tài liệu tương đương tối đa 200.000 từ. Sau khi upload tài liệu lên xong, AI sẽ phân tích và tóm tắt sơ các nội dung ở trong đó, sau đó gợi ý sẵn một số cách khai thác từng tài liệu đó.
Gần đây, một tính năng mơi cập nhật là tóm tắt bằng âm thanh. Tính năng này khá bá đạo, nó dựa vào những nội dung mà chúng ta đưa lên để tự tạo ra một đoạn podcast do 2 người nói chuyện với nhau (tất nhiên là giọng đọc AI) để chúng ta nghe nội dung của các tài liệu. Hiện tại tính năng này chỉ mới hỗ trợ tiếng Anh nhưng cách mà 2 AI tự nói chuyện với nhau cực kỳ tự nhiên về mặt hình thức, nội dung cũng rất mượt. Sắp tới mà update thêm tiếng Việt nữa thì tuyệt.