Giỏ hàng

Centaur - Trí tuệ nhân tạo mô phỏng tư duy con người: Bước tiến mới trong hiểu biết về nhận thức

 
Trong bối cảnh cuộc đua tạo ra trí tuệ nhân tạo tổng quát (Artificial General Intelligence – AGI) giữa các ông lớn như OpenAI hay Meta vẫn còn đang ở thì tương lai, một nhóm các nhà khoa học quốc tế đã âm thầm phát triển mô hình ngôn ngữ lớn có khả năng tái hiện cách con người suy nghĩ và phản ứng trong các thí nghiệm tâm lý học. Họ gọi nó là Centaur – hệ thống không chỉ bắt chước cách con người học tập, ra quyết định và tư duy, mà còn lặp lại cả những sai sót đặc trưng của bộ não con người.
 
Hành trình từ lý thuyết đến mô hình ngôn ngữ
 
Trong nhiều thập kỷ, các nhà khoa học nhận thức đã phát triển hàng loạt lý thuyết để giải thích cách con người ghi nhớ, học hỏi, ra quyết định và xử lý thông tin. Những lý thuyết này được kiểm chứng thông qua các thí nghiệm tâm lý học – nơi hành vi của người tham gia được so sánh với dự đoán của mô hình lý thuyết.
 
Tuy nhiên, mỗi lý thuyết chỉ phản ánh một khía cạnh đơn lẻ của tâm trí con người. “Chúng tôi muốn hiểu toàn bộ cấu trúc tư duy và xem cách các thành phần đó liên kết với nhau,” tiến sĩ Marcel Binz, nhà khoa học nhận thức tại Helmholtz Munich (Đức) và đồng tác giả nghiên cứu, cho biết.
 
Trong khi đó, các hệ thống trí tuệ nhân tạo hiện đại – đặc biệt là mô hình ngôn ngữ lớn (large language model – LLM) như ChatGPT đang thể hiện năng lực ngày càng gần gũi với con người trong việc xử lý ngôn ngữ và thông tin. Điều này thôi thúc tiến sĩ Binz cùng các cộng sự thử nghiệm xem liệu mô hình này có thể được đào tạo để hành xử như con người trong các tình huống nhận thức phức tạp.
 
Dữ liệu lớn từ hơn 60.000 người
 
Mở đầu hành trình này là việc tận dụng LLaMA – mô hình mã nguồn mở do Meta phát triển để đào tạo lại theo cách hoàn toàn mới: học từ dữ liệu của 160 thí nghiệm tâm lý, với hơn 10 triệu phản hồi từ hơn 60.000 tình nguyện viên.
 
Các thí nghiệm này đa dạng từ việc điều khiển tàu vũ trụ để tìm kho báu, ghi nhớ danh sách từ vựng, đến chơi máy đánh bạc để tối đa hóa phần thưởng. Trong mỗi trường hợp, nhóm nghiên cứu “dạy” LLaMA cách phản hồi giống như người thật, và thưởng cho mô hình khi nó đưa ra phản ứng tương đồng với người tham gia.
 
Kết quả là mô hình Centaur – đặt tên theo sinh vật nửa người nửa ngựa trong thần thoại Hy Lạp – ra đời với khả năng mô phỏng nhận thức con người theo nhiều chiều hướng.
 
Hiệu quả đáng kinh ngạc: Mô phỏng cả chiến lược và điểm yếu
 
Sau khi huấn luyện xong Centaur, nhóm nghiên cứu đưa mô hình này vào các tình huống kiểm tra hoàn toàn mới để đánh giá mức độ “giống người”. Trong trò chơi mô phỏng, khi người chơi điều khiển “tàu vũ trụ” tìm kho báu, mô hình học được chiến lược mà con người sử dụng. Khi bối cảnh trò chơi thay đổi thành “thảm bay” thay vì “tàu vũ trụ”, Centaur vẫn áp dụng chính xác chiến thuật cũ – giống như cách người chơi con người thích nghi.
 
Ở một thử nghiệm khác, khi được hỏi các câu hỏi suy luận logic mà mô hình chưa từng học trước đó, Centaur đưa ra câu trả lời rất giống con người: đúng ở những câu dễ và sai ở những câu mà người thật cũng thường xuyên thất bại.
 
Đặc biệt, trong một thí nghiệm về khả năng quan sát và dự đoán hành vi người chơi trong trò chơi giống “Kéo – Búa – Bao”, các tình nguyện viên dễ dàng hiểu chiến lược của người thật nhưng lại thất bại khi các nước đi được tạo ra bởi thuật toán thống kê. Centaur cũng thể hiện y hệt sự thiên lệch này: mô hình dự đoán người thật chính xác hơn nhiều so với thuật toán.
 
“Điều đó chứng minh Centaur không chỉ học cách trả lời, mà thực sự đã nắm bắt được những cơ chế cơ bản trong nhận thức của con người,” tiến sĩ Binz nhấn mạnh.
 
Góc nhìn từ giới chuyên gia
 
Thành công của Centaur đã gây ấn tượng mạnh với nhiều nhà khoa học hàng đầu. Tiến sĩ Russ Poldrack, chuyên gia nhận thức học tại Đại học Stanford, nhận xét: “Đây là mô hình đầu tiên có thể thực hiện tất cả các loại nhiệm vụ nhận thức giống như một người thật.”
 
Trong khi đó, Ilia Sucholutsky – chuyên gia tại Đại học New York – cho rằng Centaur vượt trội so với những mô hình nhận thức cổ điển vốn chỉ hoạt động tốt trong một phạm vi hẹp.
 
Tuy nhiên, một số chuyên gia khác tỏ ra dè dặt. Olivia Guest, nhà khoa học nhận thức tại Đại học Radboud (Hà Lan), cho rằng việc Centaur không được xây dựng dựa trên một lý thuyết cụ thể về nhận thức khiến nó khó có giá trị trong việc “hiểu” tâm trí con người. Bà nhấn mạnh: “Dự đoán không đồng nghĩa với thấu hiểu.”
 
Cùng quan điểm, tiến sĩ Gary Lupyan từ Đại học Wisconsin-Madison cho rằng mục tiêu cuối cùng của ngành khoa học nhận thức là tìm ra các lý thuyết có khả năng giải thích cách tư duy, không chỉ đơn thuần bắt chước hành vi.
 
Tiềm năng ứng dụng và triển vọng mở rộng
 
Dù chấp nhận rằng Centaur chưa thể tạo ra lý thuyết mới về nhận thức, tiến sĩ Binz kỳ vọng mô hình này có thể trở thành một chuẩn tham chiếu để đánh giá hiệu quả của các lý thuyết mới trong tương lai. Theo ông, Centaur cho thấy một mô hình duy nhất có thể phản ánh rất nhiều đặc điểm hành vi của con người – điều mà các mô hình đơn nhiệm trước đây chưa từng làm được.
 
Hiện nhóm nghiên cứu đang mở rộng cơ sở dữ liệu thí nghiệm tâm lý lên gấp năm lần, với tham vọng đào tạo Centaur để tiếp cận nhiều lớp hành vi nhận thức hơn nữa. “Với dữ liệu lớn hơn, tôi kỳ vọng mô hình sẽ xử lý được nhiều vấn đề phức tạp hơn,” tiến sĩ Binz dự đoán.
 
Đây là tín hiệu đáng chú ý cho giới công nghệ và đầu tư, khi mà việc hiểu rõ hơn về cách con người ra quyết định – cả về logic lẫn sai lầm – có thể mở ra nhiều ứng dụng thương mại: từ cải tiến sản phẩm, chiến lược tiếp thị, đào tạo nhân sự đến phát triển hệ thống AI tương tác thông minh hơn. Các công ty công nghệ có thể khai thác Centaur như một công cụ nghiên cứu hành vi khách hàng hoặc đánh giá UX với chi phí tối ưu.
 
shared via nytimes,

Bình luận

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Bình luận của bạn sẽ được duyệt trước khi đăng lên