Việc đưa ra quyết định phụ thuộc vào mức độ không chắc chắn của chúng ta

Một nghiên cứu mới về cách chúng ta sử dụng thông tin khen thưởng để đưa ra lựa chọn cho thấy cách con người và khỉ áp dụng chiến lược ra quyết định tùy thuộc vào sự không chắc chắn của thông tin hiện tại.

Kết quả của nghiên cứu này đã minh họa rằng cho việc đặt một canh bạc đơn giản để nhận được phần thưởng, khi biết mức độ hoặc số tiền thưởng nhưng xác suất của phần thưởng là không xác định và phải học, cả hai loài sẽ chuyển chiến lược của mình từ việc kết hợp thông tin phần thưởng vào một cách nhân (trong đó các hàm của xác suất và cường độ thưởng được nhân lên để có được cái gọi là giá trị chủ quan) để so sánh các thuộc tính theo cách thêm vào để đưa ra quyết định. Những phát hiện được công bố trên tạp chí Nature Human Behavior, thách thức một trong những giả định cơ bản nhất về kinh tế, kinh tế học thần kinh và lý thuyết lựa chọn mà những người ra quyết định thường đánh giá các lựa chọn rủi ro theo cách nhân lên khi thực tế điều này chỉ áp dụng trong trường hợp hạn chế khi thông tin về cả hai mức độ lớn và xác suất của phần thưởng được biết rõ ràng.

Đây là nghiên cứu đa loài đầu tiên sử dụng thiết kế thí nghiệm tương tự để chỉ ra rằng cả người và khỉ đều thay đổi chiến lược khi đi từ sự lựa chọn gặp rủi ro (khi biết xác suất thưởng) đến sự không chắc chắn (khi không xác định được phần thưởng đã học), từ việc kết hợp thông tin theo cách nhân rộng đến so sánh thông tin theo cách thêm vào. So sánh các thuộc tính phần thưởng có vẻ giống như so sánh táo với cam; tuy nhiên, khi bạn so sánh các phần thông tin phần thưởng khác nhau thay vì kết hợp chúng, bạn sẽ trở thành một người ra quyết định linh hoạt hơn.

Nhóm các nhà nghiên cứu từ ba trường đại học nhận thấy rằng khi xác suất của phần thưởng phải được học (nhưng mức độ thưởng được cung cấp), vì môi trường trở nên không chắc chắn hơn cả người và khỉ thường sẽ chọn các lựa chọn lớn hơn nhưng rủi ro hơn bằng cách đặt trọng số ít hơn về xác suất và trọng số nhiều hơn về độ lớn của phần thưởng. Nhóm nghiên cứu cũng kiểm tra hoạt động thần kinh trong não của khỉ trong quá trình thực hiện nhiệm vụ và tìm thấy mối tương quan giữa sự điều chỉnh này trong hành vi và cách các nơ-ron trước trán thể hiện thông tin khen thưởng.

Để hiểu các phát hiện, hãy xem xét kịch bản giả thuyết sau đây. Giả vờ hôm nay là ngày may mắn của bạn, nơi bạn có thể giành được tiền trong rút thăm trúng thưởng miễn phí. Tất cả những gì bạn cần làm là chọn một vé từ một trong hai bát: Bát 1 chứa 99 vé chiến thắng, mỗi vé trị giá 100 đô la và 1 vé có giá trị 0 đô la. Bát 2 chứa 50 vé trúng thưởng trị giá $ 250 và 50 vé có giá trị $ 0. Bạn chọn bát nào? Hầu hết mọi người sẽ chọn Bát 1 vì con người không thích rủi ro. Bát 1 cung cấp một sự kết hợp tốt hơn của các thuộc tính, mặc dù Bát 2 có thể sinh lợi nhiều hơn. Để quyết định lựa chọn nào đi cùng, có lẽ bạn đã đưa ra một giá trị chủ quan cho mỗi hai bát bằng cách nhân xác suất chiến thắng và tiện ích chủ quan hoặc mong muốn của vé trúng thưởng.

Hãy xem xét một kịch bản khác trong đó bạn chỉ biết số tiền đô la của vé trúng thưởng trong mỗi bát nhưng không biết xác suất chọn được vé trúng thưởng. Tuy nhiên, bạn đã quan sát những người đã chọn vé từ hai bát trước bạn và đã học được rằng Bát 1 hầu như luôn mang lại 100 đô la vé trúng thưởng nhưng Bát 2 chỉ cho 250 đô la vé thắng một nửa thời gian. Trong kịch bản không chắc chắn này, có lẽ bạn chọn bát mà bạn nghĩ là tốt hơn bằng cách so sánh tần suất hai bát đã được trao vé trúng thưởng so với số lượng vé trúng thưởng mà họ trao. Trong kịch bản này, với tư cách là người ra quyết định, bạn đã sử dụng chiến lược thêm vào vì bạn đã so sánh thông tin phần thưởng qua hai tùy chọn thay vì cố gắng kết hợp nó.

Đối với nghiên cứu thực tế, một loạt các nhiệm vụ đánh bạc được quản lý trên máy tính mà khỉ và người tham gia phải chọn từ hai tùy chọn. Con người (sinh viên đại học ở Đại học Dartmouth) đã được trao tặng một số điểm được chuyển đổi thành tiền và tín dụng bổ sung cho một khóa học, và những con khỉ (học tại Trường Y Yale và Đại học Minnesota) đã được trao tặng những giọt nước trái cây theo lựa chọn của họ và kết quả của các trò may rủi.

Các nhà khoa học cho biết kết quả của họ cho thấy rằng trong một môi trường khen thưởng không chắc chắn, đây là trường hợp thường xuyên, họ không thể xây dựng cái gọi là giá trị chủ quan theo quy định của các mô hình quy phạm và sự linh hoạt quan trọng hơn là hợp lý hoặc tối ưu.

P.T.T (NASATI), theo https://www.sciencedaily.com/releases/2019/09/190909170804.htm, 15/9/2019