Nash cân bằng. Lý thuyết trò chơi dành cho các nhà kinh tế (John Nash)

Mục lục:

Nash cân bằng. Lý thuyết trò chơi dành cho các nhà kinh tế (John Nash)
Nash cân bằng. Lý thuyết trò chơi dành cho các nhà kinh tế (John Nash)

Video: Nash cân bằng. Lý thuyết trò chơi dành cho các nhà kinh tế (John Nash)

Video: Nash cân bằng. Lý thuyết trò chơi dành cho các nhà kinh tế (John Nash)
Video: Lý thuyết trò chơi - Cân bằng Nash: Từ toán học đến đầu tư | Bổ não #6 2024, Tháng mười một
Anonim

Vào những năm 1930, John von Neumann và Oscar Morgenstern đã trở thành những người sáng lập ra một nhánh mới và thú vị của toán học được gọi là "lý thuyết trò chơi". Vào những năm 1950, nhà toán học trẻ John Nash bắt đầu quan tâm đến hướng này. Lý thuyết cân bằng trở thành chủ đề cho luận văn của ông, được ông viết vào năm 21 tuổi. Do đó, một chiến lược trò chơi mới được sinh ra gọi là "Cân bằng Nash", đã đoạt giải Nobel nhiều năm sau đó - vào năm 1994.

trạng thái cân bằng Nash
trạng thái cân bằng Nash

Khoảng cách dài giữa việc viết luận văn và sự công nhận chung đã trở thành bài kiểm tra đối với một nhà toán học. Thiên tài không được thừa nhận dẫn đến rối loạn tâm thần nghiêm trọng, nhưng John Nash đã có thể giải quyết vấn đề này nhờ đầu óc logic tuyệt vời của mình. Lý thuyết Cân bằng Nash của ông đã giành được giải Nobel và cuộc đời của ông đã được ghi lại trong Beautiful mind.

Sơ lược về lý thuyết trò chơi

Vì lý thuyết cân bằng Nash giải thích hành vi của con người trong các điều kiện tương tác, nên cần xem xét các khái niệm cơ bản của lý thuyết trò chơi.

Lý thuyết trò chơi nghiên cứu hành vi của những người tham gia (tác nhân) về mặt tương tác với nhau như một trò chơi, khi kết quả phụ thuộc vào quyết định và hành vi của một số người. Người tham gia đưa ra quyết định dựa trên dự đoán của mình về hành vi của người khác, được gọi là chiến lược trò chơi.

Ngoài ra còn có một chiến lược thống trị trong đó người tham gia đạt được kết quả tốt nhất cho bất kỳ hành vi nào của những người tham gia khác. Đây là chiến lược win-win tốt nhất của người chơi.

Sự tiến thoái lưỡng nan của người tù và bước đột phá khoa học

Tình huống khó xử của tù nhân là một trường hợp của một trò chơi trong đó người tham gia buộc phải đưa ra quyết định hợp lý, đạt được một mục tiêu chung khi đối mặt với sự xung đột của các lựa chọn thay thế. Câu hỏi đặt ra là anh ta sẽ chọn phương án nào trong số những phương án này, nhận thấy lợi ích cá nhân và lợi ích chung, cũng như không thể đạt được cả hai. Người chơi dường như bị giam cầm trong một môi trường trò chơi khắc nghiệt, điều này đôi khi khiến họ suy nghĩ rất hiệu quả.

Ví dụ về cân bằng Nash
Ví dụ về cân bằng Nash

Tình huống khó xử này đã được khám phá bởi nhà toán học người Mỹ John Nash. Sự cân bằng mà anh ấy đạt được là một cuộc cách mạng theo cách riêng của nó. Đặc biệt, suy nghĩ mới mẻ này đã ảnh hưởng đến quan điểm của các nhà kinh tế học về cách những người tham gia thị trường đưa ra lựa chọn, có tính đến lợi ích của những người khác, với sự tương tác chặt chẽ và giao thoa giữa các lợi ích.

Tốt nhất là nghiên cứu lý thuyết trò chơi thông qua các ví dụ cụ thể, vì bản thân ngành toán học này không phải là lý thuyết khô khan.

Ví dụ về tình thế tiến thoái lưỡng nan của người tù

Ví dụ, hai người phạm tội cướp, rơi vào tay cảnh sát và đang bị thẩm vấn trong các phòng giam riêng biệt. Đồng thời, các nhân viên cảnh sát cung cấp cho mỗi người tham gia những điều kiện thuận lợi để anh ta sẽ được thả nếu anh ta làm chứng chống lại đối tác của mình. Mỗibọn tội phạm có bộ chiến lược sau đây mà anh ta sẽ xem xét:

  1. Cả hai khai cùng một lúc và nhận 2,5 năm tù.
  2. Cả hai đều im lặng đồng thời và nhận 1 năm mỗi người, vì trong trường hợp này, cơ sở bằng chứng về tội lỗi của họ sẽ rất nhỏ.
  3. Một người làm chứng và được trả tự do, trong khi người kia im lặng và bị 5 năm tù.

Rõ ràng, kết quả của vụ án phụ thuộc vào quyết định của cả hai người tham gia, nhưng họ không thể đồng ý, bởi vì họ đang ngồi trong các phòng giam khác nhau. Xung đột lợi ích cá nhân của họ trong cuộc đấu tranh vì lợi ích chung cũng lộ rõ. Mỗi tù nhân có hai lựa chọn để hành động và 4 lựa chọn cho kết quả.

Chuỗi suy luận logic

Vì vậy, phạm nhân A đang xem xét các phương án sau:

  1. Tôi im lặng và đối tác của tôi im lặng - cả hai chúng tôi sẽ phải nhận 1 năm tù giam.
  2. Tôi từ chối người bạn đời của mình và anh ấy cũng từ chối tôi - cả hai chúng tôi đều bị phạt tù 2,5 năm.
  3. Tôi im lặng, và đối tác của tôi phản bội tôi - Tôi sẽ phải nhận 5 năm tù, và anh ấy sẽ được tự do.
  4. Tôi giao đối tác của mình, nhưng anh ta im lặng - Tôi được tự do, và anh ta bị 5 năm tù.

Hãy đưa ra một ma trận các giải pháp và kết quả khả thi cho rõ ràng.

Bảng các kết quả có thể xảy ra trong tình thế tiến thoái lưỡng nan của tù nhân.

Lý thuyết cân bằng Nash
Lý thuyết cân bằng Nash

Câu hỏi đặt ra là mỗi thí sinh sẽ chọn gì?

"Im lặng, bạn không thể nói" hoặc "Bạn không thể im lặng, bạn không thể nói"

Để hiểu được lựa chọn của người tham gia, bạn cần phải xem qua chuỗi suy nghĩ của họ. Theo lý luận của tội phạm A: nếu tôi giữ im lặng và đối tác của tôi vẫn im lặng, chúng tôi sẽ nhận được thời hạn tối thiểu (1 năm), nhưng tôiTôi không biết anh ấy sẽ cư xử như thế nào. Nếu anh ta làm chứng chống lại tôi, thì tốt hơn là tôi nên làm chứng, nếu không tôi có thể ngồi xuống 5 năm. Tôi thà ngồi một chỗ trong 2,5 năm còn hơn 5 năm. Nếu anh ta giữ im lặng, thì tôi càng cần phải làm chứng, vì như vậy tôi sẽ có được tự do. Người tham gia B.

số dư john nash
số dư john nash

Không khó để thấy rằng chiến lược chủ đạo của từng thủ phạm là làm chứng. Điểm tối ưu của trò chơi này đến khi cả hai tên tội phạm đều làm chứng và nhận được “phần thưởng” của mình - 2,5 năm tù. Lý thuyết trò chơi Nash gọi đây là trạng thái cân bằng.

Giải pháp Nash tối ưu không quá

Bản chất cách mạng của quan điểm Nashian là trạng thái cân bằng như vậy không phải là tối ưu khi xem xét cá nhân tham gia và tư lợi của anh ta. Rốt cuộc, lựa chọn tốt nhất là giữ im lặng và tự do.

Điểm cân bằng Nash là điểm hội tụ các mối quan tâm, nơi mỗi người tham gia chọn phương án tối ưu cho mình chỉ khi những người tham gia khác chọn một chiến lược nhất định.

Xem xét phương án khi cả hai tội phạm đều im lặng và chỉ nhận được 1 năm, chúng ta có thể gọi nó là phương án tối ưu Pareto. Tuy nhiên, điều đó chỉ có thể xảy ra nếu bọn tội phạm có thể đồng ý trước. Nhưng ngay cả điều này cũng không đảm bảo kết quả này, vì sự cám dỗ để rút lui khỏi thỏa thuận và tránh bị trừng phạt là rất lớn. Sự thiếu tin tưởng hoàn toàn vào nhau và nguy cơ kéo dài 5 năm buộc phải lựa chọn phương án với sự công nhận. Suy ngẫm về những gì người tham gia sẽ tuân thủlựa chọn im lặng, hành động trong buổi hòa nhạc, đơn giản là không hợp lý. Một kết luận như vậy có thể được rút ra nếu chúng ta nghiên cứu cân bằng Nash. Ví dụ chỉ chứng minh bạn đúng.

Ích kỷ hay lý trí

Lý thuyết Cân bằng Nash đã đưa ra những kết luận đáng kinh ngạc bác bỏ các nguyên tắc tồn tại trước đó. Ví dụ, Adam Smith coi hành vi của từng người tham gia là hoàn toàn ích kỷ, điều này đã đưa hệ thống về trạng thái cân bằng. Lý thuyết này được gọi là “bàn tay vô hình của thị trường.”

lý thuyết cân bằng john nash
lý thuyết cân bằng john nash

John Nash thấy rằng nếu tất cả những người tham gia hành động vì lợi ích của họ, điều này sẽ không bao giờ dẫn đến một kết quả nhóm tối ưu. Do suy nghĩ hợp lý vốn có ở mỗi người tham gia, nên nhiều khả năng lựa chọn được đưa ra bởi chiến lược cân bằng Nash.

Thí nghiệm thuần nam

Một ví dụ điển hình là trò chơi nghịch lý tóc vàng, tuy có vẻ lạc lõng nhưng lại là một minh họa rõ ràng về cách hoạt động của lý thuyết trò chơi Nash.

Trong trò chơi này, bạn cần tưởng tượng rằng một công ty gồm những người rảnh rỗi đến một quán bar. Gần đó là một công ty gồm toàn các cô gái, một trong số đó được ưa thích hơn những người khác, chẳng hạn như một cô gái tóc vàng. Các chàng trai phải hành động như thế nào để có được người bạn gái tốt nhất cho mình?

tình hình cân bằng
tình hình cân bằng

Vì vậy, lý luận của các chàng trai: nếu mọi người bắt đầu làm quen với cô gái tóc vàng, sau đó, rất có thể không ai có được nó, thì bạn bè của cô ấy sẽ không muốn làm quen. Không ai muốn trở thành kẻ dự phòng thứ hai. Nhưng nếu các chàng trai chọn tránhtóc vàng, thì xác suất để mỗi chàng trai tìm được bạn gái tốt trong số các cô gái là cao.

Tình huống cân bằng Nash không phải là tối ưu cho các chàng trai, bởi vì, chỉ theo đuổi lợi ích ích kỷ của riêng mình, mọi người sẽ chọn cô gái tóc vàng. Có thể thấy, việc chỉ theo đuổi lợi ích ích kỷ sẽ đi liền với sự sụp đổ của lợi ích nhóm. Cân bằng Nash có nghĩa là mỗi chàng trai hành động vì lợi ích của mình, có liên hệ với lợi ích của cả nhóm. Đây không phải là lựa chọn tốt nhất cho cá nhân mọi người, nhưng là lựa chọn tốt nhất cho tất cả mọi người, dựa trên chiến lược tổng thể để thành công.

Cả cuộc đời chúng ta là một trò chơi

Ra quyết định trong thế giới thực rất giống một trò chơi mà bạn cũng mong đợi những hành vi hợp lý nhất định từ những người tham gia khác. Trong kinh doanh, tại nơi làm việc, trong nhóm, trong công ty và thậm chí là trong các mối quan hệ với người khác giới. Từ những giao dịch lớn đến những tình huống đời thường, mọi thứ đều tuân theo luật này hay luật khác.

lý thuyết trò chơi nash
lý thuyết trò chơi nash

Tất nhiên, những tình huống trò chơi với tội phạm và quán bar ở trên chỉ là những hình ảnh minh họa tuyệt vời thể hiện sự cân bằng Nash. Ví dụ về những tình huống khó xử như vậy rất thường xuất hiện trong thị trường thực và điều này đặc biệt hiệu quả trong trường hợp hai nhà độc quyền kiểm soát thị trường.

Chiến lược hỗn hợp

Thường thì chúng ta không tham gia vào một mà là nhiều trò chơi cùng một lúc. Chọn một trong các tùy chọn trong một trò chơi, được hướng dẫn bởi một chiến lược hợp lý, nhưng bạn lại kết thúc trong một trò chơi khác. Sau một vài quyết định hợp lý, bạn có thể thấy rằng kết quả của bạn không theo ý muốn của bạn. Gìlấy?

Hãy xem xét hai loại chiến lược:

  • Chiến lược thuần túy là hành vi của người tham gia, xuất phát từ việc suy nghĩ về hành vi có thể có của những người tham gia khác.
  • Chiến lược hỗn hợp hay chiến lược ngẫu nhiên là sự luân phiên của các chiến lược thuần túy một cách ngẫu nhiên hoặc sự lựa chọn của một chiến lược thuần túy với một xác suất nhất định. Chiến lược này còn được gọi là ngẫu nhiên.
Cân bằng Nash trong các chiến lược hỗn hợp
Cân bằng Nash trong các chiến lược hỗn hợp

Xem xét hành vi này, chúng ta có một cái nhìn mới về trạng thái cân bằng Nash. Nếu trước đó người ta nói rằng người chơi chọn một chiến lược một lần, thì có thể hình dung một hành vi khác. Có thể giả định rằng những người chơi chọn một chiến lược ngẫu nhiên với một xác suất nhất định. Các trò chơi không thể tìm thấy điểm cân bằng Nash trong các chiến lược thuần túy luôn có chúng trong các chiến lược hỗn hợp.

Cân bằngNash trong chiến lược hỗn hợp được gọi là cân bằng hỗn hợp. Đây là trạng thái cân bằng trong đó mỗi người tham gia chọn tần suất lựa chọn chiến lược tối ưu của mình, miễn là những người tham gia khác chọn chiến lược của họ với tần suất nhất định.

Hình phạt và chiến lược hỗn hợp

Có thể tìm thấy một ví dụ về chiến lược hỗn hợp trong trò chơi bóng đá. Minh họa tốt nhất cho chiến lược hỗn hợp có lẽ là một loạt sút luân lưu. Vì vậy, chúng tôi có một thủ môn chỉ có thể nhảy vào một góc và một cầu thủ sẽ thực hiện quả phạt đền.

Vì vậy, nếu lần đầu tiên người chơi chọn chiến thuật sút vào góc trái, và thủ môn cũng rơi vào góc này và bắt được bóng, thì làm thế nào mọi thứ có thể phát triển ở lần thứ hai? Nếu người chơisẽ đánh vào góc đối diện, điều này rất có thể quá rõ ràng, nhưng đánh vào cùng một góc cũng không kém phần rõ ràng. Do đó, cả thủ môn và người phát bóng đều không có lựa chọn nào khác ngoài việc dựa vào lựa chọn ngẫu nhiên.

Vì vậy, bằng cách lựa chọn ngẫu nhiên xen kẽ với một chiến lược thuần túy nhất định, người chơi và thủ môn cố gắng đạt được kết quả tối đa.

Đề xuất: