Diferencia entre revisiones de «Dilema del Prisionero»

De Demarquía Planetaria
Página creada con «= Dilema del Prisionero = {| class="wikitable" style="float:right; margin-left:1em; width:320px;" |+ '''Dilema del Prisionero''' |- | style="text-align:center;" | 300px |- ! Disciplina | Teoría de Juegos |- ! Tipo de juego | No cooperativo, suma cero/negativa |- ! Formulado por | Merrill Flood y Melvin Dresher (1950) |- ! Nombre dado por | Albert W. Tucker |- ! Concepto clave | Equilibrio de Nash subóptimo |- ! Proble…»
 
Sin resumen de edición
Línea 5: Línea 5:
|-
|-
| style="text-align:center;" | [[Archivo:Dilema-prisionero-demarquia.png|300px]]
| style="text-align:center;" | [[Archivo:Dilema-prisionero-demarquia.png|300px]]
|
|-
|-
! Disciplina
! Disciplina
| [[Teoría de Juegos]]
| [[Teoría de Juegos en Demarquía|'''Teoría de Juegos''']]
|-
|-
! Tipo de juego
! Tipo de juego
Línea 38: Línea 39:


<div style="background: #fffbf0; border: 2px solid #ffd700; padding: 15px; margin: 15px 0; border-radius: 5px;">
<div style="background: #fffbf0; border: 2px solid #ffd700; padding: 15px; margin: 15px 0; border-radius: 5px;">
El '''Dilema del Prisionero''' es un concepto fundamental de la [[Teoría de Juegos]] que ilustra cómo el '''egoísmo racional''' individual conduce a un resultado subóptimo para el colectivo.  
El '''Dilema del Prisionero''' es un concepto fundamental de la [[Teoría de Juegos en Demarquía|'''Teoría de Juegos''']] que ilustra cómo el '''egoísmo racional''' individual conduce a un resultado subóptimo para el colectivo.  


En el contexto de la [[Demarquía Planetaria]], el sistema está diseñado precisamente para '''resolver y anular''' este dilema mediante la '''[[Diseño de Mecanismos|Arquitectura de Incentivos Inteligentes]]''' y el principio del '''[[Egoísmo Ilustrado]]'''.
En el contexto de la [[Demarquía Planetaria|'''Demarquía Planetaria''']], el sistema está diseñado precisamente para '''resolver y anular''' este dilema mediante la '''[[Diseño de Mecanismos|Arquitectura de Incentivos Inteligentes]]''' y el principio del '''[[Egoísmo Ilustrado]]'''.
</div>
</div>



Revisión del 10:28 7 nov 2025

Dilema del Prisionero

Dilema del Prisionero
Archivo:Dilema-prisionero-demarquia.png
Disciplina Teoría de Juegos
Tipo de juego No cooperativo, suma cero/negativa
Formulado por Merrill Flood y Melvin Dresher (1950)
Nombre dado por Albert W. Tucker
Concepto clave Equilibrio de Nash subóptimo
Problema central Racionalidad individual → irracionalidad colectiva
Resolución tradicional Juegos repetidos, reputación, castigo
Resolución demárquica Modificación de la matriz de pagos
Estrategia en capitalismo Defección (competir/traicionar)
Estrategia en Demarquía Cooperación (egoísmo ilustrado)

El Dilema del Prisionero es un concepto fundamental de la Teoría de Juegos que ilustra cómo el egoísmo racional individual conduce a un resultado subóptimo para el colectivo.

En el contexto de la Demarquía Planetaria, el sistema está diseñado precisamente para resolver y anular este dilema mediante la Arquitectura de Incentivos Inteligentes y el principio del Egoísmo Ilustrado.

Introducción

El Dilema del Prisionero es el ejemplo más famoso de cómo la racionalidad individual puede conducir a la irracionalidad colectiva. Es la demostración matemática de por qué sociedades de individuos racionales pueden colapsar en competencia destructiva, desconfianza mutua y miseria compartida.

La Demarquía argumenta que el sistema actual es inherentemente defectuoso porque incentiva al Homo Debitum (el humano endeudado) a adoptar el egoísmo dañino como la estrategia más racional para la supervivencia.

"El Dilema del Prisionero se resuelve cuando el diseñador del juego, en lugar de castigar al jugador por ser racional, inclina el campo de juego de tal manera que el camino más fácil y rápido para alcanzar la meta individual es, inherentemente, el camino que beneficia a todos. Es el camino de menor resistencia (Principio de Mínima Acción) conduciendo al bien común."

1. El Dilema Clásico

Formulación Original

Dos criminales son arrestados y interrogados en celdas separadas. La policía les ofrece el siguiente trato:

Opciones:

  • Si ambos cooperan (guardan silencio): 1 año de cárcel cada uno
  • Si ambos traicionan (confiesan): 3 años de cárcel cada uno
  • Si uno traiciona y el otro coopera: El traidor sale libre (0 años), el cooperador recibe 5 años

Matriz de Pagos

Prisionero B
Cooperar Traicionar
Prisionero A Cooperar A: -1, B: -1
(óptimo colectivo)
A: -5, B: 0
(A es explotado)
Traicionar A: 0, B: -5
(B es explotado)
A: -3, B: -3
(equilibrio de Nash)

Análisis Estratégico

Razonamiento del Prisionero A:

  • "Si B coopera, yo gano más traicionando (0 años vs 1 año)"
  • "Si B traiciona, yo gano más traicionando (3 años vs 5 años)"
  • Conclusión: Traicionar es mi estrategia dominante

Razonamiento del Prisionero B: (idéntico)

Resultado: Ambos traicionan → Ambos obtienen 3 años (subóptimo)

Paradoja: La racionalidad individual produce irracionalidad colectiva

2. El Dilema en el Sistema Actual

El Dilema del Prisionero no es solo un experimento mental abstracto. Es la estructura profunda de la mayoría de las interacciones bajo el capitalismo.

Manifestaciones en el Capitalismo

Contexto "Cooperar" "Traicionar" Equilibrio (subóptimo)
Competencia empresarial Respetar regulaciones ambientales Contaminar para reducir costos Todos contaminan (destrucción ambiental)
Mercado laboral Pagar salarios justos Explotar trabajadores Carrera hacia el fondo (salarios mínimos)
Sistema financiero Invertir en economía real Especular en derivados Todos especulan (crisis financieras)
Política Colaborar por bien común Favorecer lobby que te financia Todos favorecen lobbies (captura regulatoria)
Carrera armamentística Desarme mutuo Aumentar arsenal Todos se arman (gasto militar masivo)
Uso de recursos comunes Uso sostenible Sobreexplotación Tragedia de los Comunes

Por Qué el Capitalismo Perpetúa el Dilema

Características del capitalismo que mantienen el dilema:

  1. Psicología de la escasez: Si alguien gana, otro pierde (juego de suma cero)
  2. Falta de mecanismos de coordinación: No hay forma de garantizar cooperación mutua
  3. Horizonte temporal corto: Empresas priorizan ganancias trimestrales sobre sostenibilidad
  4. Externalización de costos: Puedes traicionar (contaminar, explotar) sin pagar las consecuencias completas
  5. Asimetría de información: No sabes si el otro cooperará
  6. Falta de reputación vinculante: Puedes traicionar y luego cambiar de identidad corporativa

Ejemplo Concreto: Salarios en Competencia

Dilema de las empresas:

Dos empresas compiten. Pueden pagar salarios justos o bajos.

Matriz de pagos:

  • Si ambas pagan bien: Beneficio medio, sociedad próspera (óptimo colectivo)
  • Si ambas pagan mal: Beneficio medio, sociedad empobrecida (equilibrio de Nash actual)
  • Si una paga bien y otra mal: La que paga mal tiene ventaja competitiva y expulsa del mercado a la que paga bien

Resultado: Carrera hacia el fondo. Traicionar (pagar mal) es estrategia dominante.

Consecuencia sistémica: Empobrecimiento general, demanda agregada baja, crisis económicas recurrentes.

3. El Objetivo Demárquico: De Suma Cero a Suma Positiva

La solución demárquica no es luchar contra el egoísmo, sino modificar la matriz de pagos del juego social para que la cooperación sea siempre la estrategia dominante.

La arquitectura demárquica transforma la dinámica social, haciendo que el bienestar ajeno sea una garantía del bienestar propio.

Transformación de la Matriz

Aspecto Capitalismo (Suma Cero) Demarquía (Suma Positiva)
Naturaleza del juego Tu ganancia = mi pérdida Tu ganancia = mi ganancia (AU50)
Estrategia dominante Traicionar (competir) Cooperar (colaborar)
Equilibrio de Nash Ambos traicionan (subóptimo) Ambos cooperan (óptimo)
Consecuencia de traición Ganancia a corto plazo Pérdida de CdC = suicidio estratégico
Horizonte temporal Corto (trimestral) Largo (siglos con longevidad extendida)
Información Asimétrica, opaca Simétrica, transparente (blockchain)
Reputación Débil, no vinculante Fuerte, permanente (CdC)

Nueva Matriz de Pagos Demárquica

Ciudadano B
Cooperar Traicionar
Ciudadano A Cooperar A: +10, B: +10
(AU50 + DP + CdC alto)
Estrategia dominante
A: +5, B: +3
(A obtiene DP, B pierde CdC)
Traicionar A: +3, B: +5
(A pierde CdC, B obtiene DP)
A: -5, B: -5
(Ambos pierden CdC)
Equilibrio inestable

Análisis:

  • Cooperar/Cooperar ahora da la mayor recompensa (+10, +10)
  • Traicionar tiene un costo severo (pérdida de CdC) que supera cualquier ganancia a corto plazo
  • La estrategia dominante se invierte: Cooperar es ahora óptimo
  • El equilibrio de Nash coincide con el óptimo de Pareto

4. Mecanismos que Anulan la Defección

Varios pilares de la Demarquía trabajan en conjunto para garantizar que la cooperación sea la estrategia óptima a largo plazo, desactivando el Dilema del Prisionero.

A. Asociación Universal al 50% (AU50)

El AU50 garantiza que la sociedad (el Fondo Común) aporte el 50% del capital y reciba el 50% de las ganancias.

Alineación de Beneficios:

Si un ciudadano tiene éxito en un proyecto, ese valor entra en el Fondo Común y se redistribuye a todos los ciudadanos a través del Dividendo Planetario (DP).

Si tu socio (el Fondo Común, es decir, el resto de la humanidad) prospera, tú prosperas automáticamente.

Esto convierte el juego en suma positiva: Tu éxito me beneficia literalmente porque recibo mi parte del DP.

Alineación de Riesgos:

Si un proyecto fracasa honestamente, la sociedad absorbe su mitad del golpe. Esto elimina el miedo existencial al riesgo, lo que permite a los individuos asumir riesgos productivos (innovar) sin ser aplastados por la deuda en caso de fallar.

Esto hace que la opción de colaborar y crear sea inherentemente más segura que la opción de aislarse o acaparar.

Efecto en la matriz:

Sin AU50 Con AU50
Si colaboro y tú ganas → Yo no gano nada Si colaboro y tú ganas → Yo gano automáticamente (vía DP)
Si colaboro y fallo → Pierdo todo Si colaboro y fallo → Pierdo solo 50% (sociedad absorbe el resto)
Incentivo: No colaborar (riesgo asimétrico) Incentivo: Colaborar (riesgo compartido, ganancia compartida)

B. Capital de Confianza (CdC) y la Longevidad

El Dilema del Prisionero es más difícil de resolver en un juego de una sola interacción o cuando el horizonte temporal es corto. La Demarquía lo transforma en un juego repetido con consecuencias permanentes.

Reputación como Activo Principal:

El CdC mide la integridad y la competencia. En un sistema donde la longevidad se extiende potencialmente por siglos, la pérdida de CdC por fraude se convierte en un suicidio estratégico.

Análisis de largo plazo:

  • Traicionar una vez: Ganas 10.000€ hoy
  • Perder CdC: Pierdes acceso a oportunidades por 250 años
  • Valor presente neto de oportunidades perdidas: Millones de euros

Conclusión: La traición es económicamente irracional incluso para el más egoísta.

Costo de la Deshonestidad:

El fraude se paga mucho más caro que el fracaso honesto. La honradez deja de ser una virtud moral para ser la estrategia económicamente óptima.

Esto desalienta la defección inmediata, ya que el beneficio a corto plazo se borra por la pérdida de reputación a largo plazo.

Efecto en la matriz:

Sin CdC Con CdC + Longevidad
Traicionar puede ser rentable si no te pillan Traicionar destruye tu CdC permanentemente
Horizonte temporal: ~30 años productivos Horizonte temporal: ~300 años productivos
Valor de reputación: Limitado Valor de reputación: Órdenes de magnitud mayor
Incentivo: Arriesgar traición Incentivo: Preservar reputación a toda costa

C. Oxidación Selectiva (Demurrage)

La Oxidación Monetaria penaliza el capital líquido inactivo (ej: 1% mensual), obligando a invertir por puro interés propio.

Incentivo contra el Acaparamiento:

Si el dinero se estanca, se evapora. Esto obliga a los individuos, por puro egoísmo, a poner el capital a trabajar en proyectos productivos, invertir en el MIR, o prestarlo al Fondo Común.

Fin de la Ganancia por Inacción:

Elimina el beneficio por acaparamiento (una forma de defección económica). El capital se convierte en un activo caliente que debe ser gestionado activamente en beneficio del sistema, alineando el interés del acumulador de riqueza con la necesidad de inversión de la sociedad.

Efecto en la matriz:

Dilema clásico de inversión:

  • Cooperar (invertir en proyecto colectivo): Riesgo compartido
  • Traicionar (acumular dinero): Seguridad garantizada

Con oxidación:

  • Cooperar (invertir): Preservas capital + potencial retorno
  • Traicionar (acumular): Pierdes -1% mensual = -12% anual

Nueva estrategia dominante: Invertir (cooperar)

D. Transparencia Total (Blockchain)

El Dilema del Prisionero se agrava por la asimetría de información: no sabes si el otro cooperará.

La Blockchain y la transparencia total eliminan esta asimetría.

Información perfecta:

  • Todas las transacciones son públicas
  • Todos los compromisos son verificables
  • Todo el historial es inmutable

Efecto en la matriz:

Con asimetría de información Con transparencia total
No sé si el otro cooperará → Mejor traicionar por seguridad Sé que el otro cooperará (su CdC alto lo garantiza) → Seguro cooperar
Puedo traicionar y ocultar → Incentivo a traicionar No puedo ocultar traición → Desincentivo a traicionar
Resultado: Defección mutua Resultado: Cooperación mutua

E. Fondo Solidario de Riesgos (FSR)

El FSR elimina el miedo existencial que obliga a "traicionar" (competir destructivamente) por supervivencia.

Piso de seguridad:

  • Cobertura universal automática
  • No puedes perderlo todo
  • Fallo honesto no te destruye

Efecto en la matriz:

Sin FSR: "Debo competir agresivamente o moriré de hambre" → Estrategia de supervivencia = traicionar

Con FSR: "Tengo piso mínimo garantizado, puedo cooperar sin miedo existencial" → Estrategia óptima = cooperar

5. Comparación de Equilibrios

Sistema Tradicional (Dilema Activo)

Características:

  • Juego de suma cero
  • Información asimétrica
  • Horizonte temporal corto
  • Sin reputación vinculante
  • Sin mecanismos de coordinación

Equilibrio de Nash: Defección mutua (todos pierden)

Resultado: Competencia destructiva, desconfianza, suboptimalidad

Sistema Demárquico (Dilema Resuelto)

Características:

  • Juego de suma positiva (AU50)
  • Información simétrica (blockchain)
  • Horizonte temporal largo (longevidad)
  • Reputación vinculante (CdC)
  • Mecanismos de coordinación (MI, AsC, ASI-AdC)

Equilibrio de Nash: Cooperación mutua (todos ganan)

Resultado: Colaboración constructiva, confianza, optimalidad de Pareto

6. Casos de Estudio

Caso 1: Competencia Empresarial → Colaboración Productiva

Capitalismo:

  • Dos empresas compiten por cuota de mercado
  • Estrategia dominante: Reducir costos (explotación laboral, contaminación)
  • Resultado: Carrera hacia el fondo, ambas explotan

Demarquía:

  • Dos empresas en el mismo sector
  • AU50: Ambas aportan 50% al FC, reciben 50% del valor total creado
  • Si una mejora su proceso, ambas se benefician (vía DP)
  • CdC: Explotar reduce tu reputación → pierdes acceso a talento
  • Estrategia dominante: Optimizar calidad y sostenibilidad
  • Resultado: Carrera hacia la excelencia, ambas prosperan

Caso 2: Tragedia de los Comunes → Gestión Sostenible

Capitalismo:

  • Pescadores comparten un caladero
  • Estrategia dominante: Pescar lo máximo posible antes que otros
  • Resultado: Sobreexplotación, colapso del recurso

Demarquía:

  • Caladero gestionado por FC
  • Oxidación: Capital no invertido en sostenibilidad se evapora
  • CdC: Sobreexplotar reduce tu acceso a futuros proyectos
  • MI: Mercados predicen colapso si no se respetan cuotas
  • AsC: Ajusta cuotas basándose en predicciones de MI
  • Estrategia dominante: Respetar límites sostenibles
  • Resultado: Recurso se mantiene indefinidamente

Caso 3: Innovación Tecnológica

Capitalismo:

  • Empresas ocultan innovaciones (patentes, secretos comerciales)
  • Estrategia dominante: Monopolizar conocimiento
  • Resultado: Innovación lenta, duplicación de esfuerzos

Demarquía:

  • AU50: 50% del valor de la innovación va al FC
  • Si compartes conocimiento, otros lo mejoran → tu parte del FC aumenta
  • CdC: Compartir conocimiento aumenta reputación
  • Estrategia dominante: Colaboración abierta
  • Resultado: Aceleración exponencial de innovación

7. Análisis Matemático

Valor Esperado de Estrategias

En capitalismo:

  • E(Cooperar) = P(otro coopera) × (+3) + P(otro traiciona) × (-5)
  • E(Traicionar) = P(otro coopera) × (+5) + P(otro traiciona) × (-1)

Si P(otro coopera) < 0.75, entonces E(Traicionar) > E(Cooperar)

En Demarquía:

  • E(Cooperar) = P(otro coopera) × (+10) + P(otro traiciona) × (+5) - Costo_oxidación_si_no_cooperas
  • E(Traicionar) = P(otro coopera) × (+3) + P(otro traiciona) × (-5) - Pérdida_CdC

Análisis:

  • Pérdida_CdC >> cualquier ganancia a corto plazo
  • Costo_oxidación hace que no cooperar sea costoso incluso si no traicionas activamente
  • Para cualquier P: E(Cooperar) > E(Traicionar)

Juegos Repetidos e Iterados

Teorema (Axelrod, 1984): En juegos repetidos infinitamente, la estrategia "Tit-for-Tat" (cooperar primero, luego imitar al otro) puede estabilizar la cooperación.

Aplicación Demárquica:

  • Longevidad extendida = juego "casi infinito" (300+ rondas)
  • CdC = memoria perfecta de comportamiento pasado
  • Blockchain = registro inmutable de "tit-for-tat"
  • Resultado: Cooperación se vuelve equilibrio de Nash robusto

8. Críticas y Limitaciones

A. "Asume Racionalidad Perfecta"

Crítica: Los humanos no son perfectamente racionales.

Respuesta:

  • Los mecanismos están diseñados para ser robustos ante irracionalidad limitada
  • ASI-AdC ayuda a humanos a entender consecuencias de sus acciones
  • La mayoría solo necesita ser "racionalmente egoísta", no perfectamente racional

B. "Requiere Horizonte Temporal Largo"

Crítica: Sin longevidad extendida, CdC puede no ser suficiente incentivo.

Respuesta:

  • Incluso con vida normal, CdC afecta oportunidades durante 30-40 años
  • Los mecanismos (AU50, Oxidación, FSR) funcionan independientemente de longevidad
  • Longevidad simplemente amplifica el efecto

C. "Vulnerable a Coordinación para Traicionar"

Crítica: ¿Y si un grupo se coordina para traicionar colectivamente?

Respuesta:

  • Transparencia total hace coordinación secreta imposible
  • MI detecta desviaciones y alertan a AsC
  • CdC se pierde para todo el grupo coordinado
  • Costo de coordinación >> beneficio de traición coordinada

9. Conclusión

El Dilema del Prisionero no es una ley inmutable de la naturaleza humana. Es una consecuencia de reglas del juego mal diseñadas.

La Demarquía Planetaria demuestra que, mediante el Diseño de Mecanismos inteligente basado en el Principio de Mínima Acción, es posible crear un sistema donde:

  • La cooperación es la estrategia dominante
  • El equilibrio de Nash coincide con el óptimo de Pareto
  • El egoísmo racional conduce al bien común
  • La traición es económicamente irracional

El Dilema del Prisionero se resuelve no combatiendo el egoísmo humano, sino canalizándolo inteligentemente mediante incentivos estructurales.

Síntesis final:

La Demarquía no te pide que seas altruista. Te diseña un mundo donde ser egoísta te obliga a hacer el bien.

El Dilema del Prisionero se resuelve cuando traicionar es más costoso que cooperar, y cooperar es más rentable que competir.

Conceptos Relacionados

Concepto Relación
Teoría de Juegos Dilema del Prisionero es el ejemplo paradigmático
Diseño de Mecanismos Modificación de matriz de pagos para resolver el dilema
Egoísmo Ilustrado Filosofía que canaliza egoísmo hacia cooperación
AU50 Convierte juego en suma positiva
CdC Capital de Confianza Hace traición costosa a largo plazo
Oxidación Monetaria Elimina incentivo a acumular (defección pasiva)
Principio de Mínima Acción Cooperar se vuelve camino de menor resistencia
Tragedia de los Comunes Caso especial de Dilema del Prisionero multijugador
Equilibrio de Nash En Demarquía coincide con óptimo de Pareto

Véase También

Referencias

  • Tucker, A. W. (1950). "A Two-Person Dilemma"
  • Axelrod, R. (1984). The Evolution of Cooperation
  • Rapoport, A. & Chammah, A. (1965). Prisoner's Dilemma
  • Dawes, R. M. (1980). "Social Dilemmas"
  • Ostrom, E. (1990). Governing the Commons (soluciones al dilema)
  • Binmore, K. (2007). Game Theory: A Very Short Introduction
  • Nowak, M. (2006). "Five Rules for the Evolution of Cooperation"