Conteo y Probabilidad
Secuencia Didáctica 5

Probabilidad Discreta y Sistemas de Recomendación

Una aplicación práctica de los principios de probabilidad discreta, probabilidad condicional y el Teorema de Bayes en el diseño de un algoritmo clasificador de recomendación.

zoom_in

Detalles de la Unidad

Asignatura: Matemáticas Discretas
Unidad Temática: Unidad 5: Conteo y probabilidad
Subtemas: 5.1 Regla de suma y del producto | 5.5 Probabilidad y valor esperado | 5.6 Probabilidad condicional, fórmula de Bayes y eventos independientes
Rol de la Inteligencia Artificial Generativa (IAG): El alumno utilizará a la Inteligencia Artificial Generativa como tutor de programación en el desarrollo del proyecto.

Actividad 1: Conceptos Matemáticos

Objetivo: El alumno comprenderá los conceptos básicos de teoría de probabilidad discreta y repaso de reglas de conteo.

Modalidad: Trabajo en equipos de 5 personas.

Entregable (Producto): Resumen escrito (formulario).

Recursos: Libro de texto de referencia: Johnsonbaugh, R. (2005). Matemáticas Discretas (6ª Ed). Pearson.

Indicaciones paso a paso

  1. Recuperación de saberes previos: Responder por escrito en plenaria a las siguientes preguntas iniciales:
    • ¿Qué es probabilidad?
    • ¿Qué es una función de probabilidad?
    • ¿Qué significa que dos eventos sean mutuamente excluyentes?
  2. Lectura colaborativa: Realizar en equipo la lectura de las secciones 6.4 y 6.5 del libro de texto. Anotar las dudas teóricas que surjan.
    Nota: Esta lectura sirve a modo de repaso, ya que estos conceptos coinciden con la materia de Probabilidad y Estadística que se imparte en el mismo semestre.
  3. Discusión grupal: Compartir conclusiones en grupo con la moderación del profesor para resolver las dudas sobre las lecturas.
  4. Resumen Formulario: Elaborar de forma colaborativa un formulario/resumen que sirva de guía rápida de referencia para las secciones 6.4 y 6.5.

Actividad 2: Desarrollo del Proyecto

Objetivo: El alumno aplicará los conceptos de teoría de probabilidad discreta y Teorema de Bayes en la implementación de un sistema de recomendación sencillo.

Modalidad: Trabajo en equipos de 5 personas.

Entregable (Producto): Código fuente del sistema de recomendación.

Recursos: Guía: Rodríguez García, A. & Chimal Mosso, J. E. (2020). Aplicaciones del Teorema de Bayes en Aprendizaje de Máquinas: creación de un sistema de recomendaciones (Proyecto PAPIME PE107420) | ChatGPT.

Indicaciones paso a paso

  1. Entendiendo el problema: Realizar la lectura colaborativa de la guía "Aplicaciones del Teorema de Bayes en Aprendizaje de Máquinas: creación de un sistema de recomendaciones".
  2. Desarrollo en Python: Implementar en equipo el sistema de recomendación detallado en la lectura. Se recomienda fuertemente el uso de Python debido a que la guía base está orientada a este lenguaje.
  3. Uso de la IA como tutor de programación: Durante la codificación, hacer consultas específicas a ChatGPT para resolver dudas del lenguaje de programación o sintaxis (por ejemplo, entender una instrucción como Tabla = pd.read_csv("bebidas.csv", index_col=0) o preguntar cómo realizar una operación en Python).
    Importante: Solo es válido formular preguntas puntuales y explicaciones del lenguaje; no está permitido solicitar a la IA que genere o resuelva el código completo por el equipo.

Actividad de Aprendizaje Sugerida

Ejercicio Interactivo

Ajusta las probabilidades a priori y condicionales de un detector de correo basura (Spam) y observa cómo el simulador aplica el Teorema de Bayes para calcular la probabilidad posterior en tiempo real.

P(Spam) - Probabilidad de que un correo sea Spam: 20%
P(Gratis | Spam) - Que contenga "Gratis" dado que es Spam: 80%
P(Gratis | No Spam) - Que contenga "Gratis" siendo legítimo: 10%
Cálculo de Probabilidad Posterior (Teorema de Bayes)
P(No Spam) = 1 - P(Spam) = 0.80
P(Gratis) = P(Gratis|Spam)·P(Spam) + P(Gratis|NoSpam)·P(NoSpam) = 0.24
P(Spam | Gratis) = [P(Gratis|Spam) · P(Spam)] / P(Gratis)
P(Spam | Gratis) = [0.80 · 0.20] / 0.24 = 66.67%
Probabilidad de ser SPAM Probabilidad de ser LEGÍTIMO (Ham)
66.67%
33.33%
"Si un correo electrónico contiene la palabra 'Gratis', el agente estima que hay un 66.67% de probabilidad de que sea correo basura."