10/05/2026
Manuel Data Studio
Blog
10/05/2026
09/05/2026
𝐏𝐫𝐨𝐩𝐞𝐧𝐬𝐢𝐭𝐲 𝐒𝐜𝐨𝐫𝐞 𝐌𝐚𝐭𝐜𝐡𝐢𝐧𝐠
El Propensity Score Matching (PSM) es una técnica de inferencia causal utilizada en estudios observacionales para reducir el sesgo de selección en la estimación de efectos de tratamiento.
La idea central consiste en emparejar individuos tratados y no tratados con características observables similares, utilizando la probabilidad condicional de recibir el tratamiento dada un conjunto de covariables observables, conocida como propensity score.
Bajo ciertos supuestos —como independencia condicional y soporte común— el PSM permite construir un grupo de comparación más comparable y estimar efectos causales como el efecto promedio del tratamiento (ATE) o el efecto promedio sobre los tratados (ATT).
𝐏𝐚𝐬𝐨𝐬 𝐩𝐚𝐫𝐚 𝐚𝐩𝐥𝐢𝐜𝐚𝐫 𝐏𝐒𝐌
1️⃣ 𝐃𝐞𝐟𝐢𝐧𝐚 𝐥𝐚 𝐩𝐫𝐞𝐠𝐮𝐧𝐭𝐚 𝐝𝐞 𝐢𝐧𝐯𝐞𝐬𝐭𝐢𝐠𝐚𝐜𝐢𝐨́𝐧
Debe identificarse claramente:
• la variable de tratamiento,
• la variable resultado,
• y las covariables que pueden afectar simultáneamente el tratamiento y el resultado.
La selección de covariables es crucial, ya que el PSM solo controla sesgo asociado a variables observables.
2️⃣ 𝐄𝐬𝐭𝐢𝐦𝐞 𝐞𝐥 𝐏𝐫𝐨𝐩𝐞𝐧𝐬𝐢𝐭𝐲 𝐒𝐜𝐨𝐫𝐞
Generalmente se utiliza un modelo logit o probit para estimar la probabilidad de recibir el tratamiento:
P(D=1|X)
donde D representa el tratamiento y X el conjunto de covariables observables.
3️⃣ 𝐑𝐞𝐚𝐥𝐢𝐜𝐞 𝐞𝐥 𝐞𝐦𝐩𝐚𝐫𝐞𝐣𝐚𝐦𝐢𝐞𝐧𝐭𝐨
Existen distintos métodos de matching:
• nearest neighbor,
• caliper,
• kernel,
• radius,
• stratification, entre otros.
La elección depende del tamaño muestral, la calidad del soporte común y el balance entre grupos.
4️⃣ 𝐄𝐯𝐚𝐥𝐮́𝐞 𝐞𝐥 𝐛𝐚𝐥𝐚𝐧𝐜𝐞 𝐝𝐞 𝐜𝐨𝐯𝐚𝐫𝐢𝐚𝐛𝐥𝐞𝐬
El objetivo principal del PSM no es maximizar la predicción del tratamiento, sino mejorar la comparabilidad entre grupos.
Por ello, deben evaluarse:
• diferencias de medias estandarizadas,
• razones de varianza,
• overlap,
• y gráficos de balance.
Un buen matching reduce el desequilibrio observable entre tratados y controles.
5️⃣ 𝐄𝐬𝐭𝐢𝐦𝐞 𝐞𝐥 𝐞𝐟𝐞𝐜𝐭𝐨 𝐝𝐞𝐥 𝐭𝐫𝐚𝐭𝐚𝐦𝐢𝐞𝐧𝐭𝐨
Una vez logrado un balance adecuado, puede estimarse el efecto causal mediante:
• diferencia de medias,
• regresiones ajustadas,
• ponderaciones,
• o estimadores robustos.
También es importante reportar errores estándar e intervalos de confianza.
𝐂𝐎𝐌𝐄𝐍𝐓𝐀 ❞𝐒𝐂𝐎𝐑𝐄❞ 𝐘 𝐎𝐁𝐓𝐈𝐄𝐍𝐄 𝐄𝐋 𝐋𝐈𝐁𝐑𝐎 𝐀𝐔𝐓𝐎𝐌𝐀́𝐓𝐈𝐂𝐀𝐌𝐄𝐍𝐓𝐄
08/05/2026
¿𝗤𝘂𝗲́ 𝗲𝘀 𝗹𝗮 𝗽𝗿𝘂𝗲𝗯𝗮 𝗱𝗲 𝗠𝗰𝗡𝗲𝗺𝗮𝗿❓
La prueba de McNemar es una prueba de hipótesis que se utiliza para determinar si hay una diferencia significativa entre dos conjuntos de datos categóricos.
sta prueba es particularmente útil cuando se desean comparar dos métodos de diagnóstico o dos jueces que evalúan un conjunto de datos.
La prueba de McNemar se basa en la comparación de las frecuencias de los valores en cada categoría entre los dos conjuntos de datos.Software
La prueba de McNemar se utiliza comúnmente en la investigación médica para comparar los resultados de dos pruebas diagnósticas diferentes.
𝙑𝙚𝙣𝙩𝙖𝙟𝙖𝙨 𝙮 𝙙𝙚𝙨𝙫𝙚𝙣𝙩𝙖𝙟𝙖𝙨 𝙙𝙚 𝙡𝙖 𝙥𝙧𝙪𝙚𝙗𝙖 𝙙𝙚 𝙈𝙘𝙉𝙚𝙢𝙖𝙧
𝙑𝙚𝙣𝙩𝙖𝙟𝙖𝙨 𝙙𝙚 𝙡𝙖 𝙥𝙧𝙪𝙚𝙗𝙖 𝙙𝙚 𝙈𝙘𝙉𝙚𝙢𝙖𝙧
1. Sencillez: La prueba de McNemar es fácil de entender y aplicar, incluso para aquellos sin experiencia previa en estadística.
La fórmula para calcular la estadística de McNemar es simple y fácil de implementar.
2. Flexibilidad: La prueba de McNemar se puede utilizar para analizar variables categóricas con dos o más categorías.
Además, se puede aplicar a variables categóricas con más de dos categorías, utilizando reglas para definir "éxito".
3. No requiere normalidad: La prueba de McNemar no requiere que los datos sigan una distribución normal, lo que la hace útil para analizar variables categóricas que no siguen una distribución normal.
4. Puede manejar pequeñas muestras: La prueba de McNemar se puede utilizar con pequeñas muestras, lo que la hace útil cuando se tienen datos limitados.
5. Robusta: La prueba de McNemar es robusta en presencia de outliers y datos atípicos, lo que la hace confiable en diferentes situaciones.
La prueba de McNemar es una herramienta estadística versátil y fácil de usar que se puede aplicar en una variedad de contextos.
𝑫𝒆𝒔𝒗𝒆𝒏𝒕𝒂𝒋𝒂𝒔 𝒅𝒆 𝒍𝒂 𝒑𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝑴𝒄𝑵𝒆𝒎𝒂𝒓
1. Asunciones: La prueba de McNemar asume que los datos son independientes y que las variables categóricas tienen solo dos categorías.
Si estas asunciones no se cumplen, los resultados de la prueba pueden no ser válidos.
2. No es adecuada para variables continuas: La prueba de McNemar se aplica solo a variables categóricas y no es adecuada para variables continuas.
3. No proporciona medidas de efecto: La prueba de McNemar solo indica si hay una diferencia significativa entre las dos variables categóricas, pero no proporciona medidas de efecto, como el tamaño del efecto.
4. Puede ser influenciada por la tamaño de la muestra: La prueba de McNemar puede ser influenciada por el tamaño de la muestra, lo que puede afectar la precisión de los resultados.
5. No es adecuada para variables con más de dos categorías: Aunque la prueba de McNemar se puede aplicar a variables categóricas con más de dos categorías, puede ser complicado definir la categoría de "éxito" y puede requerir reglas adicionales.
07/05/2026
¿𝙌𝙪é 𝙚𝙨 𝙡𝙖 𝙥𝙧𝙪𝙚𝙗𝙖 𝙙𝙚 𝙁𝙧𝙞𝙚𝙙𝙢𝙖𝙣❓
La prueba de Friedman es un método estadístico que se puede utilizar para comparar varias muestras apareadas u observaciones repetidas.
Es un método estadístico no paramétrico utilizado para comparar varias muestras apareadas u observaciones repetidas. Es particularmente útil cuando no se cumplen las condiciones necesarias para realizar una ANOVA con medidas repetidas, especialmente cuando los datos no siguen una distribución normal o cuando el tamaño de la muestra es demasiado pequeño para hacer suposiciones sobre la normalidad.
¿𝑪𝒖𝒂́𝒏𝒅𝒐 𝒂𝒑𝒍𝒊𝒄𝒂𝒓 𝒍𝒂 𝒑𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝑭𝒓𝒊𝒆𝒅𝒎𝒂𝒏❓
𝑫𝒐𝒔 𝒇𝒂𝒄𝒕𝒐𝒓𝒆𝒔 𝒋𝒖𝒔𝒕𝒊𝒇𝒊𝒄𝒂𝒏 𝒆𝒍 𝒖𝒔𝒐 𝒅𝒆 𝒍𝒂 𝒑𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝑭𝒓𝒊𝒆𝒅𝒎𝒂𝒏.
Datos no paramétricos:
No tienen que seguir una distribución normal. Se habla de distribución normal (o curva de campana) cuando la mayoría de los valores están cerca de la media. Por ejemplo, si se mide la altura de 1,000 adultos, se puede esperar que la mayoría oscilen alrededor de 1.70 m. En tal caso, se utilizaría una prueba como la ANOVA.
Datos apareados:
Se comparan dos (y por lo tanto un par, pero pueden ser más) grupos de participantes en una prueba dada. Se someten a las mismas evaluaciones, por ejemplo, sobre bebidas, gránulos homeopáticos… Se realizan medidas repetidas sobre los mismos sujetos o objetos.
𝑳𝒐 𝒒𝒖𝒆 𝒔𝒆 𝒃𝒖𝒔𝒄𝒂 𝒐𝒃𝒕𝒆𝒏𝒆𝒓 𝒄𝒐𝒏 𝒍𝒂 𝒑𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝑭𝒓𝒊𝒆𝒅𝒎𝒂𝒏
Si retomamos los ejemplos mencionados arriba, obtenemos resultados concretos en cada caso.
Un tratamiento particular es juzgado más eficaz que los otros,
Los consumidores establecen una clasificación de los helados o smartphones probados
Dos de los métodos de enseñanza producen mejores resultados que los otros.
Un ejercicio físico específico mejora notablemente el tono de los atletas.
𝙎𝙞 𝙙𝙚𝙨𝙚𝙖𝙨 𝙖𝙥𝙧𝙚𝙣𝙙𝙚𝙧 𝙢𝙖́𝙨, 𝙥𝙪𝙚𝙙𝙚𝙨 𝙡𝙚𝙚𝙧 𝙚𝙡 𝙡𝙞𝙗𝙧𝙤 𝙨𝙞𝙜𝙪𝙞𝙚𝙣𝙩𝙚:
https://drive.google.com/file/d/1aEs1HnFsNK95z0xd0BD_tgQMrhW02puL/view?usp=sharing
07/05/2026
¿𝐐𝐮é 𝐞𝐬 𝐥𝐚 𝐜𝐮𝐫𝐭𝐨𝐬𝐢𝐬❓
La curtosis, también llamada apuntamiento, es una medida estadística que indica el grado de concentración de una distribución alrededor de su media. Es decir, la curtosis muestra si una distribución es escarpada o achatada.
𝑻𝒊𝒑𝒐𝒔 𝒅𝒆 𝒄𝒖𝒓𝒕𝒐𝒔𝒊𝒔:
𝑯𝒂𝒚 𝒕𝒓𝒆𝒔 𝒕𝒊𝒑𝒐𝒔 𝒅𝒆 𝒄𝒖𝒓𝒕𝒐𝒔𝒊𝒔:
1.Leptocúrtica: la distribución es muy apuntada, es decir, los datos están muy concentrados alrededor de la media. En concreto, las distribuciones leptocúrticas se definen como aquellas distribuciones más apuntadas que la distribución normal.
2.Mesocúrtica: la curtosis de la distribución es equivalente a la curtosis de la distribución normal. Por tanto, no se considera ni apuntada ni achatada.
3.Platicúrtica: la distribución es muy achatada, es decir, la concentración en torno a la media es baja. Formalmente, las distribuciones platicúrticas se definen como aquellas distribuciones más achatadas que la distribución normal.
¿𝐐𝐮𝐢𝐞𝐫𝐞𝐬 𝐬𝐚𝐛𝐞𝐫 𝐦𝐚́𝐬 𝐝𝐞 𝐞𝐬𝐭𝐚𝐝𝐢́𝐬𝐭𝐢𝐜𝐚❓
Si tu respuesta es sí, entonces, puedes descargar el libro "Estadística con R para dummies" usando el siguiente link:
https://drive.google.com/file/d/1lQu0eQy0F_KShk_sYWr5O_4iyqFnC1dY/view?usp=sharing
07/05/2026
🙂El boxplot
03/05/2026
🤔 ¿Qué es la estadística?
La estadística es la rama de las matemáticas que sirve para estudiar un conjunto de datos. Es decir, la estadística es la disciplina matemática que se usa para recopilar, analizar e interpretar una serie de datos.
Por ejemplo, cuando de unos datos calculamos su media o hacemos un gráfico utilizamos la estadística.
Así pues, la estadística consiste en un conjunto de métodos, procedimientos y fórmulas que permiten analizar información y extraer conclusiones de ella. El objetivo final de la estadística es comprender mejor un grupo de datos y sacar las conclusiones correctas de ese conjunto de datos.
Los conceptos básicos de estadística son los siguientes:
1.Población: conjunto de elementos con unas características similares sobre el cual se pretende hacer un estudio estadístico.
Muestra: parte de la población sobre la cual se realiza el estudio estadístico.
2.Individuo: cada uno de los elementos que forman parte de la población.
3.Carácter: cada una de las características que poseen todos los individuos de una población y que, por tanto, puede ser objeto de un estudio estadístico.
4.Muestreo: proceso por el que se selecciona la muestra de una población. Existen diferentes métodos de muestreo.
5.Variable estadística: característica de los individuos de una población que puede adoptar diferentes valores y puede medirse. Suele ser la característica que se estudia en una investigación estadística.
6.Parámetro estadístico: valor que resume las características de una muestra.
7.Experimento estadístico: procedimiento que proporciona un resultado, ya sea numérico o no numérico, y sirve para calcular la probabilidad de ocurrencia de cada posible resultado.
Haga clic aquí para reclamar su Entrada Patrocinada.
Localización
Categoría
Página web
Dirección
Avenida Fose 1212
Lima