Búsqueda avanzada

CRISTIAN LUIS BAYES RODRIGUEZ

CRISTIAN LUIS BAYES RODRIGUEZ

CRISTIAN LUIS BAYES RODRIGUEZ

Doctor en Ciencias, Área: Estadística, UNIVERSIDAD DE SAO PAULO

Ver todos los grados

Mestre en Ciencias, Área: Estatística (UNIVERSIDAD DE SAO PAULO)

DOCENTE ORDINARIO - PRINCIPAL
Docente a tiempo completo (DTC)
Departamento Académico de Ciencias - Sección Matemáticas

Investigaciones

Se encontraron 15 investigaciones

2018 - 2019

Regression models: Extensions and applications

Regression models are statistical tools to explain one variable as a function of others. There are applied in several areas of sciences such as education, medicine, and engineering, among others. In education, one may be interested in a) studying whether or not a student¿s drop out from school base on his/her performance during semesters, family income, and other factors (Pebes, 2015 and Rojas 2016). In the area of medicine, one is interested in a) measuring the time to the development a disease and how that is affected by an intervention and other covariates (Sal y Rosas, 2011, 2010), b) estimating the proportion of cases of a disease (prevalence). In this grant, we proposed to extend several regression models in key areas: a) survival analysis by using copula model and outcome misclassification to model time to event interval censored data, b) estimation of prevalence with test subject to misclassification using Bayesian inference, c) to develop a Bayesian approach to model the graduation process at our university, d) to develop a Bayesian approach for model where the outcome variable is limited and has panel structure. The data that generates these hard problems come from our collaboration with a) the University of Washington, b) el Centro de Excelencia en Enfermedades Crónicas, and c) the Pontificia Universidad Católica del Perú.

Participantes:

Instituciones participantes:

  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Departamento Académico de Ciencias (Financiadora)
  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Dirección de Fomento de la Investigación (DFI) (Financiadora)
  • UNIVERSIDAD DE INDIANA (Financiadora)
2016 - 2017

Modelos de regresión longitudinales para variables limitadas

En este proyecto de investigación estaremos interesados en extender el análisis de regresión para variables limitadas a datos medidos no sólo en un instante particular sino que se realicen en el tiempo o presenten alguna dependencia por conglomeración. Buscaremos también aplicar estos modelos a distintas situaciones reales como por ejemplo a un estudio sobre conocimiento de Tuberculosis (TB) y preparación para un estudio de vacunas (Shu, et.al. 2013) desarrollado en Lima. En este estudio el interés radica en analizar los factores que influyen en la proporción de respuestas correctas sobre conocimiento de TB de los familiares, lo cual presenta un efecto de conglomeración al tener las familias un entorno común. Otra vertiente de la aplicación de los modelos de regresión se centrará en el análisis de datos de supervivencia en tiempo discreto con fracción de cura, última que es una proporción. Modelos de este tipo, pero en tiempo continuo, han sido extensamente estudiados por diversos autores pero existe una muy limitada información sobre su contraparte discreta. En efecto, solo Prentice and Kalbeisch [2003], han extensamente utilizado el modelo discreto pero sin fracción de cura y Zhao et.al (2008) incorporaron recientemente esta fracción al modelo discreto. En este proyecto pretendemos culminar el análisis de un nuevo modelo de sobrevivencia con fracción de cura para datos discretos propuesto por (Valdivieso, Sal y Rosas y Bayes, 2015) en el marco del proyecto DGI0072 buscando proponer además una aplicación para determinar los factores asociados a la deserción de estudiantes de nuestra Universidad. Este mismo problema puede extenderse luego en varias direcciones como el de la consideración de riesgos competitivos y del modelamiento conjunto para el tiempo a deserción y el desarrollo longitudinal de los factores. Para este último problema existen también varias propuestas en tiempo continuo, pero muy poca bibliografía y desarrollos para el caso discreto.

Participantes:

Instituciones participantes:

  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Departamento Académico de Ciencias (Financiadora)
  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Dirección de Fomento de la Investigación (DFI) (Financiadora)
2016 - 2017

Modelos de regresión longitudinales para variables limitadas

En este proyecto de investigación estaremos interesados en extender el análisis de regresión para variables limitadas a datos medidos no sólo en un instante particular sino que se realicen en el tiempo o presenten alguna dependencia por conglomeración. Buscaremos también aplicar estos modelos a distintas situaciones reales como por ejemplo a un estudio sobre conocimiento de Tuberculosis (TB) y preparación para un estudio de vacunas (Shu, et.al. 2013) desarrollado en Lima. En este estudio el interés radica en analizar los factores que influyen en la proporción de respuestas correctas sobre conocimiento de TB de los familiares, lo cual presenta un efecto de conglomeración al tener las familias un entorno común. Otra vertiente de la aplicación de los modelos de regresión se centrará en el análisis de datos de supervivencia en tiempo discreto con fracción de cura, última que es una proporción. Modelos de este tipo, pero en tiempo continuo, han sido extensamente estudiados por diversos autores pero existe una muy limitada información sobre su contraparte discreta. En efecto, solo Prentice and Kalbeisch [2003], han extensamente utilizado el modelo discreto pero sin fracción de cura y Zhao et.al (2008) incorporaron recientemente esta fracción al modelo discreto. En este proyecto pretendemos culminar el análisis de un nuevo modelo de sobrevivencia con fracción de cura para datos discretos propuesto por (Valdivieso, Sal y Rosas y Bayes, 2015) en el marco del proyecto DGI0072 buscando proponer además una aplicación para determinar los factores asociados a la deserción de estudiantes de nuestra Universidad. Este mismo problema puede extenderse luego en varias direcciones como el de la consideración de riesgos competitivos y del modelamiento conjunto para el tiempo a deserción y el desarrollo longitudinal de los factores. Para este último problema existen también varias propuestas en tiempo continuo, pero muy poca bibliografía y desarrollos para el caso discreto.

Participantes:

Instituciones participantes:

  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Departamento Académico de Ciencias (Financiadora)
  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Dirección de Fomento de la Investigación (DFI) (Financiadora)
2015

Análisis Estadístico Flexible de Datos Longitudinales Complejos: Entendiendo el Comportamiento del Virus de Inmunodeficiencia Humana

En los últimos años, el análisis del comportamiento del Virus de Inmunodeficiencia Humana (VIH) se ha realizado a través del estudio de modelos estadísticos para datos longitudinales. Estos modelos han recibido una atención creciente en la literatura estadística. En este contexto, una práctica común para analizar las medidas longitudinales de carga viral es utilizar modelos de efectos mixtos bajo supuestos como la normalidad o la simetría de los errores aleatorios y de efectos aleatorios, la ausencia de observaciones faltantes y la ausencia de medición de errores en covariables. Aunque los datos de VIH presentan características complejas como la asimetría, las colas pesadas o ligeras, valores atípicos u observaciones influyentes, información faltante no ignorable, respuestas censuradas, errores de medición en las covariables entre muchos otros, la mayoría de las investigaciones publicadas se han concentrado sólo en la captura de ciertos aspectos específicos, propios de los casos de estudio considerados. Por tal razón, el objetivo de este proyecto de investigación es el estudio de los modelos para datos longitudinales complejas, como los de del VIH, utilizando herramientas Bayesianas no paramétricas y considerando todas las características de estos datos de forma simultánea.

Participantes:

Instituciones participantes:

  • fincyt - FINCYT (Financiadora)
  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Departamento Académico de Ciencias (Financiadora)
2014 - 2015

Modelos de Regresión para variables limitadas

Una limitación de los modelos clásicos de regresión es que estos asumen un conjunto de supuestos acerca de la naturaleza de las variables consideradas. Supuestos usuales son asumir normalidad en los errores, varianza constante (homocedasticidad) y que uno realice regresión siempre sobre la media de la variable dependiente. No obstante, existen situaciones en las que la validez y la utilidad de estos supuestos es cuestionable. Un caso de reciente interés es el análisis de una variable continua que asume valores acotados y que puede sin pérdida de generalidad transformarse al intervalo [0,1]. En tal situación el supuesto de normalidad es inadecuado, ya que esta distribución tiene soporte en toda la recta y no se limita al intervalo (0,1). Además la variablidad de los errores tiende aquí a disminuir al acercarnos a los extremos 0 y 1, violando la homocedasticidad. De otro lado, ha surgido recientemente en la literatura interés en realizar un análisis no sólo sobre la media de la variable respuesta sino también sobre sus cuantiles. En este proyecto se plantea estudiar y proponer nuevos modelos de regresión para variables limitadas, considerando (1) modelos que sean más flexibles y más robustos a la presencia de outliers, (2) modelos para datos fraccionales y (3) modelos de regresión cuantílica. En particular consideraremos los modelos de regresión para datos fraccionales siguiendo la propuesta de Bayes y Valdivieso (2013), extensiones del modelo de regresión Beta Rectangular (Bayes, Bazán y García, 2012) como su extensión a un modelo lineal mixto para variables limitadas con esta distribución y modelos de regresión para la mediana o regresión cuantílica cuando la variable dependiente sea limitada. Se explorarán también nuevas distribuciones para proporciones que tengan mejores propiedades que la distribución Beta y la metodología Bayesiana para todos estos modelos.

Participantes:

Instituciones participantes:

  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Departamento Académico de Ciencias (Financiadora)
  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Dirección de Fomento de la Investigación (DFI) (Financiadora)
2014 - 2015

Modelos de Regresión para variables limitadas

Una limitación de los modelos clásicos de regresión es que estos asumen un conjunto de supuestos acerca de la naturaleza de las variables consideradas. Supuestos usuales son asumir normalidad en los errores, varianza constante (homocedasticidad) y que uno realice regresión siempre sobre la media de la variable dependiente. No obstante, existen situaciones en las que la validez y la utilidad de estos supuestos es cuestionable. Un caso de reciente interés es el análisis de una variable continua que asume valores acotados y que puede sin pérdida de generalidad transformarse al intervalo [0,1]. En tal situación el supuesto de normalidad es inadecuado, ya que esta distribución tiene soporte en toda la recta y no se limita al intervalo (0,1). Además la variablidad de los errores tiende aquí a disminuir al acercarnos a los extremos 0 y 1, violando la homocedasticidad. De otro lado, ha surgido recientemente en la literatura interés en realizar un análisis no sólo sobre la media de la variable respuesta sino también sobre sus cuantiles. En este proyecto se plantea estudiar y proponer nuevos modelos de regresión para variables limitadas, considerando (1) modelos que sean más flexibles y más robustos a la presencia de outliers, (2) modelos para datos fraccionales y (3) modelos de regresión cuantílica. En particular consideraremos los modelos de regresión para datos fraccionales siguiendo la propuesta de Bayes y Valdivieso (2013), extensiones del modelo de regresión Beta Rectangular (Bayes, Bazán y García, 2012) como su extensión a un modelo lineal mixto para variables limitadas con esta distribución y modelos de regresión para la mediana o regresión cuantílica cuando la variable dependiente sea limitada. Se explorarán también nuevas distribuciones para proporciones que tengan mejores propiedades que la distribución Beta y la metodología Bayesiana para todos estos modelos.

Participantes:

Instituciones participantes:

  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Departamento Académico de Ciencias (Financiadora)
  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Dirección de Fomento de la Investigación (DFI) (Financiadora)
2014 - 2015

Statistical Methods for Cluster Randomized Trials

The increasing popularity of cluster-randomized trials has created many opportunities and challenges for statisticians. In recent years a variation of the traditional cluster randomized trial has been proposed called stepped wedge design trial. However, several questions have been raised about the advantages and disadvantages of the stepped wedge design compared to the traditional cluster randomized design, in particular with regard to difference in power and sample size needed to properly measure the effect of an intervention. In this project, we will develop statistical methods to 1) study the advantages/disadvantages of the stepped wedge design vs. the cluster-randomized trial, 2) develop statistical models for bounded or even fractional response variables, 3) adjust them to the analysis of a stepped wedge study and 4) develop guidelines for data analysis and reporting of stepped wedge studies. In addition, we plan to implement the methods in freely available software, which will allow it to be used by other statisticians and public health researchers. Our proposal searches not only to give a statistical insight in the discussion above but also to propose new flexible statistical models in the analysis of the response variable when we deal with cross-sectional and longitudinal data.

Participantes:

Instituciones participantes:

  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Departamento Académico de Ciencias (Financiadora)
  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Dirección de Fomento de la Investigación (DFI) (Financiadora)
  • THE UNIVERSITY OF WASHINGTON (Financiadora)
2014 - 2015

Statistical Methods for Cluster Randomized Trials

The increasing popularity of cluster-randomized trials has created many opportunities and challenges for statisticians. In recent years a variation of the traditional cluster randomized trial has been proposed called stepped wedge design trial. However, several questions have been raised about the advantages and disadvantages of the stepped wedge design compared to the traditional cluster randomized design, in particular with regard to difference in power and sample size needed to properly measure the effect of an intervention. In this project, we will develop statistical methods to 1) study the advantages/disadvantages of the stepped wedge design vs. the cluster-randomized trial, 2) develop statistical models for bounded or even fractional response variables, 3) adjust them to the analysis of a stepped wedge study and 4) develop guidelines for data analysis and reporting of stepped wedge studies. In addition, we plan to implement the methods in freely available software, which will allow it to be used by other statisticians and public health researchers. Our proposal searches not only to give a statistical insight in the discussion above but also to propose new flexible statistical models in the analysis of the response variable when we deal with cross-sectional and longitudinal data.

Participantes:

Instituciones participantes:

  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Departamento Académico de Ciencias (Financiadora)
  • PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU - Dirección de Fomento de la Investigación (DFI) (Financiadora)