Entre los días 30 de mayo y 24 de junio se va a desarrollar el III Curso Online de Introducción al análisis de datos con R, co-organizado por el Consejo Superior de Investigaciones Científicas (CSIC) y la Asociación Española de Climatología (AEC), y en el que este año participará también la Sociedad Latinoamericana en Percepción Remota y Sistemas de Información Espacial (SELPER).
El curso está dirigido a climatólogos, meteorológos, geógrafos, físicos, ingenerios, estadísticos, matemáticos, economistas, o a cualquiera interesado en el análisis de datos, y tiene como objetivo la adquisición de las siguientes competencias:
- Consulta, creación y gestión de conjuntos de datos.
- Cálculo de estadísticas básicas y creación de salidas gráficas.
- Introducción a las técnicas de análisis estadístico multivariante.
El curso está orientado a personas sin conocimientos previos de R, y tiene una orientación práctica. El programa del curso será el siguiente:
Semana 1: Introducción a R: instalación, entorno de trabajo, objetos, clases y operadores, funciones, lectura y escritura de datos
1 — Introducción a R. Origen y características de R, ventajas (y desventajas) con relación a otros sistemas.
2 — Instalando R. Descarga e instalación de R en distintos sistemas operativos. Utilización de entornos de trabajo.
3 — La ayuda de R. Conociendo los diferentes sistemas de ayuda de R.
4 — Objetos y tipos. Conociendo los objetos y tipos básicos.
5 — Operadores. Conociendo los principales operadores en R.
6 — Vectores y matrices. Profundizando en el manejo de vectores y matrices.
7 — Data frames y listas. Profundizando en el manejo de data frames y listas.
8 — Librerías y paquetes. Manejo de funciones y colecciones de funciones (librerías).
9 — Lectura y escritura de ficheros. Aprendiendo a leer y escribir datos, scripts y objetos de R.
Semana 2: Estadísticos descriptivos, gráficos básicos, recursión, reestructuración de datos
10 — Estadísticos descriptivos. Obtener estadísticos descriptivos univariados básicos a partir de un conjunto de datos.
11 — Aplicar funciones sobre las dimensiones de un objeto. Recursión: aplicar una función sobre los elementos de vectores, matrices y data frames, agregación de datos.
12 — Gráficos básicos. Introducción a los gráficos con R.
13 — Funciones. Miscelánea de funciones útiles.
14 — Reestructuración de datos. Conociendo la librería reshape: reestructuración de conjuntos de datos.
Ejercicio práctico: ejercicio completo de lectura y reestructuración de un conjunto de datos, y obtención de estadísticos descriptivos a distintos niveles de agregación.
Semana 3. Distribuciones de probabilidad, introducción al análisis univariado
15 — Distribuciones de probabilidad. Trabajando con funciones de distribución de probabilidad.
16 — Pruebas univariadas. Utilización de algunas pruebas estadísticas univariadas de amplio uso.
Ejercicio práctico: ejercicio completo de lectura y reestructuración de datos, y aplicación de pruebas univariadas.
17 — Correlación y regresión simple. Pruebas de correlación e introducción al análisis de regresión lineal.
Ejercicio práctico: ejercicio completo de lectura de datos, análisis exploratorio y regresión lineal.
Semana 4. Introducción al análisis multivariante
18 — Gráficos avanzados. Cómo crear gráficos complejos con las funciones básicas de R, y utilización de sistemas gráficos alternativos (librerías lattice y ggplot).
19 — Regresión múltiple. Introducción a la regresión múltiple. Diagnósticos de regresión.
20 — Regresión múltiple II. Modelos con covariables y factores (ANCOVA).
Ejercicio práctico: ejercicio completo de lectura de datos, análisis exploratorio y regresión múltiple.
Con una duración total aproximada de 30 horas, y se desarrollará en modalidad online (no presencial). Cada semana a lo largo del mes de junio se liberará un bloque de contenido, dividido en lecciones. En cada módulo habrá una presentación general de tipo teórico, ejemplos guiados y ejercicios prácticos obligatorios que deberán ser completados por cada alumno o alumna. Se proporcionará material adicional para quienes quieran ampliar, y habrá un foro online para poder hacer preguntas y debatir temas con el profesor y los demás alumnos. Será obligatorio obtener una puntuación mínima y terminar los módulos dentro de los plazos temporales establecidos para poder obtener el diploma del curso.
Posteriormente se celebrará el Curso Avanzado de Análisis de Datos Espaciales con R, del 28 de junio al 1 de julio de 2015. En este caso se trata de un curso de especialización, por lo que se requieren conocimientos previos de R por parte de los alumnos.
Para más información, estad atentos a esta página o a la página web de la Asociación Española de Climatología.
Sin comentarios