Índice de contenidos: Programación estadística con R
- Introducción.
- Descarga y manuales oficiales.
- Moocs para aprender R.
- Nivel avanzado.
- Libros recomendados.
Programación estadística con R
R es un lenguaje de programación distribuido como software libre (GNU/ GPL) que dispone de un entorno de desarrollo y generación de gráficos estadísticos.
El lenguaje R es ampliamente utilizado entre la comunidad científica, estadística y minería de datos (muy de moda actualmente debido al auge del Big Data / Data Science).
R puede ser considerado como una implementación diferente de S. Hay algunas diferencias importantes, pero mucho código escrito para S se ejecuta sin problema en R.
El lenguaje de programación R proporciona una amplia variedad de estadística ( modelos lineales y no lineales , pruebas estadísticas clásicas, análisis de series temporales , clasificación , agrupamiento , … ) y las técnicas gráficas, y es altamente extensible.
El lenguaje S es a menudo el vehículo de elección para la investigación en metodología estadística. R proporciona una ruta de código abierto a la participación en esa actividad.
Uno de los puntos fuertes de R es la facilidad con la que bien diseñados parcelas con calidad de publicación se pueden producir, como símbolos matemáticos y fórmulas cuando sea necesario.
Se ha descuidado las opciones de diseño de menor importancia en los gráficos, pero el usuario mantiene el control total. Por otro lado, dispone de un IDE para un desarrollo más amigable RStudio, el cual dispone de una versión Opensource y una versión PRO.
El software R está disponible como software libre bajo los términos de la GNU General Public License de la Free Software Foundation en forma de código fuente. Aunque también dispone de una protente versión PRO, tanto local como server.
Se compila y se ejecuta en una amplia variedad de plataformas UNIX y sistemas similares (incluyendo FreeBSD y Linux) , Windows y MacOS.
R es un conjunto integrado de servicios de software para la manipulación de datos, cálculo y representación gráfica.
Incluye un manejo eficaz de los datos y la instalación de almacenamiento, un conjunto de operadores para los cálculos de matrices, en matrices particulares, una coherente colección integrada de herramientas intermedias para el análisis de datos.
Facilidades gráficas para el análisis y visualización de datos ya sea en pantalla o en papel, y un lenguaje sencillo y eficaz bien desarrollado de programación que incluye condicionales, bucles, definidos por el usuario y funciones recursivas de entrada y salida de las instalaciones.
El término «entorno» se pretende caracterizar como un sistema totalmente planificado y coherente , en lugar de una acumulación gradual de herramientas muy específicas y poco flexibles, como suele ser el caso con otro software de análisis de datos.
Tanto R, como S, está diseñado en torno a un lenguaje de programación real, y permite a los usuarios añadir funcionalidad adicional mediante la definición de las nuevas funciones.
Gran parte del sistema es a su vez escrita en el dialecto R de S, lo que hace que sea fácil para los usuarios a seguir las decisiones algorítmicas hechos.
Para tareas computacionalmente intensivas, C , C + + y Fortran se puede vincular y llamó en tiempo de ejecución . Los usuarios avanzados pueden escribir código C para manipular directamente los objetos R.
Muchos usuarios ven a R como un sistema de estadísticas. Preferimos pensar en él de un entorno en el que se aplican técnicas estadísticas.
R puede ser extendido (fácilmente ) a través de paquetes. Hay alrededor de ocho paquetes suministrados con la distribución de R y muchos más están disponibles a través de la familia CRAN de sitios de Internet que cubren una amplia gama de estadísticas modernas.
R tiene su propio formato de documentación LaTeX como, que se utiliza para suministrar una amplia documentación , tanto en línea en varios formatos y en papel.
Nota: te recomendamos profundizar en el procesado de datos a través de carga y transformación de datos. Su limpieza y filtrado.
Revisa en que consiste el aprendizaje no supervisado, los modelos y sus aplicaciones. Así como el aprendizaje reforzado utilizando R.
Descargas y manuales en la web r-project.org
Requisitos mínimos: este software dispone de una versión opensource. Compatible con Windows, macOS y diferentes distribuciones de Linux; Ubuntu, Fedora/Red Hat, Debian, OpenSUSE.
En su última versión se indican como requisitos mínimos ejecutarse en equipos con al menos 4 GB de RAM y procesadores de 2 núcleos.
También, te recomendamos este excelente manual sobre R y sus paquetes de extensión de la Universidad de Valencia.
MOOCs sobre el lenguaje de programación R
- R Programming en coursera.org. «En este curso aprenderá cómo programar en R y cómo usar R para un análisis de datos efectivo.
-
- Aprenderá cómo instalar y configurar el software necesario para un entorno de programación estadística y describirá los conceptos genéricos del lenguaje de programación a medida que se implementan en un lenguaje estadístico de alto nivel.
-
- El curso cubre problemas prácticos en informática estadística que incluyen programación en R, lectura de datos en R, acceso a paquetes R, escritura de funciones R, depuración, creación de perfiles de código R y organización y comentario del código R.
-
- Los temas del análisis de datos estadísticos proporcionarán ejemplos de trabajo.»
- Introduction to R for Data Science en edX. «Fundamentos introductorios del lenguaje R y sintaxis básica. Qué es R y cómo se usa para realizar el análisis de datos. Familiarizarse con las principales estructuras de datos R. Crea tus propias visualizaciones usando R».
- Análisis Estadístico de datos con R (2ª Edición) en miriadax.net. «R es un entorno informático de computación estadística y de generación de gráficos. R funciona en un amplio rango de sistemas operativos como UNIX, Windows o MacOS.
- Pese a su potencialidad, versatilidad y flexibilidad; R puede parecer árido en el momento en que el usuario trata de interaccionar con sus componentes.
- Se suele decir que “la curva de aprendizaje es lenta”. Sin embargo, los resultados que produce son ampliamente satisfactorios. Este curso está destinado a “lubricar” esos primeros encuentros con éste entorno estadístico.»
Programación con R avanzado (en desarrollo)
Módulo 1: Introducción a la programación avanzada con R
- 1.1 Repaso de conceptos básicos de R
- 1.2 Estructuras de control de flujo avanzadas
- 1.3 Funciones avanzadas
- 1.4 Manejo de errores y depuración
- 1.5 Paquetes avanzados para R
Módulo 2: Técnicas de programación avanzada en R
- 2.1 Programación orientada a objetos en R
- 2.2 Metaprogramación en R
- 2.3 Rcpp y programación en C++ para R
- 2.4 Integración con otros lenguajes de programación
- 2.5 Desarrollo de paquetes R
Módulo 3: Aplicaciones avanzadas de R
- 3.1 Análisis de datos de gran volumen
- 3.2 Aprendizaje automático y minería de datos
- 3.3 Visualización de datos avanzada
- 3.4 Computación en la nube con R
- 3.5 R para la ciencia de datos
Módulo 4: Proyectos avanzados con R
- 4.1 Definición y planificación de proyectos de R
- 4.2 Gestión de versiones y control de calidad
- 4.3 Despliegue de aplicaciones R
- 4.4 Ética y buenas prácticas en el desarrollo de R
- 4.5 Recursos para la comunidad R
Recursos adicionales:
- Glosario de términos
- Bibliografía
- Enlaces a recursos en línea
Nota: Este índice de contenidos es solo una sugerencia y puede ser adaptado a las necesidades específicas del curso.
Consideraciones adicionales
- El nivel de profundidad de cada tema debe ajustarse en función de los conocimientos previos de los estudiantes.
- Es importante incluir ejemplos prácticos y ejercicios en cada módulo para que los estudiantes puedan aplicar los conceptos aprendidos.
- Se recomienda utilizar recursos en línea y herramientas de código abierto para facilitar el aprendizaje.
- Es importante fomentar la participación de los estudiantes en el curso mediante debates, foros y proyectos en grupo.
Bibliografía recomendada del lenguaje de programación R
Como siempre indicamos en nuestros tutoriales, es muy importante disponer de un buen texto de referencia, estos son algunos de los más populares entre los estudiantes de programación en R.
R en profundidad. Programación, gráficos y estadística por RCLIA|#RC LIBROS. Dirigido a estudiantes y profesionales de: Ingeniería. Matemáticas. Estadística. Marketing. El libro incluye una gran cantidad de ejercicios que permiten al lector realizar prácticas de aprendizaje y formación.
Programación y estadística con R: Fundamentos de programación y técnicas para el análisis exploratorio, contraste de hipótesis y aprendizaje automático por Independently published.
«Este libro consta de dos partes, en la primera, denominada Programación, se describe el fundamento del lenguaje de programación R sin hacer referencia expresa a la estadística.
En la segunda parte del libro, titulada Estadística, se aborda de forma directa tres aspectos de especial importancia en el análisis de datos: Análisis exploratorio, contraste de hipótesis y modelos de clasificación (aprendizaje automático).
El análisis exploratorio proporciona las técnicas para conocer los datos. Estadísticos clásicos como la media o varianza (entre otros) y técnicas mucho más sofisticadas como el análisis de conglomerados o el análisis de componentes principales.
El contraste de hipótesis permite comprobar el ajuste de nuestros datos a estadísticos o distribuciones teóricas, tales como la comparación de medias, varianzas, intervalos de confianza o pruebas de normalidad, entre otros.
Por último, el capítulo dedicado a los modelos constituye la parte más avanzada del libro ya que se proporcionan técnicas de clasificación y predicción de datos como la regresión múltiple, logística, árboles de clasificación, redes neuronales, etc.»
Introducción a la programación con R: R como primer lenguaje de programación, orientado a la aplicación científica por Independently published.
«El desarrollo de la toma de decisiones a partir del análisis de datos masivos (Big data), la inteligencia artificial o la robótica, por poner unos ejemplos, hace que cada vez sea más necesario tener conocimientos de programación.
Este libro introduce a R como lenguaje de inicio a la programación. Se pretende que R sea utilizado como primer lenguaje de programación, por lo que se puede aprender a programar partiendo del nivel más básico con un lenguaje, como es R, de amplia difusión en el mundo de la ciencia y la ingeniería.
Está especialmente pensado para aquellos que necesitan la programación en la resolución de problemas básicos relacionados con el mundo de la ciencia y la técnica, pero en el que no se aborda de forma directa el análisis de datos ni la metodología estadística.»
R. Lenguaje de programación y análisis estadístico de datos por Ibergarceta Publicaciones S.L.
«R es un lenguaje y entorno de programación que, además, proporciona un amplio abanico de herramientas estadísticas y gráficas, enriquecido con la posibilidad de cargar diferentes bibliotecas o paquetes con finalidades específicas de análisis estadístico.»
Os leo en comentarios, espero que esta pequeña guía te resulte útil para aprender programación con R.
Rubén D. dice:
Compartir con el grupo que los interesados en Analytics y estudiar para data scientist, la programación estadística en R es fundamental. Haceros con un buen libro, funcionan por comando como los programas serios de antes.
Alex Carvajal dice:
Gracias, por compartir, busco manual de ayuda al uso de R para el análisis de Data Analytics