Repositorio de taller de introducción al paquete data.table
- Principalmente necesitarás instalar el paquete data.table. Sin embargo, hay algunos paquetes adicionales que debes revisar que tengas:
# Lista de paquetes que queremos asegurarnos que estén instalados packages <- c("data.table", "magrittr", "dplyr", "ggplot2") # Función para instalar paquetes si no están ya instalados install_if_missing <- function(package) { if (!require(package, character.only = TRUE)) { install.packages(package) library(package, character.only = TRUE) } } # Revisa cada paquete y lo instala si es necesario sapply(packages, install_if_missing)
- Asegurate de tener los archivos de
universal_top_spotify_songs.csv.gz
yscript_ejemplos_ejercicios.R
descargados. Puedes hacerlo desde R con el siguiente código:
# Para correr el tutorial necesitas una carpeta que se llame data en tu directorio de trabajo
# Si no la haz creado corre el siguiente codigo en R
## El código revisa si existe, si no crea la carpeta
# if (!file.exists("data")) {
# dir.create("data")
# }
# Descarga el archivo de datos en la carpeta de data
# download.file(url = "https://github.com/sofiazorrilla/data.table_long/raw/main/data/universal_top_spotify_songs.csv.gz", destfile = "data/universal_top_spotify_songs.csv.gz")
# Descarga el script con los comandos del tutorial
# download.file(url = "https://raw.githubusercontent.com/sofiazorrilla/data.table_long/main/scripts/script_ejemplos_ejercicios.R", destfile = "script_ejemplos_ejercicios.R")
- Abre el siguiente Etherpad para pegar las respuestas de los ejercicios del taller conforme los vayamos haciendo.
-
Introducción
- data.table como otra propuesta para manipular tablas
- Diferencias con otros paquetes
- Mencionar que hay integraciones entre ambos
- Comparaciones de velocidad
- Sintaxis
- Cheatsheet
-
Importar y exportar datos
- Crear objetos data.table
- Importar y exportar datos de archivos
- Compatibilidad de data.table y data.frame
-
Filtros y selección de columnas
- Seleccionar por índices
- Filtrar filas
- Ordenar filas
- Seleccionar columnas
- Renombrar columnas
-
Modificación de columnas
- Operaciones sobre columnas
- Creación de nuevas columnas
- Operadores especiales (.N)
-
Agrupación y concatenación de comandos
- Agrupación por una o mas columnas
- Cadenas de comandos
-
Ejercicios
- Unión de tablas
- Sintaxis data.table
- Función merge
- Ejemplos
- Manipular formatos de tablas
- Tablas anchas a largas: melt
- Tablas largas a anchas: dcast
- Funciones de apply sobre columnas
- Funciones sobre múltiples columnas (.SD)
- Columna-lista
-
Lista: Statistics Globe de videos cortos sobre funcionalidades del paquete