Skip to content

sofiazorrilla/data.table_long

Repository files navigation

data.table

Repositorio de taller de introducción al paquete data.table

Requisitos

  1. Principalmente necesitarás instalar el paquete data.table. Sin embargo, hay algunos paquetes adicionales que debes revisar que tengas:
     # Lista de paquetes que queremos asegurarnos que estén instalados
     packages <- c("data.table", "magrittr", "dplyr", "ggplot2")
     
     # Función para instalar paquetes si no están ya instalados
     install_if_missing <- function(package) {
       if (!require(package, character.only = TRUE)) {
         install.packages(package)
         library(package, character.only = TRUE)
       }
     }
     
     # Revisa cada paquete y lo instala si es necesario
     sapply(packages, install_if_missing)
    

Descarga de datos

  1. Asegurate de tener los archivos de universal_top_spotify_songs.csv.gz y script_ejemplos_ejercicios.R descargados. Puedes hacerlo desde R con el siguiente código:
# Para correr el tutorial necesitas una carpeta que se llame data en tu directorio de trabajo
# Si no la haz creado corre el siguiente codigo en R
## El código revisa si existe, si no crea la carpeta
# if (!file.exists("data")) {
#   dir.create("data")
# }

# Descarga el archivo de datos en la carpeta de data
# download.file(url = "https://github.com/sofiazorrilla/data.table_long/raw/main/data/universal_top_spotify_songs.csv.gz", destfile = "data/universal_top_spotify_songs.csv.gz")

# Descarga el script con los comandos del tutorial
# download.file(url = "https://raw.githubusercontent.com/sofiazorrilla/data.table_long/main/scripts/script_ejemplos_ejercicios.R", destfile = "script_ejemplos_ejercicios.R")

  1. Abre el siguiente Etherpad para pegar las respuestas de los ejercicios del taller conforme los vayamos haciendo.

Primera sesión

  1. Introducción

    • data.table como otra propuesta para manipular tablas
    • Diferencias con otros paquetes
    • Mencionar que hay integraciones entre ambos
    • Comparaciones de velocidad
    • Sintaxis
    • Cheatsheet
  2. Importar y exportar datos

    • Crear objetos data.table
    • Importar y exportar datos de archivos
    • Compatibilidad de data.table y data.frame
  3. Filtros y selección de columnas

    • Seleccionar por índices
    • Filtrar filas
    • Ordenar filas
    • Seleccionar columnas
    • Renombrar columnas
  4. Modificación de columnas

    • Operaciones sobre columnas
    • Creación de nuevas columnas
    • Operadores especiales (.N)
  5. Agrupación y concatenación de comandos

    • Agrupación por una o mas columnas
    • Cadenas de comandos
  6. Ejercicios

Segunda Sesión

  1. Unión de tablas
    • Sintaxis data.table
    • Función merge
    • Ejemplos
  2. Manipular formatos de tablas
    • Tablas anchas a largas: melt
    • Tablas largas a anchas: dcast
  3. Funciones de apply sobre columnas
    • Funciones sobre múltiples columnas (.SD)
    • Columna-lista

Recursos

  1. Lista: Statistics Globe de videos cortos sobre funcionalidades del paquete

  2. Integración de data.table con dplyr

  3. Plática de data.table Rladies STL

  4. data.table cheatsheet (Data Camp)

  5. Repositorio de data.table

  6. Wiki data.table

  7. Introducción a data.table

About

Taller de introducción al paquete data.table

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published