Ha.nnes.dev
📊
DataSkimmer.jl
A Julia package that summarises tabular data in the REPL.
Language: Julia
A Julia package that gives a summary of a tabular dataset in the REPL. Based on the skimr R package.
Installation
From the Julia REPL, type ]
to enter the Pkg REPL, then run:
add https://github.com/Hasnep/DataSkimmer.jl
Or run from the Julia REPL:
import Pkg
Pkg.add(url="https://github.com/Hasnep/DataSkimmer.jl")
Example
# Load some data
using RDatasets
iris = RDatasets.dataset("datasets", "iris")
# Skim the data
using DataSkimmer
skim(iris)
┌─────────────────────┬───────────┐
│ Type │ DataFrame │
│ N. rows │ 150 │
│ N. cols │ 5 │
│ N. numeric cols │ 4 │
│ N. categorical cols │ 1 │
│ N. datetime cols │ 0 │
└─────────────────────┴───────────┘
4 numeric columns
┌─────────────┬─────────┬──────────┬──────────┬──────┬──────┬──────┬──────┬──────┬───────┐
│ Name │ Type │ Missings │ Complete │ Mean │ Std. │ Min. │ Med. │ Max. │ Hist. │
├─────────────┼─────────┼──────────┼──────────┼──────┼──────┼──────┼──────┼──────┼───────┤
│ SepalLength │ Float64 │ 0 │ 100.0% │ 5.84 │ 0.83 │ 4.3 │ 5.8 │ 7.9 │ ▂▃▃▂▁ │
│ SepalWidth │ Float64 │ 0 │ 100.0% │ 3.06 │ 0.44 │ 2.0 │ 3.0 │ 4.4 │ ▁▃▄▂▁ │
│ PetalLength │ Float64 │ 0 │ 100.0% │ 3.76 │ 1.77 │ 1.0 │ 4.35 │ 6.9 │ ▃▁▂▃▁ │
│ PetalWidth │ Float64 │ 0 │ 100.0% │ 1.2 │ 0.76 │ 0.1 │ 1.3 │ 2.5 │ ▃▁▃▂▂ │
└─────────────┴─────────┴──────────┴──────────┴──────┴──────┴──────┴──────┴──────┴───────┘
1 categorical column
┌─────────┬────────────────────────────────┬──────────┬──────────┐
│ Name │ Type │ Missings │ Complete │
├─────────┼────────────────────────────────┼──────────┼──────────┤
│ Species │ CategoricalValue{String,UInt8} │ 0 │ 100.0% │
└─────────┴────────────────────────────────┴──────────┴──────────┘
No datetime columns