Slide 1

Slide 1 text

processando textos enormes com ferramentas "unix"

Slide 2

Slide 2 text

oi! eu sou o luiz me encontre em @luiz_amf github.com/lamenezes

Slide 3

Slide 3 text

abrir/ler e processar textões arquivos de texto com mais de 8 mil 10 milhões de linhas (>4 GB) o problema

Slide 4

Slide 4 text

No content

Slide 5

Slide 5 text

“ Write programs that do one thing and do it well Write programs to work together. Write programs to handle text streams, because that is a universal interface. "Unix Philosophy" por Peter Salus

Slide 6

Slide 6 text

fazer uma coisa e fazer bem a caixa de ferramentas

Slide 7

Slide 7 text

cat concatenate files and print ▷ visualizar arquivos texto ▷ exemplo $ cat foo.txt

Slide 8

Slide 8 text

less ▷ visualizar arquivos texto ▷ permite navegação ▷ lê arquivo enquanto executa ▷ exemplo $ less foo.txt

Slide 9

Slide 9 text

cp copy ▷ sempre tenha um backup de seus dados ▷ exemplo $ cp foo.txt backup.txt

Slide 10

Slide 10 text

head & tail ▷ imprime X linhas do arquivo ▷ dividir e conquistar ▷ exemplos $ head foo.txt -n 20 $ tail foo.txt -n 50

Slide 11

Slide 11 text

▷ qual o tamanho da bronca? ▷ calcula do arquivo ○ linhas ○ caracteres/bytes ○ palavras ▷ exemplo $ wc foo.txt wc word count

Slide 12

Slide 12 text

▷ remove partes de cada linha de um arquivo ▷ exemplo $ cut -f2,3-5 foo.txt cut

Slide 13

Slide 13 text

▷ editor "completo" ○ substituição/remoção de caracteres ○ duplica linhas ○ remoção de linhas ○ busca ▷ exemplo $ sed 's/foo/bar/' foo.txt sed stream editor

Slide 14

Slide 14 text

▷ busca ▷ exemplo $ grep agulha palheiro.txt grep global search a regular expression and print

Slide 15

Slide 15 text

trabalhar bem em conjunto a interface universal de stream de textos

Slide 16

Slide 16 text

pipes ▷ encadeamento de comandos

Slide 17

Slide 17 text

cat | tr ▷ traduz caracteres ▷ deleta ▷ "aperta" tr translate or delete characters

Slide 18

Slide 18 text

▷ busca com filtros múltiplos cat random.csv | grep AC | grep "Sr\." cat random.csv | grep João | grep AL ▷ busca + remoção de palavras cat random.csv | grep AC | sed "s/Dr. //" cat random.csv | grep GO | sed "s/Sr. //" pipes

Slide 19

Slide 19 text

▷ visualizar consumo de memória dos programas ps aux | sed "s/ \+/\t/g" | cut -f 4,11- | less pipes

Slide 20

Slide 20 text

obrigado! @luiz_amf github.com/lamenezes

Slide 21

Slide 21 text

Credits Special thanks to all the people who made and released these awesome resources for free: ▷ Presentation template by SlidesCarnival