Importando/Exportando dados

Ciência de dados

Tidyverse

Importação e exportação de dados

Técnicas de importação e exportação de dados com o pacote readr do Tidyverse, para diversos formatos de arquivo.

O pacote responsável pela importação de dados no tidyverse é o readr. Este pacote permite importar arquivos de texto nos formatos .csv ou .txt.

Existem diversas funções no pacote readr(veja aqui). A função read_csv() importa arquivos texto em que as colunas são separadas por vírgulas. A função read_tsv() importa arquivos texto em que as colunas são separadas por tabulações.

1 Importando dados de arquivos texto

A função read_delim() oferece mais controle sobre o tipo de delimitador de colunas (vírgulas, tabulações, ponto-e-vírgula, entre outros) ou o identificador decimal (vírgulas ou ponto).

Carrege o pacote readr e importe o arquivo Reservatorios_Parana_parcial.csv disponível no repositório datasets do . É possível importar o arquivo diretamente do repositório:

library(readr)
res = read_delim(file = "https://raw.githubusercontent.com/FCopf/datasets/refs/heads/main/Reservatorios_Parana_parcial.csv",
                  delim = ',',
                  locale = locale(decimal_mark = '.',
                                  encoding = 'latin1'))

Nota

Se optar por fazer o download do arquivo, basta acessar pelo link (Reservatorios_Parana_parcial.csv), salvá-lo em seu diretório de trabalho e importar com o comando:

res = read_delim(file = "Reservatorios_Parana_parcial.csv.csv", delim = ",")

Verifique o objeto importado.

res

# A tibble: 31 × 11
   Reservatorio Bacia  Fechamento   Area Trofia    pH Condutividade Alcalinidade
   <chr>        <chr>       <dbl>  <dbl> <chr>  <dbl>         <dbl>        <dbl>
 1 Cavernoso    Iguacu       1965   2.9  Oligo…   7.4          33.1        140. 
 2 Curucaca     Iguacu       1982   2    Oligo…   7            32.4        126. 
 3 Foz do Areia Iguacu       1980 139    Oligo…   7.3          35.5         97  
 4 Irai         Iguacu       2000  15    EutrÃ…   6.9          50.2          3.3
 5 JMF          Iguacu       1970   0.45 Mesot…   7.3          40.2          3.7
 6 Jordao       Iguacu       1996   3.4  Oligo…   7.1          23.7        153. 
 7 Passauna     Iguacu       1978  14    Oligo…   8.8         126.         526  
 8 Piraquara    Iguacu       1979   3.3  Oligo…   7.1          22.8         50.7
 9 Salto Caxias Iguacu       1998 124    Oligo…   7.3          39.6        106  
10 Salto do Vau Iguacu       1959   2.9  Oligo…   6.5          23.2        279  
# ℹ 21 more rows
# ℹ 3 more variables: P.total <dbl>, Riqueza <dbl>, CPUE <dbl>

O objeto é do tipo tibble com 31 linhas por 11 colunas. Uma tibble é uma versão moderna do data.frame que preserva aspectos eficazes para manipulação, visualização e transformação de dados.

class(res)

[1] "spec_tbl_df" "tbl_df"      "tbl"         "data.frame"

2 Exportando um data frame

A função para exportar data frames no pacote readr é write_delim() e outras funções análogas. Para exportar uma parte do data frame utiliza-se o comando:

write_delim(res[1:10, 3:5],
            file = "Reservatorios_Parana_parcial.csv", 
            delim = ',')