1. ホーム
  2. Web プログラミング
  3. フレックス

R言語による.tar.gz.zipファイルの解凍と圧縮

2022-01-19 05:12:43

最近、Rを使っていくつかのファイルを一括で解凍・圧縮してみました。一般的な解凍・圧縮の方法を紹介します。

解凍と圧縮は対称的な方法なので、ここでは例として異なるフォーマットのファイルの解凍を取り上げます。

.zip

を圧縮します。 zip()

伸長する。 unzip()

ファイルを圧縮するには、ファイルを直接 zip() 関数の第1引数に圧縮後のファイル名、第2引数に圧縮前のファイル名を指定します。

ファイルの解凍はさらに簡単で、圧縮されたファイルを解凍するために unzip() を解凍するファイル名と置き換えてください。

.tar.gz

圧縮しています。 tar()

解凍する。 untar()

と同じ .zip zipファイル(接尾辞付き

.gzと.bz2

この2つの圧縮ファイルは、これまでのものと比べて最も特徴的です。これらの接尾辞は、どちらも圧縮ファイルと呼ぶこともできますし、直接データファイルとして扱うこともでき、例えば data frame は直接読むことができる。これは、それ自体がデータファイルであるためです。

以下に、解凍・読み込みについて詳しく説明します。

1) 直接解凍する

Rにはデフォルトで該当ファイルを解凍する機能がないため、パッケージを利用する必要があります。

R.utils
and then use the following code as shown in 
gunzip()
 function to decompress the file.
library(R.utils)
gunzip("file.gz", remove = `TRUE`)
bunzip2("file.bz2", remove = `TRUE`)


Note that it is this function that has an extra 
remove =
 parameter, select 
TRUE
 will keep only the uncompressed files, the original package will be deleted, the default is 
TRUE
.
After decompression, we can directly use 
read.table()
 to read it.
2) Read directly from
Of course, if our purpose is only to read the data therein, and not necessarily to decompress it, then the data can be read directly using a combination of the two default functions in the form of
dat <- read.table(gzfile("file.gz"))  


For R after version 2.10, there is another, more convenient way to read, which is directly using 
read.table()
 to read it.
dat <- read.table("file.gz")


reference
Decompress gz file using R
untar: Extract Or List Tar Archives
The above is the use of R language to decompress and compress .tar.gz.zip and other formats of file details, more information about R language decompression and compression of files please pay attention to other related articles of the script home!

library(R.utils)
gunzip("file.gz", remove = `TRUE`)
bunzip2("file.bz2", remove = `TRUE`)


read.table()

dat <- read.table("file.gz")



reference


Decompress gz file using R


untar: Extract Or List Tar Archives


The above is the use of R language to decompress and compress .tar.gz.zip and other formats of file details, more information about R language decompression and compression of files please pay attention to other related articles of the script home!