1. ホーム
  2. r

[解決済み] Rでtrycatchの書き方

2022-03-21 18:17:29

質問

を書きたいのですが。 trycatch ウェブからのダウンロードのエラーに対処するためのコードです。

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)

この2つの文は正常に実行されます。以下では、存在しないウェブアドレスを作成しています。

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")

url[1] が存在しない。どのように trycatch というようにループ(関数)させます。

  1. URLが間違っている場合、次のように出力されます: "web URL is wrong, can't get".
  2. URLが間違っているとき、コードは停止せず、URLのリストの終わりまでダウンロードを続けますか?

解決方法は?

それでは、Rの世界へようこそ;-)

どうぞ

コードの設定

urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)
readUrl <- function(url) {
    out <- tryCatch(
        {
            # Just to highlight: if you want to use more than one 
            # R expression in the "try" part then you'll have to 
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression 
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            readLines(con=url, warn=FALSE) 
            # The return value of `readLines()` is the actual value 
            # that will be returned in case there is no condition 
            # (e.g. warning or error). 
            # You don't need to state the return value via `return()` as code 
            # in the "try" part is not wrapped inside a function (unlike that
            # for the condition handlers for warnings and error below)
        },
        error=function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(cond)
            # Choose a return value in case of error
            return(NA)
        },
        warning=function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(cond)
            # Choose a return value in case of warning
            return(NULL)
        },
        finally={
        # NOTE:
        # Here goes everything that should be executed at the end,
        # regardless of success or error.
        # If you want more than one expression to be executed, then you 
        # need to wrap them in curly brackets ({...}); otherwise you could
        # just have written 'finally=<expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )    
    return(out)
}

コードの適用

> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory

出力の調査

> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"      
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"      
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"             
[5] "</head><body>"                                                          
[6] ""    

> length(y)
[1] 3

> y[[3]]
[1] NA

補足説明

トライキャッチ

tryCatch の実行に関連する値を返します。 expr ただし、エラーや警告が発生した場合を除く。この場合、特定の戻り値 ( return(NA) を指定することで、それぞれのハンドラ関数 ( 引数 errorwarning?tryCatch ). これらはすでに存在する関数でもかまいませんが、その関数を tryCatch() (上でやったように)。

ハンドラ関数の特定の戻り値を選択することの意味するところ

と指定したように NA はエラーの場合に返されるべきもので、3番目の要素は yNA . もし NULL を返り値とする場合、その長さは y は、単に 2 ではなく 3 として lapply() は単に無視するだけです。 NULL . また、もしあなたが 明示的 の戻り値は return() の場合、ハンドラ関数は NULL (すなわち、エラーまたは警告状態の場合)。

警告メッセージ

として warn=FALSE は効果がないようです。警告を抑制する別の方法 (この場合はあまり意味がありません) は、次のようなものです。

suppressWarnings(readLines(con=url))

ではなく

readLines(con=url, warn=FALSE)

複数の表現

なお、複数の式をquot;実式部"に配置することも可能です(引数 exprtryCatch() で説明したように)中括弧で囲むと、より効果的です。 finally の部分)。