1. ホーム
  2. r

[解決済み] 点数が多すぎる散布図

2022-05-25 18:02:33

質問

N=700Kで2つの変数をプロットしようとしています。問題は、オーバーラップが多すぎて、プロットがほとんど黒の固まりになってしまうことです。プロットの暗さが領域内の点の数の関数である、グレースケールの "cloud"を持つ方法はあるでしょうか?言い換えれば、個々の点を表示するのではなく、プロットがquot;cloud"になり、領域内の点の数が多ければ多いほど、その領域が暗くなるようにしたいのですが、可能でしょうか?

どのように解決するのですか?

この問題に対処する一つの方法は、各点をわずかに透明にするアルファブレンディングを使用することです。そのため、より多くの点がプロットされた領域はより暗く表示されます。

これは ggplot2 :

df <- data.frame(x = rnorm(5000),y=rnorm(5000))
ggplot(df,aes(x=x,y=y)) + geom_point(alpha = 0.3)

<イグ

これを扱う別の便利な方法として、(おそらくあなたが持っているポイントの数に対してより適切な)六角形のビンニングがあります。

ggplot(df,aes(x=x,y=y)) + stat_binhex()

<イグ

また、通常の古い矩形ビンニング(画像省略)もあり、これは従来のヒートマップに近いものです。

ggplot(df,aes(x=x,y=y)) + geom_bin2d()