算額あれこれ

算額問題をコンピュータで解きます

2019-01-01から1年間の記事一覧

お絵描きだって ggplot より綺麗だよ

Create supply and demand economics curves with ggplot2 スライドや挿絵などでグラフを描くことがあるが,ggplot2 での指定はかなり煩わしい。 ggplot(mapping = aes(x = x, y = y)) + geom_path(data = supply, color = "#0073D9", size = 1) + geom_path…

ggplot2 って,ちっとも簡単じゃないよ!(2)

> 最後にgeom_blankを使い,かつ体裁を最大限整えたグラフを描いてみます。論文にもそのまま使えるほど綺麗なので,参考にしてください。 との触れ込みで,プログラムと図が掲載されていた。 library(dplyr)library(tidyr)library(ggplot2)iris %>% gather(f…

ggplot2 って,ちっとも簡単じゃないよ!

Why I don't use ggplot2 で, ggplot() + geom_point(data = quakes, aes(x = lat, y = long, colour = stations)) の一行で以下のような図が描けるのはかなり驚くべき事だ。 中略。しかし,ちゃんとした図であるためには,(1) 軸を大きくし,(2) ラベルを…

ggplot2 - ひいきの引き倒し(6)

円グラフでさえ物議を醸すのに,こんなとんでもないグラフが紹介されていた(紹介するのはしかたないとしても,そもそも,そんなトンデモ機能が実装されていること自体が問題なんだよな) これはしょうもない帯グラフ?? quan <- as.vector(table(iris1$Spe…

ggplot2 - ひいきの引き倒し(5)

ggplot2でgeom_lineする時にNAを無視して線をつなぐ リンクするのは止めておく 時系列データなどで NA があるとき,その前後は線で繋がないというのは graphics::plot でも ggplot でも同じ仕様。 それはそれなりに意味がある。だって,途中がどうなっている…

ggplot2 - ひいきの引き倒し(4)

ジッターは使うな!!! なぜ,ジッターを使う。

ggplot2 - ひいきの引き倒し(3)

この凡例は,何のためにあるのか?(念の為。色は縦軸の大きさの順に割当らているだけです。上の紫から,下の赤まで) スペースの無駄遣い。論文の投稿だと図の大きさで料金がかさむこともあるらしい。無駄な凡例にお金(研究費?)を使う意味がわからない。…

ggplot2 - ひいきの引き倒し(2)

発表スライド(?)そのまま挙げるけど,統計学的に「結果として合計をプロットする」ことにどれ殿の意味があるか?群ごとのサンプルサイズが違えば合計をプロットしても意味はない。平均値をプロットするなら意味があるが。そもそも,合計値なら棒グラフで…

ggplot2 - ひいきの引き倒し(1)

ggplot2 の解説記事は,ggplot2 がいかに優れたパッケージかを宣伝するために,「これだけの記述でこんな素敵なグラフが描けますよ!!!」ということを言いたいがために,統計学のセンスがないために変なグラフ描画例を書いて(描いて)しまうこともあるよ…

どういう目的のページ?

「平均値の棒グラフ」と題して,以下の図が掲示されています。 library(ggplot2)ggplot(aes(x=Species, y=Sepal.Length, fill=Species), data=iris) + stat_summary(fun.y=mean,geom="bar") 何でも図示すればいいというものではありません。 凡例は何のため…

棒グラフをたくさん並べるのは,わかりづらい

ggplot2tor gapminder の各大陸,各国,年次別の平均余命のデータ 1704 行,6 列である。 library(tidyverse)library(gapminder)gapminder %>% mutate( year = as.factor(year) ) %>% ggplot(aes(x = continent, y = lifeExp, fill = year)) + stat_summary(…

本当にわかりやすい図にするためには,少々の苦労も必要というもの

ggplot をつかえば簡単に「綺麗な図」が描けますよと...うそでしょ,必ずしもそうではない。ggplot2 の公式サイト?install.packages("tidyverse")install.packages("ggplot2")devtools::install_github("tidyverse/ggplot2")library(ggplot2)ggplot(mpg, ae…

ggplot2 を検索するときに,してはいけないこと

検索時に注意!!! ggplot2 を検索たとき,.it や .de などのドメインのページはほとんどが危険なページ。クリックしてはいけない。

いいたいことの強調!!

PyTorch 三国志(Ignite・Catalyst・Lightning) 凡例は図中に 強調したいものを強調する! 投稿された図 手描き風でインパクトをねっらっているのだろうが,それは姑息な手段。 その手法でもよいのだけど,凡例は,図の中に描こう!! さらに,いいたいこと…

無用な凡例をなぜつける?

12/6 図を分割する 上の図と,下の図,どこが違う? 凡例がついているかついていないか。 凡例は必要か? 各図の下に Species が描いてある。凡例は不要。図のスペースを無駄に使っているだけ。そのせいで,横幅が制限されて図の下の Species の記述が,重な…

cockscomb と wind rose

wind rose(風配図)は cockscomb(鶏頭図)と似ているが,wind rose はおうぎ形の幅が狭く,棒グラフのように*概ね*半径が量を表すと見なせるので,ちょっと違いがある。また,本来は風向・風速を表示するものなので,角度(方向)に意味がある(北風,北…

図を描くときに「やるべきこと」と「やってはいけないこと」(その7)

誤解してはいけない。 ナイチンゲールの鶏頭図は,正しいのだよ(^_^;) ナイチンゲールの鶏頭図(コウモリの翼)はボンヤリとした画像だなあぐらいにしか思っていない人が多い。 左下に注釈が書いてあるが,明確に "The areas of the blue, red, & black we…

図を描くときに「やるべきこと」と「やってはいけないこと」(その6)

鶏頭図(PolarArea) > 鶏頭図(PolarAreaChart)は円グラフと似ていますが、セグメントの角度は同じです。 代わりにセグメントの半径が値によって異なります。 間違いです。 二次元グラフになりますので,半径で値を表すのではなく,面積で値を表さないといけま…

ggplot を「けなしまくる」スレッド

(第2回)Rを使ったグラフィック -ggplot2- これは,ggplot が悪いんじゃなくて,使った人がうっかりさん。 > 最後に、グラフの外観なんかも帰れたりします。「theme」という関数があって、それで変更します。 #normal p1=ggplot(diamonds2,aes(carat,price,…

図を描くときに「やるべきこと」と「やってはいけないこと」(その5)

* Data Visualization: Chart Dos and Don'ts * Doing the Line Charts Right 折れ線グラフ 左は ggplot をほとんどデフォルトのまま描いたもの 右は base の matplot を使って描いたもの グリッドラインも背景も不要 凡例はわかりやすい場所に分かりやすく…

ggplot を「けなしまくる」スレッド

もうね,一杯あるので,番号付けない 全部「ggplot を「けなしまくる」スレッド」 まずは,「ggplot2 まとめ: 初歩から程よいレベルまで」に描かれていることだけど > ggplot(data=iris,aes(x=Sepal.Length,y=Sepal.Width))+ #キャンバス用意。使うデータ宣…

ggplot を「けなしまくる」スレッド

まあ,とにかく ggplot がいやなんです。自分で使うなんてもってのほかで,ほかの人が使っているのを見るのもいや。 「ほかの人が使っているのなんかいいじゃないか!!」と,普通の人は思うでしょうが,私は,断固!!いやなんです!!! 統計リテラシーに…

ggplot と base(その5)

ggplot のヒストグラムですが,他と同じく,デフォルトで使うとひどい目に遭います(ひどい目に遭ったことにも気づかないほどのひどい目です)。 いつものように,るんるん気分で,データフレーム df にある変数 x のヒストグラムを描いてみます。 df <- dat…

図を描くときに「やるべきこと」と「やってはいけないこと」(その4)

ggplot を使ったグラフ例でよくあるのは,以下の図はまだましだが,グラフのサイズがデフォルトのままで,中の文字が「小さすぎて読めな〜〜〜いっ(はずきるーぺもってこ〜〜い」状態のもの。 なお,以下のグラフの問題点は数多く。 図全体の大きさに対して…

図を描くときに「やるべきこと」と「やってはいけないこと」(その3)

gridlines are gratuitous グリッドラインは描かない グラフの外枠は描かない 軸も目立たないようにグレーで描く 目盛りも細かすぎないようにする(目盛りの文字を描くために縦書きにするなんてもってのほか) タイトルと折線を同じ色でしっかり描く R では …

ggplot と base(その4)

「ggplot では,容易にエラーバーのついた折れ線グラフが描けます!」っていうけど, ggplot のエラーバーグラフは,エラーバーの横線が長すぎる。 ところで,そのエラーバーは標準偏差なの標準誤差なのそれともそれ以外?それを明示しないと読者を惑わす(…

ggplot と base(その3)

「geom_smooth 関数を使うと,回帰直線も描き込めるよ!」というが,まあ,散布図の目的のひとつは,データの撒布状況を示すのであるから,回帰直線とその信頼区間を示すよりは確率楕円を描き込むほうがよい場合もあるだろう。 なお,右図は信頼率に 0.8 を…

ggplot と base(その2)

ggplot は,凡例は図の外に描く。もっと悪いことには,例え凡例が1個でも描いてしまう。 凡例も,この例のようにある程度点がまとまっているような場合には図中に描く方がわかりやすい。 デフォルトの色の選択も,よく言えば「渋い」が例えばこの図の赤っぽ…

図を描くときに「やるべきこと」と「やってはいけないこと」(その2)

The Do’s and Don’ts of Chart Making シンプルな図を描け グリッドラインは描くな 不要な目盛りは描くな(図の中に数値を描け) 長いラベルを描くときにも,傾いたラベルを描くな(水平棒グラフにせよ) 意味のある順番に描け(大小順に描け) 強調したいも…

ggplot と base(その1)

散布図の比較。他も同じなのだけど,デフォルトでバックグラウンドが灰色で白のグリッド線が入るのは,無用の長物。 x <- data.frame( weight = c(1.2, 1.5, 1.1, 1.6, 1.6, 1.4, 1.3, 0.9, 1.1), seeds = c(26, 31, 19, 34, 38, 23, 24, 21, 24))g <- ggplo…