『フリーソフト「R」ではじめる 統計処理超入門』
加藤 剛(著)
2012年
技術評論社
☆☆☆
フリーの統計ソフト「R」のグラフィック機能を利用して学ぶ「記述統計」入門。「知識ゼロでもわかる統計学」シリーズ中の1冊。サブタイトル(?)は、「観察と直観ですらすらわかる」。本書で用いられているRのバージョンは2.14.1、R Commanderのバージョンは1.8-1。CD-ROM等は付属しない。
アルマジロのアリマ先生と猫のねこすけとの会話形式(シリーズを通して同じキャラクターが登場しているようだ)。タイトルには「統計処理」とあるが、内容としては記述統計の初歩の初歩のみ。グラフを描いてデータの特徴をつかんだり、基本的な要約統計量を算出したり、といった内容(高校数学の「統計」にほぼ相当する?)。具体的には、データのグラフ化(ヒストグラム・箱ひげ図、棒グラフ・円グラフ)、要約統計量(平均値・中央値、標準偏差・四分位範囲、度数・比率)、2変量のグラフ化と記述(散布図・相関係数、モザイク図・クロス集計表(分割表))が取り上げられている。計算式はほとんど出てこない(何と「平均値」の計算式すらない!)。
中高生から、統計を必要とする専門学校生、(言っちゃ悪いが)かなりデキの悪い大学1〜2年生、あるいは普段コンピュータをほとんど使わない年配の読者、あたりを対象としているようだ。「知識ゼロでもわかる統計学」というシリーズ名はダテじゃなく、「1人の脱落者も出さない!」というような著者の意気込みに恐れ入る(RとR Commanderのインストール、学習用サンプルデータのダウンロード、等を説明した付録だけで50ページもあるのだ!)。実際のところ、数学が嫌いで大学の文系学部に進んだのに、心理学や社会学を専攻してしまったものだから統計学が必須、もう参っちゃった…、というような学生が読むことになるのだろう。扱っている内容のレベルはハッキリ言って低いが(ねこすけですら、最後に「えっ、ここでおしまいですか?」と言うくらい(笑))、この本に出てくる事柄に関しては全てを理解させるツモリのようだ。ただし、卒論研究等で実際に統計分析を行うためには、これ1冊ではどうにもならない。必要に応じて、シリーズの他の本や別の入門書と併読することになるだろう。
本書のコンセプトとして、学習用のサンプルデータをこれでもか!というぐらいグラフ化させている。これは実際に全て手を動かしてやってみるべき。グラフを見てある程度直観的にデータの特徴をつかめるようになるには、とにかくたくさんのデータを見たことがある、という経験が必要になってくるからだ。更に言えば、統計処理(の前処理?)において最も重要なのは、まずデータの分布の形を確認するということだと思うのだが、その辺りの必要性を実感しないまま統計ソフトの入門書を開き手順通りに操作するだけでは、結局自分が何をしているのかもわからないまま、p値だ何だといったところにばかり気をとられてしまうことになりかねない。ただただデータを眺めるということに徹するのも統計処理を学び始める初期には意味のあることだと思う。また、内容は初歩の初歩のみとは言え、「あ、これ、(統計学的に)重要なポイント」と思うような指摘も本書にはところどころにある。
私自身はRをGUI操作するためのパッケージ「R Commander」を試してみたくて、本書を手に取った。Rはユーザーインターフェースがとっつきにくいところがあるので(何と言うか、UNIX/Linuxのコマンドラインツールみたいな感じ)、GUIで操作できればいいのに、と思っていたからだ。ただ、正直、ここまで初歩的な内容に徹した本を読む必要はなく、同じシリーズでやはりR Commanderを用いる『フリーソフト「R」ではじめる 心理学統計入門』(実吉綾子(著) 2013年)を読んだ方が良かったかな、とも思う(ただし、この本のレベルもあまり高くない。実際のデータ分析を行うには、やはりもっと詳しい他の本が必要になるだろう)。
ちなみに、「知識ゼロでもわかる統計学」シリーズとして現在のところ他に、
・『はじめよう! 統計学超入門』(松原望 2011年)
・『仮説を検証し母集団を調べる 検定・推定超入門』(前野昌弘 2011年)
・『誤差は必然か、偶然か? 分散分析超入門』(前野昌弘 2011年)
・『直線と曲線でデータの傾向をつかむ 回帰分析超入門』(前野昌弘 2012年)
・『「R」でおもしろくなる ファイナンスの統計学』(横内大介 2012年)
・『フリーソフト「R」ではじめる 心理学統計入門』(実吉綾子 2013年)
・『本当に使えるようになる 多変量解析超入門』(加藤剛 2013年)
が刊行されているようだ。
本文170ページ程度(他に、RとR Commanderのセットアップ、学習用サンプルデータのダウンロード等についてまとめた「付録」が50ページ程度)。

0