統計分析のツボは幾何学図形の補助線に似ている

 | コメント(0) | Edit

今日は、私が気合いをいれていた論文を見てくださっていた先生からついにレスポンスがあったので、それを今からオフィスに受け取りにいって、さらに気合いを入れて書き上げようと思っています。そして、また統計分析のお仕事をいただいたので、そのデータ分析をひとつ。ポスドクを始めてから、さまざまな自分のプロジェクトの他にもこうしてコンスタントに統計のお仕事をいただくようになってきて本当にいろいろな分析(要はフォーミュラですね、手動では絶対計算しませんが)を学びました。

今やっているのはクラスでも教えてくれなかったランキングをしたデータ結果の有意性を求める分析。ランキングといっても、単純に1位、2位、となっているわけじゃないところがトリッキーですが、自分でリコードしていくことによって割と単純化できるのでその正確なやり方を学んで、ソフトを動かしているところです。統計って本当に、計算とか数学とかそういう問題じゃなく、データの羅列を見て、どの分析法が一番当てはまり、しかもメイクセンスか、というのを知っていることが重要なんだなぁと実感しまくってます。ランダムな幾何学図形を見ていて、補助線がぽわーん、と見える感じに似ている。

統計という概念を具体的に把握している人がリサーチすると、データがものすごくキレイです。つまり、どんな分析をやるかというのがだいたい最初から頭に入っているため、シンプルでかつ、無駄の無い、クリーンなデータが出るわけですね。とりあえずデータを集めてから、さあ分析しよう、というようなタイプのデータはごちゃごちゃしていて、一体何をどうしたいんだ、とかなりコンサルティングに時間を割くハメになります。データをとりはじめた時点で、「ちょっとこんなデータが出たんだけどどう思う?」というプリリミナリーな相談をしていただけたら、リプリケーションの数とか、そういうのをちゃんと「こうしたらこういう分析ができますよ」とかそういうふうにお伝えできるのに、とちょっともどかしく思います。

特に、ゼロやめてほしいです。ゼロがでるデータをとらずにすむ方法をなんとかして探して、と思います。データを人工的にマニュピュレイトしろ、という意味ではなくて、もともとデータはランダムデータではなくて一応フィックスドデータなんだから、普通に、合理的にゼロを出さないデータセットにすることは出来るはずだと思うから。今ゼロ大量のデータにうんうん言っているところなので切実です。

さて、私の方はといえば、実は暖かい日があればひとつ実験をしたいと思っていて、Dr. Kangにもお話をして実験の前準備を進めていたのですが、どうやらもう暖かい日は来ないみたいです。残念。なぜ暖かい日が良かったかというと、周りの温度を変えた実験をしたかったからなんです。10月にそんなことを思いつくのほうが悪い、という感じですね。また夏待ちかーと思うとちょっと気が遠くなりますけど。

ところで昨日の夜はモスコウにお住まいのIさんと、Mさんをお招きして一緒にお食事しました。いろいろと興味深いお話をしてくださってすごく楽しかったです。時間がたつのがあっという間でした。あまりたいしたおもてなしはできませんでしたが、Iさん、Mさん、遊びにきてくださって、本当にどうもありがとうございました!お引っ越し先でもご活躍お祈りしています。

コメントする