去年の研究の話。
去年の話。
自分が3年生の時、ゼミでどんな研究をしたのか。ゼミのブログに詳しいことは沢山まとめられてるけど、個人のブログにも一応端的に綴っておく。
自分用のメモみたいな扱いだけど、読んでくれる人がいたら嬉しい。自分でもかなり面白いと自負してる。
・
・
・
アイドルを題材に何か研究したら面白いんじゃね?となったのが事の発端だった。
アイドルといっても様々で、アイドル全般の研究をするのか、特定の個人やグループの研究をするのかバリエーションは色々だったが、まずは全般の研究をすることにした。
研究はチームでやるので、各々が分担して沢山のアイドルグループのデータを集めた。
どういうデータがあったかは、もう1年半くらい前の話なのであまり覚えてないけど、ウィキペディアのアクセス数とかYouTubeの検索数とかがあった気がする。
データなんて作るの初めてだから難儀しながら集めたっけ。
最初は色んなアイドルグループのグループ内格差を見てみようみたいな話だったけど、十分なデータを集められず挫折、研究は振り出しに戻る。
次に注目したのがAKB48グループ。人数も多いし、何より年一で行われる総選挙という制度が魅力的だった。
それからは総選挙の順位格差と努力量の相関をはかるというのを指針に研究を行うことにした。
抽象的にいうと、集団格差がどのように努力量に影響するのかという事。
まずは基本的なデータをいくつか集めて、その後はTwitter APIを使って100人分くらいのメンバーの1年間のツイートやリツイート数などを大体集めた。多分10万件分くらい集まったと思う。
Twitter APIは結構優秀で簡単に説明すると、個人でも申請してアクセスキーを入手すれば簡単にTwitterの、データが集められるというものだ。恐らく、みんなのツイートもデータとして収集されて研究材料にされてるだろう。というかされてる。この間8億ツイートを感情分析するという研究を教えてもらった。
仮説とか先行研究の話は流石に専門性が高すぎるので省略。
分析方法も専門性が高いので詳しい話は省略するけど、R言語を使って重回帰分析した。
結果は
自分より上位のメンバーとの格差が大きいほどツイート数が多くなる。(努力量を増やす)
下位との格差はあまり努力量に関係しない。
選抜に入っていないと(80位より下)努力量を増やす。
といった感じで出た。一応科学的手法を用いたのである程度の信憑性はあるはず。
もちろん課題とかはいくつもあるのだけど、面白いものができたんじゃないかなとは思う。
実際、格差という社会的に関心の高い問題にアイドルグループを用いて切り込んだというのはなかなかインパクトがあったようで、就活では結構ウケた。
某有名企業の人もブログを見て面白いと思って下さったようで何よりだ。
就活で何か切り札が欲しい人には是非とも研究をオススメしたい。
と、まぁ去年の研究は掻い摘むとこんな感じ。
今年は卒論で自然言語処理を使って、レビューの分析をしてる。
R言語に加えて、Pythonもやってる。Pythonは中々面白い。
卒論もいいものになるといいなぁ。
ちなみにゼミの後輩も中々面白いテーマの研究をしているので完成が楽しみだ。
http://nagayama-sem.hatenablog.com/entry/2018/02/13/190758
こっちのゼミのブログに詳しく載ってるので、興味ある方は是非。