事例205
とどラン(都道府県ランキング)で教えるデータ活用の授業
アサンプション国際中学校高等学校 岡本弘之先生
来年の4月から始まる「情報Ⅰ」の内容の中で、スライドの赤字部分がこれまでになかった新しいものです。
この部分の授業を考えるにあたって、今回試行的にやってみた「データの収集・整理・分析」についての授業をご紹介します。
生徒の興味を引く素材を使い、実習を通してデータの分析を行う
まず、この単元でどのような力を身につければ良いのでしょうか。学習指導要領によると、『データを収集、整理、分析する力』と『それを実際に実行、評価し改善する力』の二つとされています。
そこで、実習を通じてデータ活用について教える授業を考えました。
また、探究につながるように仮説を立ててデータを分析し、それが正しかったのかどうかを検証する授業にしたい。できればお堅いデータだけではなく、生徒が興味を持ちそうなデータを使用したいと考えました。
そこで、都道府県別のさまざまなデータが掲載されている『とどラン』(※)というサイトを使うことにしました。
まず『とどラン』についてご紹介します。
このサイトには、お堅いものから身近なものまで、さまざまなデータが都道府県別の数値で公開されています。例えば「文化」のジャンルであれば、お笑い芸人や芸能人の出身地など、生徒が興味を持ちそうなデータもいろいろ載っています。
載っているデータがすべて都道府県別なので、2つのデータを比較して相関を見るときに非常に加工しやすいという点が、このサイトのメリットです。ただし、データが身近過ぎることもあるので、テーマ選びの際には少し注意が必要な部分もあります。
※クリックすると拡大します。
仮説:データを選んで仮説を立てる~疑似相関に注意することもここで押さえる
授業の流れです。
最初に相関関係のありそうなデータを選んで仮説を立てます。
検証では、その仮説が正しかったか、データを集めて整理し分析を行います。そこを踏まえて相関があるのか否か、その原因は何かという考察を行う3段階の授業です。
生徒には最初に『とどラン』のサイトを紹介して、いくつかのデータを見ながら、相関関係のありそうな仮説を考えさせます。
私が例に挙げたのは、「高校数が多い都道府県ほど甲子園での通算勝利数が多い県になるのではないか」という仮説です。理由は、予選での試合が多くなるから強いはずだということです。この仮説を検証するために、都道府県別の高校数と、都道府県別の甲子園での通算勝利数の2つのデータで比較します。
また、そもそも相関とは何なのかについてもこの段階で教えます。どちらかが増えたり減ったりすれば、もう一方も増えたり減ったりする関係にあることを言いますが、これは相関係数を計算することでわかります。
ただ、相関を見る際に気を付けなければいけないのが疑似相関です。例えば、アイスクリームの売り上げとビールの売り上げにはあたかも関係があるように見えますが、実際はこの2つの現象の間に何らかの関係があるわけではなく、売り上げに関係があるのは気温なのです。このようなものを疑似相関といい、相関を見る際に注意する必要があるよ、ということを伝えていきます。
検証:数式の入ったシートにデータを入れ、統計値を計算する
次に、実際に検証する段階に移ります。
『とどラン』のサイトはランキングで表示されていますが、都道府県を北からや南から順番に並べることもできます。ただし、このデータには難点が一つあって、データの単位が文字列で入っていることです。ですから、分析するためには数字の列への加工が必要となります。
こちらが生徒に配った表計算のワークシートです。
このランキング1、2というところに2つのデータをそれぞれ入れて、平均値、中央値、標準偏差、相関係数など指定した関数の数式を入れ、散布図を作成する、という流れになります。
こちらは、先ほどの都道府県別の高校数と甲子園の通算勝利数のデータをシートに入れ、先ほどの関数で計算したものです。関数を入れているため、データを入れれば自動的に統計値が出てきます。
考察:相関係数と散布図で相関を判定する~仮説が外れたことも学びにつながる
統計値が求められたら、次に、相関係数と散布図で相関の判定をします。相関係数がどのぐらいであれば、どのような相関があると言えるのかについて説明します。
散布図はどうなるのかについても、教科書の内容に沿って説明をします。
先ほどの甲子園の例であれば、都道府県のごとの高校の数と、甲子園の勝利数は、相関係数が0.64でしたので、正の相関があると言えます。散布図もこのようになります。
生徒の考えた例でいうと、「平均気温の高い都道府県ほどアイスの消費金額は多い」という仮説の相関係数はマイナス0.3で、弱い負の相関、もしくは相関がないといえます。
気温が高くなればなるほどアイスの消費金額が多いわけではなく、負の相関を見ていくと、むしろ平均気温が低いほど消費金額が増えると言えなくもない。つまりこの仮説は間違っているということになります。
他の仮説として、「警察官が多い都道府県ほど犯罪が少ない」というものがありました。これは相関係数が0.2で、相関はないということがわかりました。
このように、データの相関があるかないかという ことは、実際に検証してみないとわからないので、結果を出すのはとても楽しいことでした。このように、生徒の興味を引くテーマでデータ分析の流れを楽しく学ぶことができました。また、「仮説を立てて検証し、考察する」という探求の流れも学ぶことができました。
統計的に検証することで予想外の結果が出てくることがあるため、生徒は興味をもって授業に取り組むことができ、知識内容を体験的に学ぶことができたのもよかったと思います。
よく、「数学で学ぶデータ分析と『情報』で学ぶデータ分析はどう違うのか」という話題が出ます。
私が「情報」で大切にしたいのは、「仮説」と「考察」の部分です。
数学では、公式や計算の方法について学びますが、「情報」ではその部分はアプリに任せてしまって、仮説を立てたり、出てきた相関係数や散布図から相関があるかどうかを見たり、その理由を考えたりするところが大切なのではないか、と考えています。
神奈川県高等学校教科研究会情報部会情報科実践事例報告会2021オンライン オンデマンド発表より