事例70

実際の授業から見える情報科における統計分野の実践と課題

神奈川県立横浜翠嵐高校 三井栄慶先生

次期学習指導要領が大きく変わる中で、注目されているのは、やはりプログラミングです。しかし、プログラミング以外にも、現場として新たにやっていかなければならない項目もたくさんあります。

 

今回授業で行った「データサイエンス」は情報IIの部分に該当しています。これが設定されると、多くのデータを扱って分析し、考察することを、授業の中で行う必要が出てくるわけです。では、実際にどう進めたらよいのか、昨年度より実践を重ねてきました。

私はもともと数学の教員免許を持っていて、現任校でも夏期講習や短期講習で数学の授業を持っていますので、現行の数学で扱っているデータ分析はどうなっているかということを、あらためて確認していきたいと思います。

 

「数学」と「情報」の違いとは

数学の問題では、このように、散布図やヒストグラム、箱ひげ図などが提示され、「ここからどんなことが読み取れますか」という質問に対して、選択肢が用意され、そこから選ぶという形式が多いです。センター試験を意識した問題なのです。もちろん、パッと見て読み取れるという力も必要ですが、果たしてこれが、情報科の求めるデータ分析の能力と合っているのかといわれると、疑問が残ります。単に読み取るだけではなく、ここからもう一歩踏み込んだところまで学びを進めたいというのが、正直なところです。

例えばこちらの数学の問題は「このデータについて、誤っているものを選びなさい」という問題です。

 

横浜翠嵐高校の生徒の場合、99%が1分以内で正解するでしょう。なぜ早くできるのかというと、データがたった10個しかないからです。情報の授業で、10個のデータに対して平均を出して問題解決型学習をやりましょう、ということはまずありません。

 

このように、データの量が少ないというのが、数学の特徴といえます。それは、学習の目的が、数式などの使い方を学ぶというところにあるからです。数学では手計算になるので、多量の計算をするのは、現実的ではないのです。

 

下図は統計局のデータですが、情報の授業では、このぐらい多くのデータを扱う必要があります。こういった実物のデータを見て、実際の問題を解決するために、どれだけ早く処理できるか、ということを考えてほしいのです。

※クリックすると拡大します

 

進学校における「情報科」の課題

神奈川県立横浜翠嵐高校は、神奈川屈指の進学校と言われていて、受験界では頻繁に取り上げられています。

 

また、新入生にはこんなプリントを配っています。覚悟を持って学習に取り組んでください、という内容です。興味のある方は「翠嵐 覚悟」で検索してみてください。

  

こういう話をすると、皆さんに「そういう学校だから優秀なんでしょう、授業もすごく深いことができるんじゃないですか」と言われます。

 

ところが、一概にそうとも言えないのです。私が赴任する前の情報の授業は、前期はExcelの使い方、後期はフォトショップの使い方、それでおしまい、という状態でした。生徒たちに、「データの分析や統計を前期にやるぞ」と言うと、「ああ、センター試験で出るやつっすよね、15点ぐらい」と答えます。これが生徒の認識なのです。意欲が低くて、データ分析や統計の奥深さ、重要性が認知できていないわけです。これは、生徒が悪いのではなく、指導する側がきちんとその重要性を伝えきれていないことが問題なのです。

 

また、「パソコン技能もすごく高いのでしょう」と、言われますがそんなことはありません。本校には、ダブルクリックをできない子が、40人クラスの中で一人や二人は必ずいます。「Excelのアイコンをダブルクリックして起動してみてください」と言うと、「起動できません」と、手を挙げる子がいるのです。

 

これも当然と言えば当然です。中学の教育課程でパソコンに触った経験はあるものの、高1・高2と、パソコンの授業はありません。その間、生徒たちは、スマホしかいじっていないわけです。高3になって久しぶりにキーボードを触っても、思い出せないのです。

 

一番深刻だったのは、Excelでセルの複数選択をできない子が、50%もいたことです。「セルの真ん中、マス目の中央を押しっぱなしにして、真下に動かすんだぞ」と、すごく丁寧に説明しないとわからないのです。このように、決して技能も高くありません。

 

さらに、「考えない」という面も深刻です。昨年度の授業で、数値が確認できるようなExcelのデータを準備して、「算術平均と幾何平均の違いについて考えなさい」という問題を出しました。すると、生徒たちは、「結果が違う」と、答えました。決してふざけているわけではなく、真面目に考えてそう答えるのです。これは、答えを短時間で求めたいという気持ちが強いからなのだと思います。こういう子たちを、難関国公立大学を受験する優秀な子というふうにくくるのは、情報科の視点で見ると、疑問が残ります。

 

学習の目標と実際の進め方

実際の授業を進めるにあたっての「ねらい」ということで、こちらの目標を観点ごとに四つ載せましたが、赤字で書いてあるものはやはり重要な部分です。

 

 

下図が授業の内容です。

1コマ目に、数学的なデータ分析の確認をざっとしてから、表計算ソフトの利用を2~3コマ行います。次に、4コマ目から11コマ目で、関数を使ってみましょう、表を引きましょう、グラフを描いてみましょう、という統計分析の手法を学習します。様々な課題を提示しながら、こういったことができるよ、こういった方法があるよ、ということを小出しにしながら当てはめていく方法をとりました。

 

その後、12コマ目から3コマ使って、グループに分かれて実際の問題解決につなげ、最後の2コマは互いに報告を行って相互評価をする、という流れで行いました。今回は、この赤字の部分についてお話しします。

 

まずは、複合グラフを描いたりクロス集計を体験したりということを学習したあと、散布図と相関係数を使って分析をしていきました。データは、こちらで用意したものと、放送大学が出しているREAS(※1)という、リアルタイム評価支援システムも使いました。

(※1) https://reas2.code.ouj.ac.jp/cgi-bin/WebObjects/topssl

 

下図はREASからとった「スマートフォンの使用時間と学習時間」というデータですが、このようにExcel形式で出てきますので、降順に並べて上位はどうなっているか、下位はどうなっているかというような分析を行うことができます。また、散布図を取って、相関係数の値を求め、関係性を確認することもできます。ただし、相関係数の値を求めて「関係がある」と、いうだけでは物足りません。

※クリックすると拡大します

 

下図は、そこから少し踏み込んだ分析です。ある生徒は、「相関係数は-0.29と、値では相関が小さいように思えるが、スマホ使用時間の平均は、学習時間の上位70%が109分、次いでその下20%が152分、下位10%が174分となった」と書いてきました。値だけで見ると相関はそれほど高くないのですが、この生徒は成績上位・中位・下位というふうに区切ったときの平均を見ることによって、違いがあるのではないかと考察しています。

 

集団を区切ることで、相関係数の値だけでは見られなかったが関係があると考え、「学習時間の多い子ほどスマホの使用時間は短いと考えた」と結んでいるのです。

「このくらいはできるだろう」と思う方もいるかもしれませんが、この生徒、実は4月にダブルクリックができなかった子です。スモールステップで、少しずつ少しずつ積み上げていって、ここまで自分の力でできるようになったということです。私から見ると、「ここまで書いてくれたのか、よくがんばったなあ」という感じで、確実に力がついてきていることが伺えます。

 

続いてグループワークの統計分析についてです。今回は特定のデータを使うのではなく、任意の二つの値についてデータを集め、分析してみなさい、ということにしました。

 

データを集める際には、なぜそれを調べる必要があるのか、質問項目を作るときに注意する点は何かについても考えようと話しました。

 

基本的には学校の課題ですから、道徳上、倫理上問題がないということであれば、OKにしています。例えば、身長はOKにしましたが体重はNGにしました。人によっては聞かれたくないデリケートな質問だからです。

 

いろいろとユニークなテーマが挙がってきました。

 

「持っている単語帳の数と小テストの点数について」というのは、進学校ならではのテーマですね。本校では単語帳を30冊くらい持っている子がいますから、十分データになるのです。

 

「納豆をかき混ぜる回数と握力について」もユニークです。どうしてこれを調べるのか聞いたら、「スポーツテストで握力の強かった人が、納豆を500回かき混ぜていると言っていたから、本当にそうなのか確認したいと思いました」ということでした。確かに納豆をかき混ぜる回数を調べても、傷つく人はいないだろうと思ってOKを出しました。

 

それから、これは悩みましたが、「アニメショップのanimateに行った回数と洋服の枚数について」。「animateにたくさん行く子でも、おしゃれかどうかを調べたいから」だそうで、これは生徒たちが聞かれてもかまわない、ということだったので採用になりました。

 

「異性と一緒に出掛けた回数とLINEの友達の数について」は、微妙なところです。高校生なので付き合った回数などを入れたがるのです。ただ、これは二つに大きく分かれて、分析しづらくなる可能性があるからやめた方がよいとしました。やはりLINEやTwitterについて、聞きたいという提案は多かったです。

 

具体的な内容を見ていきましょう。これは「睡眠時間と居眠り時間について」という分析です。これはWeb上のREASから取ったデータで、度数分布と散布図と相関係数を使っています。

 

※クリックすると拡大します

 

 

生徒の分析結果は、「睡眠時間と居眠り時間の平均は、それぞれ354分と、約60分である」。60分も居眠りしていては駄目だろうと思いますよね。しかし、この分析には続きがあります。「合計の平均は414分、相関係数は-0.26であり、弱い負の相関がある。ところが、居眠り時間が500分と異常に長いデータを除いた場合は、相関係数は-0.02となり、相関はなくなるであろう」というのです。

※クリックすると拡大します

 

私は分析に関してはあまり口を出さず、外れ値の話も特にしていませんでした。ただ、生徒は、このデータは違うと気付いたのですね。間違っているか、意図的に変な入力をしたと考えたわけです。でも、その判断が正しいかどうか何とも言えないので、二つの結果を出してみましょうという判断がなされています。もう一度言いますが、私からそうするようにという指示は出していません。

 

このケースでは、考察が薄くて少し残念なのですが、このようなことに生徒自身が気付き、処理をしたということは評価できる点といえるでしょう。

 

評価と気付きについて

単元のルーブリックがこちらです。Aの部分は、相関分析だけではなく、他の分析手法も取り入れているということで、ここは妥当という評価にしました。

 

実際にデータを集めて分析をしてみると、例えば「牛乳を飲む人は骨折の回数が多い」という結果が出てしまった子がいます。これ自体はおかしな結果です。でも、彼はそこからさらに裏を読んで、「運動する人は身長を伸ばしたり骨を強くしたりしたいという思いから牛乳を飲んでいる」と考えて、疑似相関となる気付きに至っているのです。これも、こちらが最後にまとめとして言おうと思ったことを、生徒の方で先に気付いてくれています。

 

ただし、実際こういったことに気付いた子は全体の19%、おおむね達成できただろうというのは79%、残りの2%は欠席が多いケースなどでした。

 

これからの課題

まとめとしてお話したいのは、やはり、数学科との連携は必須だということです。数学でデータ分析を学習した経験があったからこそ、生徒たちは、ヒストグラムを取ったり分散を取ったりということで、多面的に表を作ることができています。それがなかったら、相関係数だけを調べるというような、内容の薄い分析になってしまったかもしれません。

 

本校では、1年生の数学でデータ分析について学習したあと、間があいて3年生になってから情報の授業というカリキュラムになっています。やはりそこをどうつなげるかということが、学校として、組織として詰めていかなければならない課題だと考えています。

 

※第10回全国高等学校情報教育研究会全国大会(東京大会)(2017年8月8日・9日)の講演より