日本数学会による大学生数学基本調査への疑問(その12)─雑誌「数学文化」第18号の竹山論文をめぐってIII─

雑誌「数学文化」第18号に、『問題提起としての「大学生数学基本調査」』と題する竹山美宏氏の論説についての検討を行っていた。今回は、竹山氏がこの調査で測ることを意図した学力のうち第2のものについて検討したい。

「わかる」と「できる」の違いについて

竹山氏はまず次のように述べている。

「数学がわかる」とは、どのような状態なのか。本稿では、数学的な概念が頭の中でイメージ化されている状態と規定しよう。ただしイメージといっても、想像力豊かに拡大解釈したものではなく、言語化された定義に裏打ちされていなければならない。特に、イメージ化された概念の限界を明確に把握していることを必要条件とする

率直に言って何を言っているのか相当に不明瞭である。「言語化された定義に裏打ちされた、数学的概念のイメージ」とはなんであろうか。「イメージ」という単語の意味するところが不明確だ。「規定」という単語も果たして「定義」とどう違うのかはっきりしない。だから竹山氏は問1-1や他の例をあげて説明していくことになるのだ。抽象的な概念を具体例でもっと根拠付け、それによって相手を納得させようと試みること、それは「論理的コミュニケーション」において当然の手法の一つだ。数学において「例示と論証」が異なることを殊更強調しても、あるいは「例示のみ」の答案を「論理的コミュニケーションの前提が崩壊している答案」と批判しようとも、われわれが他者を説得しようとする局面で、抽象論を具体例によって根拠付けることは竹山氏自身が用いているように、全く当然の手法なのである。このことを想起するだけでも、「数学教育における論理性」と一般的に様々な話題に関して行われる「論理的コミュニケーション」との間にギャップがあることは明らかなのではないか。例示と論証の区別が厳格に行われるのは、まさに数学特有の事情である。にもかかわらず、その一方で「数学教育の育む論理性」が社会的に有用であることを何のためらいもなく主張し、例示と論証の区別のつかなかった答案を「論理的コミュニケーションの前提が崩壊している答案」と論難する。こういう態度は、今回の竹山氏の記事を加味してもなお、調査側の落ち度であるといわざるを得ない。その点を明確に説明できないなら、それは単なるダブルスタンダードということにもなりかねないのだ。

ともあれ、竹山氏の記事に戻ろう。

日常生活において「平均」という言葉を聴くとき、まず思い浮かぶイメージは「真ん中」とか「普通の状態」というものであろう。それは、私たちが接するデータの多くは正規分布しているという暗黙の共通了解、ないしは経験知があるからかも知れない。しかし、数学における「平均」の定義は、標本の観測値の合計をその大きさ(データの個数)で割ったものだ。この定義からは、平均が真ん中であることも普通の状態であることも論理的には帰結しない(それらには対応して「中央値」「最頻値」という別の概念が与えられている)。したがって「真ん中」「普通の状態」という「平均のイメージ」は、数学的には間違っている。言語化された定義からは論理的に帰結しないという制限によって、「平均」のイメージには限界が設けられているのだ。そこまで理解していて初めて、「平均」という概念を理解していると言えよう

ここで書かれていることは一般論としては間違っているわけではないと思う。しかし、今回の調査の分析という点では、まず冒頭からしてあまり適切ではないと思う。というのも、今回の調査結果では、問1-1は75%の人が3つの選択肢のすべての正誤を正しく判定できているからだ。国立S群や私立S群では、94.8%、83.0%の人が正答なのである。私立C群でさえ51.2%の人が正答なのである。この結果を見て、私たちが接するデータの多くは正規分布しているという経験知があるから、日常生活において「平均」と聞いてまず思い浮かぶイメージは「真ん中」とか「普通の状態」だというのは、今回の分析結果から導けない主張なのではなかろうか。どうしても不正解だった25%の方に焦点があたって、「大学生の4分の1が平均の意味を理解していない」と報じられているが、これは逆に言えば4分の3は平均の意味を正しく理解しているということに他ならないし、だとするならば、上で竹山氏が述べているような「日常生活において「平均」という言葉を聴くとき、まず思い浮かぶイメージ」と「言語化された定義から論理的に帰結」することとが区別できていないという指摘は、今回の調査対象になった大学生たちには当てはまらないということだ。

そもそも、日常生活において私たちが接するデータの多くが本当に「正規分布」なのだろうか。そういう経験知があるのだろうか。この問1-1で扱われている身長の分布は確かに正規分布にかなり近い分布を示すことで有名な例であるから、(3)で平均値=最頻値と思ってしまった学生にはそういう思い込みがあったのかもしれない。しかし、模試の成績分布を見ると、2つのこぶができているような分布や、上位層に比べて下位層が非常に大きい分布というものもよく見かける。むしろ日常的に見られる分布の中にも、正規分布ではないものがかなり含まれているのではなかろうか。だからこそ、75%の人は、今回の3つの選択肢を正しく正誤判定できたのかもしれないのだ。

竹山氏のこの文章は、「平均」というものの理解の仕方についての私見は述べているが、その一方で、今回の調査の分析という点とは必ずしもマッチしているとは言えないように見えるのである。

実際には、この問題で75%の人が正答したからとって、その人たちが「平均値」と「中央値」「最頻値」の違いを(言語的定義に裏打ちされた形で)理解しているかどうかはよくわからない面もある。再三指摘してきたことだが、この問題では反例を構成することは求められていないからだ。たとえばいろいろな分布のグラフを用意しておいて、(1)「平均値=中央値」(3)「平均値=最頻値」が間違いであることを示している分布はどれなのかを選ばせてみるといった手法も取れたかもしれない。

この記述の後半にはもうひとつ問題がある。それはやはり「数学的な概念が頭の中でイメージ化されている状態」の意味が明確になっていないのではないかということだ。竹山氏の文章の中で、「平均」という概念の「イメージ」として肯定形で描かれているのは、その言語的定義「標本の観測値の合計をその大きさ(データの個数)で割ったもの」だけに過ぎない。あとの2つは否定形『「真ん中」「普通の状態」とは違うもの』としか述べられていない。「平均のイメージ」とは何かという答えに対して用意されているのは単なる「定義」のみであり、それだけをもとに『「平均」のイメージには限界が設けられているのだ。そこまで理解していて初めて、「平均」という概念を理解していると言えよう。』と言われても、「平均のイメージ」が何かはわからないままだ。

ここは報告書抜粋が丁寧に記述していると思う。

突出して背の高い生徒がいると平均が押し上げられること(小問(1)の反例)や、女子と男子では平均にかなりの差があり、クラス全体をグラフにまとめると「ふたこぶ」になり得ること(小問(3)の反例)など、日常で接するデータから小問(1)や小問(3)の反例を思い浮かべられることが望ましい。そのためには、基礎的な論理力のみならず、問題文に書かれた内容を情景として思い浮かべられる国語力も必要となる。これらの力は数学に限らず人文科学も含め広く科学を学ぶう上での前提となるものであろう。

私はこの文章の後段で「基礎的な論理力」とか「問題文に書かれた内容を情景として思い浮かべられる国語力」という言い方には違和感がある*1。こうした反例を構成できることを「論理力」とか「国語力」というキーワードで理解してよいのかどうか。むしろ私は、いろいろなデータを見せて理解してもらうという「経験知」こそ重要なのではないかという気がする。国会でも、所得階層の分布と所得の平均値との乖離がよく議論になるではないか。

ともあれ、この報告書抜粋の前段は、「平均値」ということに対するイメージとして、極端な値に対して影響されやすいこと、分布全体の様子を反映しているとは限らないこと、という2つの点が述べられている。私は「そこまで理解していて初めて、「平均」という概念を理解している」というべきだと思う。竹山氏の議論は、「言語的定義から論理的に帰結すること」に拘りすぎている印象がある。もっと理解しておくべき「平均のイメージ」はあるのではなかろうか。「平均値」が「極端な値に対して影響されやすいこと」「分布全体の様子を反映しているとは限らないこと」を理解しているかどうかまで問いたければ、問1-1はもう少し違った設計も可能だったのではないかと思うのだ。

竹山氏の記述をさらに見ていこう。

やや話は脱線するが、上のように言語化によって概念のイメージを制限することの意味について、少し述べておきたい。正規分布の場合には、「平均値」「中央値」「最頻値」の3つの値は一致するため、私たちはぼんやりした平均のイメージと、数学的な「平均値」の指し示すものが合致してしまう。しかし一般には、「真ん中」や「普通の状態」というイメージと、数学的に定義された「平均」との間にはギャップがある。このとき、数学の定義などジャーゴンに過ぎないと一蹴してしまうのも一つの方法ではある。しかし、実際のデータを扱う場面で「平均」という言葉の意味が人々の間で揺れていれば、生産的な議論にはつながらないだろう。これは「平均」に限ったことではない。議論を行う場面において、それぞれの参加者が定義を自己流の意味で使っていては、話がすれ違うばかりなはずである。言葉の意味を共有することはニュートラルな議論の出発点となる。数学が定義から始まる論理体系であることは、そのような「対話の知」を体現しているはずだ。

もし日常生活でわれわれの目に触れるデータの多くが正規分布であるという経験知があるのなら、実際のデータを扱う場面で「平均」という言葉の意味が人々の間で揺れていても、多くのデータでは問題が起きないのではないだろうか。むしろ、「平均値」「中央値」「最頻値」というものの違いが、時として議論をすれ違わせたり、あるいは意図的かどうかはともかくとして「統計でウソをつく」ことになるのは、われわれが日常で接する多くのデータが正規分布ではないからだろう。先ほどの文章とここでの記述に乖離を感じる。そして同時に、そのような場面で、誰も「数学の定義などジャーゴンに過ぎないと一蹴」などしていないだろう。このあたりも何を念頭において書いているのかがよく分からないのである。

「これは「平均」に限ったことではない。」から始まる部分は、やはり数学と社会の関係性についてナイーブな議論をしているように見える。「議論を行う場面において、それぞれの参加者が定義を自己流の意味で使っていては、話がすれ違うばかりなはずである。言葉の意味を共有することはニュートラルな議論の出発点となる。」という文でも、「定義」と「意味」の違いがはっきりしない。そもそも社会的に論じられる話題の中で、「定義」が明確に確定することが難しい話題も多い。率直に言って、「数学がわかる」ということの定義さえ曖昧なままだし、それは今回の調査の報告書概要版でも抜粋でも明確には述べられていなかった。にも関わらず、『数学が定義から始まる論理体系であることは、そのような「対話の知」を体現しているはずだ。』などと言ってみたところで説得力に乏しいように見えるのである。数学において厳密な議論ができることと、われわれの社会において問題になっていることを論じる場面でどう議論するかということとの間には相当大きな乖離があり、『「対話の知」を体現』などという安易な結びつけは適切とはいえないと思う。

さて、「数学がわかる」という状態を仮に上のように規定しておいて、これと「数学ができる」という状態を比較したい。「数学ができる」と言う場合、特に教育の現場では、数学の問題が解けて良い成績を上げられることを意味するだろう。したがって、「数学ができる」かどうかの判定は、どのような問題によってそれが測られるのかに依存する。たとえば、本調査の問1-1と同じく「平均」をテーマとする出題として、いくつかの観測値を具体的に与えて、その平均を計算する問題が考えられる。この問題であれば、
1.平均の計算法を記憶している。
2.足し算・割り算の計算が実行できる。
の二つの条件を満たせば正答できる。これを敷衍すれば、「数学ができる」ということの内容として
1.数学的な対象の計算アルゴリズムを記憶している。
2.そのアルゴリズムを誤りなく実行できる。
という二つの条件を抽出することができるだろう。これらの条件をみたすためだけなら、数学的な概念をそのイメージまで含めて理解している必要はない。

この「数学的な概念をそのイメージまで含めて理解している」=「数学がわかる」ことと「計算アルゴリズムの習得と実行」=「数学ができる」ことを分けて論じているのが、竹山氏の記事のひとつの大きな着目点であると言って良いと思う。この2つの観点で「数学の内容に対する理解」のレベルを観察すること自体に異議はない。しかし、そこには少なくとも2つの問題点があると思う。
第一に、この2つのレベルをどのような問題で判定するか、どのような現象から判定するかということだ。
第二に、この2つのレベルを比較したとき、「数学がわかる」ということを最大限重要視するべきかどうかは問題のテーマに依存しており、一概には決めきれない部分も多いのではないか、ということである。

第一の点について、今回の問1-1で「平均」ということの理解を問うている。この問題で3つの選択肢すべての正誤判定が正しく出来た人は、「平均の意味がわかる」層であり、残りは全て「平均の計算はできるが意味は理解していない」と断定してよいかどうかという問題がある。報告書概要版では、別の調査との比較がでているがそれはあくまで参考例に過ぎない。今回の調査結果だけを根拠に。今回の問題で間違えた人が4分の1いることこそが、「わかる」と「できる」の乖離を証明していると即断するべきではないと思う。そもそも「平均値」の計算をすべての人ができているかどうかはわからないからだ。たとえば国公立S群では、確かにそういう層が6%くらいいるのかもしれない。しかし私立C群でもそうだと断定する根拠はない。そもそも平均の計算が出来ない人もいるかもしれないのだから、この問1-1でそうした点が裏付けられていると見るのは拙速だと思う。

第二の点について、こちらはやや社会的な側面もある。平均という話題に絞れば、もちろん具体的な計算も出来たほうがいいし、社会的な問題の中に平均値・中央値・最頻値が問題になる場面が多いことを考えれば、平均の定義から論理的に帰結されることとして理解しておいたほうが良いという結論になるだろう。しかし、たとえば、高校生は微分積分の授業で、いろいろな関数の微分法や積分法を習うが、極限操作ということの定義それ自体やそこから論理的に帰結されることを理解しているかどうかはカリキュラム的に言っても難しいだろう。それを問題だと考えるかどうかはかなり分かれるところではなかろうか。連立一次方程式の解法もそうだろう。それらを解くアルゴリズムを知っておくことは大切だが、そういう人でも線形写像の言葉で理解できている人ばかりではないはずだ。「数学的概念のイメージまで含めた理解」というのがどのレベルのことを指しているのか、ということも本来は問題になる。微積分法の「イメージまで含めた理解」とは一体どこまで理解すればよいということなのだろうか。

こうしたことを念頭に次の記述に進みたい。

たとえば、接線の公式と、多項式微分の計算アルゴリズム(xnをnxn-1に置き換える)を知っていて、計算さえ間違えなければ、3次関数のグラフの接線の式を求めることはできる。その答えを求めるのに「導関数とは関数の局所的な変化率を記述する関数である」という理解は必要ない。

「関数のある点での微分係数とは、その点でも接線の傾きだ」というのは、竹山氏の言う、「計算のアルゴリズムを理解している」だけなのだろうか。上の記述の前半では、「関数のある点での微分係数とは、その点でも接線の傾きだ」という事実を利用している。それは「数学的概念のイメージまで含めた理解」とは違うのだろうか。導関数とは、各点でその点での微分係数、つまり接線の傾きを対応させる関数なのである。それはそれでひとつの「数学的概念のイメージまで含めた理解」のはずだ。それは、「導関数とは関数の局所的な変化率を記述する関数である」という理解と、少なくとも高校生にとってはほとんど等価なものではないか。これは例が悪いと言う以外にない。むしろ、では多項式微分の計算アルゴリズム(xnをnxn-1に置き換える)の証明や根拠を問うとできなくなる学生はいるだろう。それは確かにアルゴリズムだけを理解していて、数学的概念を理解していないのかもしれない。しかしその場合、本質的には極限とはないかという点まで戻ることも可能になってくる。どこまでが「数学的概念の理解」なのかが問題になる。竹山氏の議論の中にも、「できる」と「わかる」の違いをあまり十分に捉えきれていない部分があるように見えるのである。

つまり、概念を理解していなくても、公式を覚えて計算アルゴリズムさえ身につけてしまえば「数学ができる」。難しい問題であっても、いくつかの公式と計算アルゴリズムを上手く組み合わせれば、正解らしい数値はとにかく出せる。この意味で「数学ができる」ことが、設定されている目標(たとえば志望校合格)に対して十分なものであれば、「数学がわかる」必要はない。冒頭で紹介した「大学基礎教育アンケート」の回答にあった「型にはまった問題はできるが、それから外れると急にできなくなる」「解法パターンを欲しがる」という指摘は、数学がわかることよりも問題が解けることを重視する姿勢が、学生の間で広く見られることを述べたものであろう。そして、この傾向が学力低下として捉えられたということは、「数学がわかる」と「数学ができる」との間に大きな乖離があることを示している。

このあたりは、むしろイメージが先行しすぎているのではないかという疑念がある。たとえば大学入試の問題が「概念を理解していなくても、公式を覚えて計算アルゴリズムさえ身につけてしまえば」解けるのだろうか。「難しい問題」がどういうものを想定しているかはわからないけれど、たとえば国立S群に属するような大学の入試問題が、「いくつかの公式と計算アルゴリズムを上手く組み合わせれば、正解らしい数値はとにかく出せる」のだろうか。今回の調査では、作図の問題を除けば、国公立S群の成績はそんなに悪くはなかったはずである。それでもなお「難しい問題」を解いているこうした大学群で「計算アルゴリズム」の理解だけを徹底し、「数学的概念の理解」がおろそかにされているというのだろうか。今回の調査結果を見る際には、いろいろな要因を見る必要がある。単にある設問の出来が悪かったからといって、これは「計算アルゴリズムの理解」だけが先行し、「数学的概念の理解」がおろそかになっているのだと断定するべきではない。たとえば、私立の中には数学を使わずに入ってきている学生がたくさん入っている可能性がある。使わないものを忘れてしまっているのだとしたら、数学的概念の理解どころか計算アルゴリズムまで忘れているかもしれない。数学を使用しなかった学生が、計算アルゴリズムを理解し実行できる保証はどこにもない。

「型にはまった問題はできるが、それから外れると急にできなくなる」「解法パターンを欲しがる」といった傾向が問題視されているようだが、思えば、われわれは身の回りの様々な機器の使用法は知っていても、その仕組みを知らないということはままあることだ。そしていつもと違うことがおきると上手く対処できなくなることもある。数学に限らず多くの場面で、「アルゴリズムの理解・実行」はできていても、「概念のイメージまで含めた理解」は十分ではないということが起こりうるし、そのすべてが問題だと言っていたら、概念を理解するだけで時間を費やしてしまうことになるだろう。それはそれで問題になるかもしれないのだ。概念を理解するには時間がかかる。少なくともアルゴリズムは理解して計算できるようになろう。その仕組みはもし興味が出てきたら後で補えばいい。というような立場もありえる。すべての概念の理解を達成することはできないからだ。数学も他の様々な概念とのトレードオフアルゴリズムの理解と計算遂行に重点が置かれているという可能性はあり、しかもしれが一概に問題視されるべきだとは思わない。

どうも今回の調査側は「数学がわかっていない」ことを殊更強調したいという意図を持っているように見える。しかし、全ての大学生が高校までの数学について「イメージまで含めた理解」をしていなければならないと主張するなら、やはりそのことに対する十全な説明が必要なはずである。少なくとも今回の調査問題に関しては説明しなければならないはずだ。私は平均の問1-1と論証の問1-2はそれなりに意義を評価したいが、残りの設問とその採点方法については懐疑的である。

問2-2は、以上で述べた乖離を意識して作問された。この問題は、仮に大学入試で出題されたなら悪問と見なされるだろう。たとえば「重要な特徴」という言葉に、数学的な定義はない。何を重要な特徴と見なすのかは文脈に依存するし、文脈が無いのだとしたら、人によって異なるのが当たり前だ。少し数学的に考えて、「放物線を一意的に特徴付ける条件」を尋ねているのだと理解しても、それならば特徴を3つも挙げなくてよい。たとえば、頂点の座標と、他に通る一点の座標を決めれば、放物線としては一意に決まってしまう。しかし、放物線が通る三点の座標を挙げることが「重要な特徴」とは言い難い気もする。かくして「この問題は解答者を迷わせる悪問だ。採点基準にも数学的に完璧な正当性などない」と断罪したくなる。私自身も含め、自由な発想と確固たる論理性に数学の本質を見る人ならば、そのような感想を抱くだろうと思う。

上で竹山氏自身が

議論を行う場面において、それぞれの参加者が定義を自己流の意味で使っていては、話がすれ違うばかりなはずである。言葉の意味を共有することはニュートラルな議論の出発点となる。数学が定義から始まる論理体系であることは、そのような「対話の知」を体現しているはずだ。

だと言っていたことを忘れてしまったかのような開き直りの記述である。「重要な特徴」という表現に定義はなく、文脈や人に依存するのだとしたら、竹山氏が述べていた「議論の出発点」である「言葉の意味を共有すること」などできていないし、まさにそのような「対話」などできようはずもない。ましてやこれは一つの調査であるから、回答者が如何様にも意味を解釈できるような言葉を使っておいて、それを「論理的コミュニケーション」云々と関連付けること自体まったくのダブルスタンダードだ。もし定義を明確に、そこから導かれる論理的帰結を問うことを、数学におけるひとつの美徳とみるのならなおのこと、出題側自身がその原則を踏み外すような行動をすることは絶対に避けるべきだった。こういう独りよがりな態度は看過できない。

竹山氏は上のような記述のあとで、この問題の効果を次のように説明する。

しかし、「解法パターンの丸暗記」と「数学がわかっている状態」が、数学的に隙の無い問題では判別できなくなってしまったのだとしたら、少し別の方向性を探ってみてもよい。問2-2は、このような意図も込めて設計された。問2-2のような問題を実際の大学入試で出題するには、採点の公平性をいかに保つかなど、多くの課題を解決せねばならないだろう。ただ、本調査の実務に参加した私個人としては、このような曖昧な内容を持つ問題で、かつ多少の価値判断を含む採点基準であっても、「数学がわかる」という状態がある程度測れるという、新たな可能性を垣間見られたように思う。

『「解法パターンの丸暗記」と「数学がわかっている状態」が、数学的に隙の無い問題では判別できなくなってしまった』という根拠は一体何であろうか。こういう記述には複数の問題点がある。

そもそも、大学入試の問題は、「解法パターンの丸暗記」と「数学がわかっている状態」とを峻別して、「わかっている状態」の学生だけを取ろうとして設計されているのだろうか。そうではない。まず「解法パターンの丸暗記」あるいは「計算アルゴリズム」の理解ができているかどうかを試す問題を出題して、それが出来ない人は数学ではあまり評価しないことにしましょう。その上で、今度は、「数学がわかっている状態」の人にはより高得点が出せるように「型にはまらない問題」も出しておきましょう。それがごく一般的な入試問題の設計方針のはずだ。そして同時に、数学が少しできていなくても、たとえば「解法パターンの丸暗記」までにとどまっていても、他の科目で相応のよい評価が得られるような得点を出せば、総点を見ることで合格にしましょう。これが複数の科目を試験科目として課す入試制度のシステムだ。「解法パターンの丸暗記」のレベルにとどまっている学生がそれなりにいるということと、『「解法パターンの丸暗記」と「数学がわかっている状態」が、数学的に隙の無い問題では判別できなくなってしまった』ということとは全く話が違う。

第二に、今回の調査問題の出来をみると、偏差値と正答率の間に明らかな相関があることになり、これは大学入試問題で判定されている学力と何も違いが無いのである。もし、大学入試問題が『「解法パターンの丸暗記」と「数学がわかっている状態」が、数学的に隙の無い問題では判別できなくなってしまった』のだとしたら、今回の試験によって新たな判別法が得られたわけでは決して無い。同じ分類しか提供できていないのだから。

第三に、今回の調査問題では、『「解法パターンの丸暗記」と「数学がわかっている状態」』を判別できているかどうか不明である。なぜなら、「解法パターンを丸暗記」しているかどうかを確かめる設問がないからである。問2-2で不正解だった人が「解法パターンの丸暗記」ができているなどと断定する根拠はどこにもない。理工系と文学系で正答+準正答率が63.9%と20.8%と大きく開いていることからもわかるように、そもそも数学を試験科目で使っていない学生が、放物線のことなんて完全に忘れていて、「解法パターン」すら何も覚えていない可能性も高いのである。

そうであるにも関わらず、「このような曖昧な内容を持つ問題で、かつ多少の価値判断を含む採点基準であっても、「数学がわかる」という状態がある程度測れるという、新たな可能性を垣間見られた」と断定するのは一体どういう根拠によるものなのか全く不明である。

次回、学習指導要領が設定する「数学のよさ」についての部分を検討しようと思う。

*1:そもそも「問題文に書かれた内容を情景として思い浮かべる」ことは「国語力」なのか、など。