日本数学会による大学生数学基本調査への疑問（その3）─結果の分析について─

　今回の調査目的は、冒頭から抽象的である。「高等教育を受ける前提となる数学的素養と論理力」とは何かということが全く定義されていない。
基本調査に至る経緯の中で、

「1.読解・表現などの国語力 2.抽象的・論理的思考力 3.知識に対する意欲や忍耐力といった、ごく基本的な能力が学生の間で低下しつつあるという現実」

という表現や

「論理的文章を読解する力、論理を組み立て表現する力」

といった表現もあるが、そもそもそういう力をどういう問題で調査できるのかということ自体非自明であり、「数学」ということとどう関係しているのかということについても十分な説明がなされているとは言いがたい。

　私は、そうした一般的な問題はとりあえずさておいても調査しデータを取ることが重要だという意見にはむしろ賛成する。データを伴わない主観の応酬を繰り広げるのと、不完全ではあるかもしれないが何がしかのデータをもとに議論するのとでは雲泥の差があると考える。だから私はこの調査を行うことそのものは賛成する。もともと十分に定義することが難しいものを何とか把握しようとしているのだから、調査には不完全で行き届かない部分があっても仕方がない。数度の調査を経ながら徐々に改善していけばよいと思う。

　しかし、得られた結果を非常に重大視することには慎重であるべきだ。その結果を針小棒大に述べてはいけないし、またそう述べていると受け取られかねない記述は避けるべきだ。自分たちにも行き届かないことがある可能性が高いのなら、それなりのトーンでしゃべるという謙虚さが必要だと思う。今回の「報告書の概要版」などに見られる書きぶりは、少なくとも私には、そうした謙虚さを欠いていると感じた。それは、見る人が見れば「独りよがり」と批判されても仕方のないものだとさえ思う。

以下、いくつかの観点を具体的に指摘したい。

数量的なデータに対する主観的断定が行き過ぎている。

例えば、「提言」p.2の「基本調査の結果とその分析」では、

問1では「平均の定義と定義から導かれる初歩的結論」、「少し複雑な命題の論理的読み取り」のどちらも誤答率が高く

二次関数の性質を列挙する問題では、意味不明の解答が多く、準正答のなかにも、すでに挙げた性質を再度挙げる解答が目立ちます。

平面図形と定規とコンパスで作図するということが何を意味するのか理解していない答案が多く

といった「高い」「多い」「目立つ」といった表現が使われている。しかし問1-1の正答率は平均で76.0%であり、問1-2は平均で64.5％が正答である。このデータを見て単に「誤答率が高い」と記述することには私は疑問がある。しかもこれは全体の平均であって、実態は国立Sから私立Cまで正答率はかなり幅がある。それをひとくくりに「誤答率が高い」と総括してしまうのはまずいと私は考える。このような書き方は単なる主観の表明に過ぎない。例えば「事前に出題者が想定していた正答率に比べると」というような表現がつけば主観の表明でも意味を持つはずだ。

こうした例は他にもある。「報告書の概要」p.2では、問1-1の平均に関する問について

理工系でも約2割が不正解。
理系高校生の2005年度基礎学力調査報告（東京理科大数学教育研究所）によれば、平均を求めさせる典型的計算問題（問題B5）の正答率は92.5％。単純には比較できないが、「平均を計算できる」のに「平均の正しい意味がわからない」という層がかなりいることがうかがえる。

という文章がある。理工系以外もすべて含めて単純に正答率を比較すると、92.5％-76.0％＝16.5％である。理工系の正答率82.0％なので、この場合は92.5％-82.0％=10.5％である。これがすべて「平均を計算できる」のに「平均の正しい意味がわからない」層であると仮定したとして、それは16.5％あるいは10.5％である。これを「かなりいる」と記述してよいかどうか。私はそれは主観に過ぎないと思う。
　あえて私の主観を述べるなら、私はこの数字から「平均を計算できる」のに「平均の正しい意味がわからない」層は意外に少ないという印象を持った。もっと間違いが出てもよい気がした。しかし、それは、なぜこの選択肢が正しくないのかという根拠を明示できるかどうかを調べてみるまではなんとも言えないという印象もまた持たざるを得ない。

もうひとつの例はFAQp.3のQ11にある。

二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層が存在し、また、それが無視できないほど大きな割合になることが明らかになりました。

という表現が使われている。単純に正答率を見ると、39.5％が正答、準正答をあわせると合計53.0％である。のこりの47.0％がすべて「二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層」なのだと判断しているのだとすれば、それはそれなりに大きい数字で「無視できないほど大きな割合」かもしれないが、しかし少なくとも私は典型的誤答の例として掲げられている

「間違った観点を挙げる（例：原点を通る、頂点は(3,-17)）、自己流の用語の導入（「上に凸」を「∩型」と書く）」、挙げるべき3つの項目のうち空欄がある等」

という答案をすべて「二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない」と断定してしまうのは無理があると思う。しかし、もし誤答者をすべて「二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層」だと判断したというのなら、少なくともそう明言するべきだ。いったいどれだけの答案を「二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層」と判断しているのか、「無視できないほど大きな割合」とは具体的にどういう値なのかが判然としない。こうした書き方は主観的との謗りを免れないと考える。

今回の調査だけを根拠に断定する記述が多すぎる。

今回はせいぜい5つの問を用いた調査である。しかもこれは第1回の調査である。そうした限定的な例だけを根拠に、例えば

論理を正確に解釈する能力に問題があることを示しています。（提言p.2問1についての分析）

論理を整理された形で記述する力が不足しています。（提言p.2問2についての分析）

という記述が出てくる。問1は平均に関する問題と論理的文章の読解をそれぞれ1つずつ試してみただけではないか。問2-1はあまりに基礎的過ぎる「偶数と奇数の和が奇数であること」の証明を求めただけであり、問2-2は放物線の特徴を問うただけではないか。（しかも問2は私が考えるに、問題文自体に調査者の要求がないかを具体的に示しきれていない点があったと思う。仮にそのことを別にしたとしても、）たった2つずつの問から「論理を正確に解釈する能力」や「論理を整理された形で記述する力」について、一般的な断定を行うこと、またそのような断定を行っていると受け取られるような記述は避けるべきだと考える。

　他にも行き過ぎた断定と感じられる箇所がある。
　例えば、大学の授業に関連した次の2つの記述である。

（問2-1に関連して「報告書概要版」p.4）国公A・B群、私A・B・C群においては、1クラスの中で、数学の記述試験の経験がある層とそうでない層との間にバラつきが大きい傾向が見られ、授業の成立を困難にしていると推測される。

（問2-2に関連して「報告書概要版」p.5-6）国公A・B群、私S・A・B・C群では、1クラスの中で、数学の記述試験の経験がある層とそうでない層との間にバラつきが大きい傾向があり、授業の成立を困難にしていると推測される。

問2-1は「偶数＋奇数が奇数になることの理由説明」を「文字式を用いた厳密な証明を与えること」と諒解した上で正しく述べられることが要求されている。また問2-2は、与えられた放物線の重要な特徴を3つ、文章で答えさせる問題だった。この2つの結果が「試験を受けているかいないか」という軸でばらついているということを根拠に、「授業の成立を困難にしている」要因のひとつが記述試験の経験の有無だというのは言いすぎではないか。確かに「記述試験の経験の有無」がこの2問の出来をわけたことは事実で、それはより広範なレベルで数学の基礎学力の差を生んでいる可能性はある。しかし、そもそも記述試験を受けていても、大学の授業の成立を困難にしてしまう要因を持っている可能性もまたある。記述試験の経験がある層の中でもさらに基礎学力のバラつきがある可能性はかなりあるのではないか。こうした様々な可能性があるなかで、「記述試験の経験の有無」が大学の授業を成立させるか否かを分けるかのように書いてみたり、またこのことを根拠に「記述試験を設けるべきだ」と一般的な主張してしまうのは行き過ぎだと考える。

　もうひとつの例は、選択可能な進路に関する記述である。

（問2-1に関して「報告書概要版」p.3）私S群では4人に3人が準正答に到達せず、国公A群における正答＋準正答率が35.7％％（ママ）と、国S群の半分を切っており、国S群とそのほかの群との傾向の差が著しい。（グラフ1）
基本的論証力を身につけているかどうかが、選択可能な進路の幅を大きく左右している可能性。

（問2-2に関して「報告書概要版」p.5）国公立は正答＋準正答は5割を超えたが、私立ではS・A・B・Cすべての群で5割を切る。国S群では「重篤な誤答」を書く学生はほとんどいないが、私S・B・C群では2割以上の学生が「重篤な誤答」を書く。（グラフ2）
（中略）
個々の知識だけでなく、知識を総合する力の有無が、選択可能な進路の幅を左右する。

まずこの2問だけで「基本的な論証力を身につけているかどうか」や「知識を総合する力の有無」が測れているとするのは行過ぎているのではないかということはすでに指摘した。また、こうした問題の出来がある程度大学の偏差値に連動しているのは当然で何も目新しい結果ではない。本人の持っている学力（やや乱暴に言えば試験の成績）が「選択可能な進路の幅を左右する」のは当然である。いまさら声高に言うべきことだとも思えない。また、それが「基本的論証力」や「知識を総合する力」とどの程度関係しているのか、この2問だけで判断することは到底無理だ。そもそも「基本的論証力」や「知識を総合する力」という表現自体抽象的でどういうことさしているのかはっきりしない。この2つの記述は、「基本的論証力」や「知識を総合する力」が、偏差値の高い大学へ進学するためのバロメータであり、それが最終的な就職先や年収などに関わってくるのだという主張を補強したいためになされているのではないかという疑いさえ抱かざるを得ない。ちなみに、2つめの記述では1つめの記述にあった「可能性」が抜け落ちた断定になっていることにも注意するべきである。

比較の方法や結論の出し方に問題を感じる部分がある。

　「報告書概要版」p.3に、問2-1に関連して次のような比較の文章がある。

文部科学省による中学3年生を対象とした平成22年度全国学力調査では「3つの連続した奇数の和が奇数になる」ことの論証問題が出題され（B問題2-(2)）、正答率は26.4％。私立のすべての群において、この結果と同程度か下回っている。

実際に全国学力調査で出された問題は次のようなものだ。

ちなみに、この問題は「3つの連続した奇数の和が奇数になる」ことの証明ではない。「3の倍数になること」の証明である。報告書概要版の記述は正しくない。
それはさておくとして、この問題は(1)で「3つの連続する奇数の和は9の倍数となる」という間違った予想の反例を考えさせた上でこの(2)の問題に至る。（その1）で私が述べた考え、つまり、予想することと証明することの違いを明確化させることについて配慮されていると感じた。それはさておくとして、この問題の質問形式は、「予想が正しいことの説明を完成させなさい」である。
これは次の2つの点で今回の「偶数と奇数をたすと、答えはどうなるでしょうか。次の選択肢のうち正しいものに○を記入し、そうなる理由を下の空欄で説明してください」とは異なっている。
第1に、命題の真偽があらかじめ与えられているかどうかの違い。学力調査では「3の倍数になる」ということは与えられているが、数学基本調査では「いつでも偶数、いつでも奇数、偶数・奇数どちらもある」から選ぶ形なので結論はどれかあらかじめ与えられれているわけではない。
第2に、学力調査の問題では、「n を自然数とすると，連続する３つの奇数は，２n-１，２n+１，２n+３と表される。したがって，それらの和は，（２n-１）+（２n+１）+（２n+３）＝」までが誘導されている。これらなば文字式による証明が求められていることは一目瞭然である。
この2つの点で数学基礎調査が全国学力調査の形式を採用していれば、正答率は向上したに違いない、と考えるのは十分合理的であると私は思う。その意味で、全国学力調査の問題と今回の数学基礎調査の問題を比較し、「正答率は26.4％。私立のすべての群において、この結果と同程度か下回っている。」などとことさらに強調するのは間違っていると私は考える。

　もうひとつの例は作図に関する問3である。報告書概要版のp.6に次のような記述がある。

理系高校生の2005年度基礎学力調査報告（東京理香大学数学教育研究所）によれば、相似と比に関する典型的問題（問題D6）の正答率は87.9％。単純には比較できないが、比や相似を現実的な問題解決（測量等）に利用する数学活用力に課題があるのではないか。

この「相似と比に関する典型的問題」というのがどういう問題だったのかはネット上で見られる形になっていないようなのでわからなかった。しかし、おそらくそれは作図に関する問題ではなかったのではないか。問3で正答率が伸びなかった原因は、相似の利用云々以前に、作図問題であるということのハードルの高さだったのではなかろうか。提言p.2では、

問3では、平面図形を定規とコンパスで作図するということが何を意味するのか理解していない解答が多く見られました。高校までの教育でこうしたことがきちんと教えられていない可能性もあります。

と述べている。つまり、「定規とコンパスで作図する」ということに対する理解が正答率を下げた最大の要因なのではないか。にも関わらず報告書の概要版では、「比や相似を現実的な問題解決（測量等）に利用する数学活用力に課題があるのではないか」と評価してしまっている。これでは提言の記述と報告書概要版の記述がズレてしまっているといわざるを得ない。

またあえて指摘するなら、目盛りのない定規とコンパスを用いて与えられた線分を3等分することが、本当に「現実的な問題解決（測量等）」に「相似や比」を利用する「数学的活用力」を見ることになっているのかという疑問がある。現実問題として与えられた線分を三等分せよと言われたとき、目盛り付きの定規で実測するというのが常に誤りであるとは到底思えない。測量というのが多くの大学生にとっての現実的問題かどうかもにわかには肯定できない。こうした疑問は誰でも考えうるものであり、この報告書概要版のような記述をするのであれば、十分な説明が必要であると考える。

対照群の設定の拙さがある。

日本数学会が今回の調査結果といわゆる「ゆとり教育世代」との因果関係をどう考えているのかが不明瞭であること、報道された内容や理事長の会見での発言、新井紀子氏のツイッターでの発言の間に齟齬が見られることは（その5）で指摘するが、実施した日本数学会の真意がどこにあるかは明確にされていないようだが、報道する側が「ゆとり教育世代」の「学力低下」という切り口で報道したことは事実であり、また受けての側もそのような受け取り方が少なからず見られたことは間違いない。
　しかし、今回の調査だけを根拠に、「ゆとり教育世代」の「学力低下」が裏付けられたとするのはやはり問題があると考える。そのもっとも重要な理由は、今回の調査では今の世代しか調査対象となっていないからである。
　提言p.1では、1996年に行われた大学教員を対象とする「大学基礎教育アンケート調査」について触れたり、「教育委員会メンバーがさまざまな大学の教員から意見を集めたところ」といった記述がある。しかしこれらの調査や意見がどれだけデータを根拠にしたものかは不明である。教える側の教員の「体感」というのは根拠としてはデータに基づいたものではないという点で客観性に欠けている。
　当然過去の同様の調査との比較や現在の多様な世代で同じ調査を実施した結果と比較するというような対照実験を行わない限り、「ゆとり世代」ということと「学力低下」を結びつけることは難しい。もし日本数学会が「ゆとり教育世代」と「学力低下」の因果関係について何らかの結論を下すなら、こうした対照実験は不可欠のものであり、その点では調査に不備があるといわざるを得ない。

　こうした対照群の設定の拙さをうかがわせる記述が個別の論点でも見られる。

　「単純には比較はできないが」という注釈がついているとは言え、報告書概要版p.2とp.6で「理系高校生の2005年基礎学力調査」が引用され対照群として取り上げられている。
　それを根拠に問1-1について「『平均を計算できる』のに『平均の正しい意味がわからない』という層がかなりいることがうかがえる」と結論している。この結論の出し方の主観性についてはすでに（その3）で指摘した。しかし対照群という意味で考えると、2005年に高校1年生だった人は、2012年に大学4年生になることになるので、今回の調査で実際に調査対象となった大学生は、2005年に中学生だった可能性もある。少なくとも、例えば問1-1では、実際に平均の計算を行う問題と問1-1を並列して出題し、両方解かせればわざわざ2005年の調査を持ち出す必要はなかった。
　問3の作図の問題でも、「相似と比に関する典型問題」の正答率との比較が行われているが、これの場合には、問題のレベル、特に作図法が扱われているという点が決定的に異なっており、単純な比較は意味をなさないと思われる。
　他にも、報告書概要版p.3では問2-1に関して、「中学3年生を対象とした平成22年度全国学力調査」が取り上げられている。しかしこれも単に「3つの連続した奇数の和が3の倍数になること」の証明を直接問うたのではなく、文字式を用いて論証するように誘導をつけたもので、問題の形式自体は異なっている。こうした問題と比較することには無理があると感じられる。

　FAQp.3Q.11にある問2-2に関する記述でも、「『できる』と『わかる』の乖離を調べるために、あえてこのような設問を設定しました」とあるが、これも何が「できる」であり、何が「わかる」なのかが曖昧であるために、適切な対照群を設定できているとは言えないと思う。もし何かこうした「乖離」の実態を明らかにしたいならば、両者の観点からの設問を設定するべきであり、問題文の書きぶり「重要な特徴を文章で3つ」からそうした乖離が明らかに出来ると考えるのには無理があると考える。

「重篤な誤答」という表現は酷すぎる。

（その3）の最後に、「重篤な誤答」という表現に関わる問題も指摘しておきたい。
「重篤な誤答」という表現は、報告書概要版の問2-1,問2-2に関する分析で登場する。
問2-1に関する分析（p.3-4）では、

重篤な誤答には、1.いくつかの例を示すことで論証したと考えるタイプ、2.奇数や偶数の定義が間違っているタイプ、3.トートロジーを繰り返す、4.あいまいな言説への逃避や無関係な事柄からの類推、などがある。以下が実際の答案の例。

「2+1=3、4+1=5だから」（タイプ1）

「思いつく奇数と偶数を足してみたらすべて奇数になったから」（タイプ1）

「偶数を2x、奇数を1とおくと、その和は2x+1」（タイプ2）

「割り切れないから」（タイプ3）

「奇数は奇数をたさないと偶数にはならないから。」（タイプ3）

「偶数は2で割り切れて、奇数は2で割ると1余るということから」（タイプ3）

「どんなに数が大きくなろうとも、1の位は同じ循環をし続けるから」（タイプ4）

「偶数をたすことは和の偶奇に影響を与えないため、奇数に偶数をたすと、いつも必ず奇数になるから」（タイプ3,4）

「三角と三角を足したら四角になるのと同じで、四角と三角では四角にならないから」（タイプ4）

この例示においても、例えば3番目はタイプ2というよりタイプ1であろう。4番目、6番目、8番目を「トートロジーを繰り返す」と断定することに問題があると思われる点は既に指摘した。しかし、少なくとも私には、これらの解答がたとえ数学的には不十分であっても、当たり前のことを聞かれて戸惑いながらもなんとか説明しようとした気配が感じられる。「割り切れないから」などというのはもうこれ以上どうかけばよかったのかわからなかったのだろう。余りに当たり前すぎる問題だからこういうことが起きてしまったのだということをもう少し考慮するべきだと考える。

しかしよりいっそう問題なのは、「重篤な誤答」の定義である。これが問題2-2の分析（p.5）に出てくる。

重篤な誤答とは、採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難な、論理的コミュニケーションの前提が崩壊している誤答である。以下が実際の答案の例。

「原点は-の位置にある」「左上がりの放物線」「右下」「原点がy軸より右」「原点が上」「真ん中より下」「線は左上から右下へ書かれる」「右上にある」「直線。下から上へ」「-6ずつ下がる」「2本できる」「曲がった感じのやつ」「反比例している。反対側にグラフができる。」「マイナスの場所」「2の値を通る」「傾きは-8」「ゆるやかな曲線」「xに1,-1など数字を代入して出た値をグラフに点を打っていくと正比例になる。」「細い」「プラスには存在しない」「直線の交わってる」「xは-6」「-8が重要。+6xも大切。」

問2-1の分析に出てきた「重篤な誤答」と問2-2の分析に出てきた「重篤な誤答」というのは、当然同じ定義なのだと理解してよいと思う。そうすると、問2-1で挙げられた例は、「採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難」な答案なのか*1。「割り切れないから」とか「偶数は2で割り切れて、奇数は2で割ると1余るということから」とか「偶数をたすことは和の偶奇に影響を与えないため、奇数に偶数をたすと、いつも必ず奇数になるから」という理由説明が「採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難」だというのは到底信じがたい。それが数学的な説明として十分ではないということと「採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難」であるかどうかはまったく別の問題である。この定義と例に、私は到底納得できない。

ましてや「論理的コミュニケーションの前提が崩壊している」などというのは罵倒であり誹謗中傷ですらある。「割り切れないから」「偶数は2で割り切れて、奇数は2で割ると1余るということから」「偶数をたすことは和の偶奇に影響を与えないため、奇数に偶数をたすと、いつも必ず奇数になるから」などと答えた人に向かって、「あなたの答案は論理的コミュニケーションの前提が崩壊している」と批評するのは行き過ぎとしか言いようがない。数学的内容が不十分であったり、数学的誤りが含まれている答案を書いてしまうことと、その答案において「論理的コミュニケーションの前提が崩壊している」こととは全く別の問題だ。やはりこの定義と例に私は到底納得できない。

あえてもう少し踏み込みたい。例えば問2-1で、「思いつく奇数と偶数を足してみたらすべて奇数になったから」というような答案であっても、「回答者が何を意図しているか」は理解できる。その答案を書いた人がどういう拙い論証をしてしまったのかは理解できる。これは重篤というよりむしろ「典型」だ*2。この答案を書いた人の論理は確かに間違っていた。しかし、「すべて」を論証するべきときに、「いくつかの具体例」で論証したつもりになってしまった人が、「論理的コミュニケーションの前提が崩壊している」と断定されなければならないのか。この答案は、少なくとも「理由を説明してください」という問いかけい対して応えたのである。「論理的コミュニケーション」を行おうとしたのである。しかし間違えたのである。それを「前提が崩壊している」と断定するのはあまりにも酷すぎる。「今あなたが使った論理は正しくありません。それではすべての場合について示せたというのは不十分です」と指摘すればよいだけのことだ。

これはこの調査の分析に関して幾度となく使われている「論理」という言葉の問題に関係している。それらは次回述べたいと思う。

もうひとつ付言しておくと、この調査に基づく提言の発表記者会見に出席していた新井紀子氏は、NHKのニュースの中で、「論理的コミュニケーションの前提が崩壊している答案が増えた」というコメントをしていた。これは、「論理的コミュニケーションの前提が崩壊している」という表現の拙さという今指摘した点に加えて、「増えた」という量的表現にも問題があると思う。これは第1回の調査であり、増えたかどうかを議論するためには、何らかの別のデータとの比較が必要だからである。その別のデータが何かをはっきりさせない限り、それは単なる主観的な印象の表明に過ぎないことになってしまう。

（この記事は公開後も加筆する可能性がある。）

*1:問2-2で出てきた例のレベルと問2-1で出てきた例のレベルがかなり食い違っているように思えることも指摘しておきたい。

*2:問2-2では二次関数なのに、比例や一次関数を思い浮かべている人がいる。これは二次関数というものの理解ができていないという意味で「重篤」だと私は考える。しかしそれは「回答者が何を意図しているか」が理解できないとか、「論理的コミュニケーションの前提が崩壊している」というような性質のものではなく、単に内容の理解や自分の手で実験してみることや数学的現象を日本語で表現することが不十分なだけだ。