日本数学会による大学生数学基本調査への疑問（その８）─続・報告会に参加して─

　　新井紀子氏の発言について、報告会における具体的な発言を取り上げてコメントしたいと思う。
　　私は今回の報告会で表明された新井氏の見解を批判的に検討したい。新井氏の見解がどの程度まで日本数学会、あるいはその会員の間で共通認識化しているかという点は、より慎重な吟味が必要である。しかし、私はそのことには踏み込まない。あくまで遡上に載せるのは、公表された提言・報告書概要版・FAQおよび報告会で配布された報告書抜粋と報告会における新井氏の見解のみである。
　　これは正式な議事録があるわけではないので、発言そのものを厳密に正確に書き起こしているわけではない。意味するところが変わらないように注意したつもりだが、もし新井氏の発言からズレてしまっているとすれば、その責任は筆者である私にある。また、発言順に振り返るのは避け、話題ごとに発言と私の意見を述べることにしたい。なお、発言の強調付けは私による。

調査結果について

この問題を見たとき、これで数学力の調査ができているのかということを疑問に思う方は少なくないと思う。
こんな簡単な問題で、あるいはこういう問題の形式で、問えるのかと。
もちろん「数学力」とはなんぞやという難しい問題はある。
しかし結果論から言うと、すべての設問において、偏差値ごとに右下がりの結果が出ている。
このことは、結果から言えば調査は、学力を図るという意味では、調査的には適切な問題だったというご評価を頂いている。

私は今回のことがあっていろいろな大学の入試問題を調べて見た。どの大学も難しい問題を出していて、偶数たす奇数が奇数になるというようなそんな問題は見たことがないけれど、
数字では十分スクリーニングができちゃう。これをどういうふうに受け止めればいいのかなと思っている。

多分数学の多くの先生は、あの問題〔問2-2〕を見て、異常に気持ち悪い問題だと、「重要な特徴」とは何ぞやと、こういうものを出すのは見識が疑われる、と思われたと思います。
これは入試ではなく調査で、どんなふうに書くかということを見たかったので、だったら正答率なんか出すなよというご意見も聞けそうですけど、
それは両面で見ていくということが必要なんじゃないでしょうか。
そして、スクリーニングができるということなんですね。
もちろん、あんな「重要な」なんて言い方をされて、混乱して、重要とはなんぞやと哲学的に考え込んで白紙になっちゃった子がいないとは限りません。
その子にはお気の毒だったと思いますが、これは試験ではないので、彼らの人生に何か悪影響を与えるわけではありません。
ご議論はいろいろあるかと思いますが、スクリーニングができたという問題だったということです。

「今回の学力調査の結果と偏差値群とが相関していること＝スクリーニングできたこと」が強調されている。しかし、偏差値群と正に相関する結果が出たことと「問題が適切か」ということとは、少なくとも別の問題であろうと思う。それは、「適切」ということを判断するための基準の取り方に依存して決まるものだからだ。新井氏の発言は、「結果論としては」という言葉を免罪符に使って、問題の適切性を擁護しようという趣旨であり、「適切さ」の根拠を何も明示的に述べていない。「結果として偏差値群と正に相関する問題」を「適切」と定義しているのなら、それは単なるトートロジーに過ぎない。
　　適切さの判断基準は様々に考えられる。
　　ひとつの定義は、調査の目的を合致しているかどうかだ。今回の調査の目的として、

「高等教育を受ける前提となる数学的素養と論理力を大学生がどの程度身につけているのか、その実態を把握」する（提言p.1）
「大学新入生の数学的素養と論理力の実態を把握」すること。（報告書抜粋）
「大学新入生の基礎的な数学力の実態について因子分析を行うこと、特に、数学の問題解決における言語表現に関しては誤答の具体的な内容を把握し、そのような答案に至る背景を明らかにすること」。（報告書抜粋）

という目的が掲げられている。統計的な分析は特に2番目と3番目に関係している。しかし、そもそもこの5問の適切性を「目的との合致」で判断するならばまず、それが、「高等教育を受ける前提となる数学的素養と論理力」を問うているかどうかの判断を行わなければならない。例えば問3の作図問題がそれに該当するのかどうかは当然議論の余地が残っているだろう。

　　　「実態を把握」するために適切であったかどうかも疑問がある。
　　それはひとつには回答時間の短さである。慌てて間違えるということは問1-1,1-2では容易に起こりうる。そして問1-1,1-2では、「具体的な反例」を述べることは求められていない。正しく選べたが、根拠や反例を言葉で説明することができなかった学生も多くいたであろうことは想像に難くない。3つの小問をセットで正答できるかどうかが果たして「実態の把握」として適切なのかどうかが問題なのである。
　　また、問題の問い方が回答の質に影響を与えてしまっているのではないかという点も指摘してきた。例えば問2-1で、「理由を説明してください」という問い方をしたために「文字式」を用いた説明を回避してしまい誤答と判定された答案の存在を否定できないのである。FAQp.2には、「式を用いず、言葉や図による説明を試みて不十分な解答にしか至らなかったのは全体の8.9％でした」と述べられている。この8.9％の答案が統計的に無視できるものなのか私にはなんとも言えないが、少なくともこのような回答を書いた学生が文字式による説明を求められれば少なくとも準正答レベルの回答を書いた可能性は決して否定できないと思う。問2-1で「文章で」と指定したことをにも問題があると指摘してきた。これによって、報告書抜粋で示されている5つの方法を遂行することのできる学生が、十分にその能力を回答に反映できなかった可能性を否定できないのである。

　　そして、「誤答の具体的な内容を把握」という目的に照らせば、「どんな答案をどのような根拠でどういう誤答と分類したのか」ということが決定的に重要である。とすれば、当然、正答と誤答とを区別する基準が適切かどうかという問題になる。「深刻な誤答」と「典型的な誤答」とを峻別する基準が曖昧なら結果に信頼性は低下せざるをえない。特に問2-1でこれが著しいことを既に指摘してきた。

　もし問題としての適切性を「偏差値群と正に相関すること」と定義するのだとしても、次のような問題点はぬぐいきれないということも指摘しなければならない。

学生の答案に対して、「論理的コミュニケーションの前提が崩壊している」などなどの罵倒を浴びせる行為は正当化されないこと。
今回の調査結果が、学生の「実態」を把握していると結論することはできないこと。「実態」を把握するには、「深刻な誤答」と「典型的な誤答」の腑分けのように、そもそも分類の基準が適切であるかどうかという問題点の検討が必要であることと同時に、そもそもたった5題しか判断材料がなく、しかもそのうちの1問は正答率が極めて低いという「事例の少なさ」もある。
今回の調査で実際に答案として現れなかったとしても、日本数学会（教育委員会）が、ある設問に対して「正答例」なるものを1つ設定し、そのほかの正答の「候補」について十分説明をしていないことは正当化されないということ。これは例えば問1-1の「有効数字」の考え方や問2-2の「重要な特徴」の基準が不明確であることに著しい。
たとえ偏差値群と正に相関しているといっても、現行の入試問題を今回の調査のような問題で代替できる/代替するべきという主張は正当化できないこと。少なくとも現行の入試制度がスクリーニングした偏差値群と正に相関しているというだけでは、現行の入試問題と今回の調査問題との間に「スクリーニング」という点では何の優劣も存在しないということである。（このことに関する錯誤は新井氏が入試問題のありようについて言及している点で著しい。）

などである。これらの観点はこのあとでも触れる。

深刻な誤答について

これでは「深刻な誤答でしょ」って私の方からいったわけではありません。
合議制で数学者が丸を付けたときに、「嫌だなぁ」と思ったものにはポストイットを付けて下さいとお願いしました。
それをデータに入れたところ、だいたいこういう傾向だなぁというものがでてきました。
ひとつは、主観的な印象と客観的な性質の区別がついていない誤答。
例えば、大きなグラフとか小さなグラフとか、右の方にあるグラフとか、下の方にあるグラフとか、何を基準にそう思っているのかがわからない。本人はそう思っているのかもしれないが、私達には伝わらない。
主観的な印象と客観的な性質の区別があまりついていらっしゃらないんじゃないかなぁと思う誤答がまずありました。
もうひとつは、指しているものがなんだかわからない誤答。
「２つある」とか、何が2つあるのか見てもちょっとよくわからない。
まぁそういうようなものがたくさんありまして。
それが先ほど宇野先生が話された、授業中にコミュニケーションがうまくはかれない学生がいるとか、ここ数年意味のわからない答案が増えたということの理由になっているのではないかと判断しました。

　私は、この問2-1は「深刻な誤答」と「典型的な誤答」と「正答」とを明確な根拠で区分けするにはグレーゾーンがかなり広くなりすぎているのではないかと考えており、その理由は、やはり設問が基本的過ぎるな部分を問うているからだと考える。これは問題の適切性と関係している。その点から見たとき、『「嫌だなぁ」と思ったもの』という極めて主観的な表現から何を読み取ればよいというのだろうか。これは採点した数学者に

「偶数＋奇数＝偶数+(偶数+1)=(偶数+偶数)+1=偶数+1=奇数」「偶数を2で割ると余りが0で、奇数を2で割ると余りが1である。したがって、偶数と奇数の和を2で割ると余りが1である。つまり、偶数と奇数の和は奇数である。」という2つの答案例と「例3：偶数を奇数にするためには偶数を足しても駄目だが、奇数を足せばよい」「例4：偶数同士を足すか奇数同士を足さない限り、整数の和は偶数にはならない。したがって、偶数と奇数の和は奇数である。」という2つの答案例を明確に区別した根拠は何か？
「割り切れないから」、「偶数をたすことは和の偶奇に影響を与えないため、奇数に偶数を足すと、いつも必ず奇数になるから。」という答案を「重篤な誤答」と判断した根拠は何か？

などと問うても「嫌だなぁ」と思ったからだという答えしか期待できないということなのだろうか。学生の答案の「論理性」や「客観性」の欠如を指摘している当の調査側が、「典型的な誤答」と「深刻な誤答」とを区別する根拠を「嫌だなぁ」という感覚的なレベルでしか言語化できていないのだとしたら、その区別をもとにした統計的分析にどれだけの信頼性が期待できるのだろう。そして「嫌だなぁ」と思う回答を「重篤な誤答＝採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難な、論理的コミュニケーションの前提が崩壊している誤答」とか「深刻な誤答」「論理的な説明の前提に立っていない答案」と言語化してしまうことで、さらに「主観性」に拍車がかかっている。「嫌だなぁ」では指しているものがどのような答案なのかがはっきりせず、合議した数学者はおのおのの主観に従って分類したにすぎないかもしれない。こんな説明しかできない人に「主観的な印象と客観的な性質」の区別ができていないなどと批判される謂れがあるのだろうか。
　　また、y=-x²+6x-8を扱っている以上、原点や第1-第4象限をひとつの基準にして「右側」「右下」などという位置情報を述べる答案や実数解に着目して「２つある」と述べる答案が出てくるのは当然である。少し想像力を働かせてみれば、その答案が何を言おうとしているのかがある程度つかめる答案も散見されるのである。前者の「右側」とか「右下」という主張は放物線の全体を見ると実は正しくないが、y軸とは交わりますかと聞けばおそらく正しいy切片を答えるだろう。単に「２つある」では何を指示しているのかわからないとしても「この2つというのは実数解のことですか？」と聞けばYesと答えるだろう。確かにこれらの答えは説明としては著しく不十分である。しかしそれを「論理的説明の前提に立っていない」とか「採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難な、論理的コミュニケーションの前提が崩壊している誤答」と断定するとしたら、「コミュニケーション」を放棄しているのはむしろ調査側のほうではないかという皮肉の一つも言いたくなるというものだ。そうした「主観的な回答」が出てきてしまった理由として、「重要な特徴を3つ、文章で」と問うた設問の形式によるものかもしれないという可能性を一顧だにしない姿勢が疑問なのである。　「この放物線はどのような放物線ですか？放物線の特徴がわかるように概形を描いてください。」の方がまだ客観的設問になったのではないかということである。これもやはり問題の適切性とも関連している。

深刻な誤答については次のような例がありました。
例示と論証、類似性と論証の区別がつかない。
さきほど、2+3=5だからという例をいうと論証だと思う。「説明しろ」という言い方がわるいんじゃないかというご意見もありましたけど、中学校の教科書では「説明しなさい」というふうに書いてありますので。彼らはそれを見てないとは思えない。
例示と論証の区別がつかない。典型的な学生の答えにこんな答えがありました。10個やってみたら、10種類やってみたら、そうなったと。10個できると信頼できると。
そういう感覚があるのかもしれない、と。それは、もっと前の段階でそれとこれは違うんだよというふうに伝えてあげられたらよかったなぁって。
どうしてそういう気持ちのままきちゃったのかな、っていうか、来ちゃったのがいけないって言ってるんじゃないですよ、
そのことを直すためのチャンスがもっと前に、あったらよかった。その人もきっと幸せだった。
いや今が幸せじゃないって言っているんじゃないですよ、もっと幸せだったんじゃないかって思う。
主観的な印象と客観的な性質の区別がつかない。
これはたぶん、数学だけじゃなくて、ほとんど全てのところで、このあといろんな困難にぶつかってしまう。
これももうちょっと早い段階で、なんとかスクリーニングして修正する機会がもっとたくさんあったらよかったんじゃないかなと思いました。
典型的な誤答には、数学用語を正しく用いることができないとか
計算しなさいっていったら計算できるんだけど、そのことが重要なことなんだなぁってことは意識をしないで、やれといわれればやるというような感じの場合ですね。
そのことを見ても、数学の価値観っていうもの伝えていくっていうのも数学者の大きな仕事だと思うんですね。
あの、いや数学者は自由が好きなので、それぞれが何を大事だと思うかってのは大事だとお思いになる方がとても多いので、
それは枠にはめちゃいけないっておっしゃる気持ちはわかるんですけど、やっぱり私達は何かのコンセンサスでこういうものが大事だ、こういう特徴が大事だっていうふうに思っているわけですから、
そのことをもっと伝えたらいいんじゃないかなというふうに思いました。

　　学習段階の発達に応じて、どのような言葉がどのようなレベルの論証を求めているのかということは変わっていく。少なくとも「理由を説明せよ」と「証明」とでは、厳密さのレベルが全く異なるというのが高校終了時の認識だと考えるべきなのではないだろうか。中学生に対して使われている言葉遣いとその答えの形式から、大学新入生も同じように考えるべきだという断定こそが独善的なのだ。「彼らはそれを見てないとは思えない。」などというのは全く理由になっていないし、また「理由を説明せよ」と「証明」とで学生の回答がどの程度変わるかは今回の調査では検証できない。しかし、例えばFAQp.2で「『証明せよ』と書くとそれだけで無回答が増える可能性があるので避けた」という文章がある。「理由を説明せよ」と書くのと「証明せよ」で学生の行う回答に差があるとしたら、それは「理由を説明せよ」と「証明せよ」との間には求めている回答の質に違いがあると、少なくとも学生側が認識していることになる。証明せよと言われると何を書いてよいかわからないのだが「理由を説明せよ」なら「証明せよ」よりも少し厳密性に欠ける説明を述べてもよいだろうと考えて、、「偶数をたすことは和の偶奇に影響を与えないため、奇数に偶数を足すと、いつも必ず奇数になるから。」と書いてみたら、あなたの回答は「論理的コミュニケーションの前提が崩壊している誤答」であると断定されたのである。これは一種のハラスメントなのではないかと言ってしまうのは言いすぎであろうか。
　　「証明せよ」と書くと白紙が増えるかもしれないから「理由を説明せよ」にしておこうなどという判断をするしかないような問題で、「高等教育を受ける前提となる数学的素養と論理力を大学生がどの程度身につけているのか、その実態を把握」するとか、-「大学新入生の数学的素養と論理力の実態を把握」するとか、「大学新入生の基礎的な数学力の実態について因子分析を行うこと、特に、数学の問題解決における言語表現に関しては誤答の具体的な内容を把握し、そのような答案に至る背景を明らかにする」ということに無理があるのではないだろうか。

　　あえて少し過激な言い方をすれば、「例示だけで論証したことになる」と思っていることさえ、実態はもう少し正確に見る必要があり、しかもその分析を述べる際の表現は慎重にするべきだと思う。厳密な証明が思いつかないとき、具体的な例を使って検証してみることは大切だ。とりあえず厳密な証明として何をかけばよいかわからないから、いくつか例を書いておこうかもしれない。その学生は、もしかしたら、「例示」だけでは厳密な証明と言えないことは理解していたかもしれない。しかし設問で聞かれていることがあまりにも当たり前で証明できないので、仕方なく成り立つ例をいくつか書いたのかもしれないのだ。そういう学生に「論理的コミュニケーションの前提が崩壊している誤答」という烙印を押したのだとしたら、やはりそれは一種のハラスメントなのではないかとさえ感じるのである。
　　また結論がわからないとき具体的な例で実験してみることも大切だ。実際にはこうした態度を示さない学生は以外に多いのではないかと思う。つまり、「例を挙げただけ」の答案を「重篤な誤答」とか「深刻な誤答」と類型化して満足するべきではないと私は考える。結論のわからない問題に対して、適切な例を出して実験したり反証したりする能力をまずもっと明示的な形で問うべきだったのではないか。例示する能力はあるが証明する能力が十分でないといった詳細な分析が可能になったはずだ。結局のところ、私はこの問題は、いろいろな分析をするには内容・設問形式ともに適切ではなかったと考える。こういうことは問1-1でも言える。なんとなく正しい選択はできるが理由をうまく文章化できないとか反例の掲示が不十分だというような答案もあるだろう。そうした詳細な分析ができるはずなのに、それをせずに、問題は適切だったとか統計的に問題はないとか述べる一方で答案を罵倒するなど到底看過できるものではないだろう。

　　中段の「幸せ」に関する発言が独善的なのは、広く合意が得られるのではないかと私は信じるが、あえて言語化してみると次のようになる。
　　そもそも「幸せ」などというものは人によりそれぞれであって、新井氏が言うところの「例示と論証」の区別がつくからといって得られるものではない。それらはまったく別の概念だ。偏差値が高い大学にいようと、そもそも大学に通ってなかろうと、論理的思考ができようとできまいと、人は、幸せを感じることは出来るし、それが「論理的思考力」によってより強化されるわけではない。「偶数＋奇数が常に奇数であること」の「理由説明」を「2n+2m+1＝・・・」としなければ厳密とみなさないという「論理性」をもっているからといって幸せになれるなどというのは暴論であり傲慢だ。そうした「論理性」をもっていても、必ずしも幸せではない人はたくさんいるだろう。「幸せ」というのはそういうものではない。

　あえて揚げ足を取ることもできる。
　ひとつはこうだ。「例示と論証」とは確かに違う。しかし、われわれの日常では、演繹的議論を厳密な意味で適用することが困難であることが多く、本質的であると思われる例示を用いた帰納的議論が行われていることが多い。そのような議論に対して、あなたの議論は例示しているにすぎず厳密な証明ではないと噛み付くのはその人の自由だが、回りからは煙たがられるかもしれない。演繹的な議論をすることが難しいから帰納的な議論で合理性を裏付けようとしているのである。そういう議論の仕方を「非論理的」として受け入れるべきではないなどと考えたら、それは社会的生活を送る上で、幸せとは逆のリスクを負うかもしれない。
　もうひとつはこうだ。命題論理では、「AならばB」と「AでないならばBでない」は独立である。かりに「AならばB」が真でも「AでないならばBでない」は真とは限らない。だから、「例示と論証の区別を理解するともっと幸せになれますよ。」という新井氏の発言に、「区別できないと幸せになれないというのか！」と噛み付くのは間違っている。少なくとも命題論理的には。しかし、日常の論理では、「AならばB」と（執拗に）主張することは、「AでないならばBでない」を含意していると受け取られてしまう危険性が高い。論理的であることに忠実であろうとすればするほど、かえってその信頼性を錦の御旗のごとくに振りかざすことで、かえって周囲との溝は深まるかもしれない。
　さらにもうひとつ。「例示と論証の区別を理解するともっと幸せになれますよ。」が正しいとすると、「もし今あなたが幸せでないなら、それは例示と論証の区別が付いていないですよ。」という発言（対偶）は正当化されてしまいかねない。しかしこれは偽としかいいようがない。ある人が不幸せであるかどうかは、その人のおかれた様々な環境に依存しているのであり、「例示と論証の区別」なんかに還元されたらたまらない。

　新井氏が考えるところの「論理的思考力」を身に付けることで人は幸せになれるはずだという思い込みが暴論なのである。私は、報告書概要版にある「基本的論証力を身に着けているかどうかが、選択可能な進路の幅を大きく左右している可能性」（p.3）や「知識を総合する力の有無が、選択可能な進路の幅を左右する」（p.5）という書きぶりは乱暴だと思う。偏差値の高い大学に入ることが「選択可能な進路の幅を広げる」ことになるとは限らない。それはあくまでもひとつの尺度に過ぎない。これらの書きぶりでさえ、私は、「論理性」がだけが「選択可能な進路の幅」を決定するする尺度であると主張しているようで、いささか傲慢であると感じる。それが「幸せ」などというものに置き換えられたら、それはなおさら独善的であると言う他はない。

　　後段の「数学の価値観」に関する記述も酷いと考える。
　　その理由は、提言や報告書概要版や報告書抜粋のどこを見ても、「何が重要な性質か」という価値観について殆ど何も語られていないからである。
　　あえてそれらしい部分を報告書抜粋から抜き出せば次のような部分だ。

本設問では、二次方程式の解の公式を使わずに因数分解でx軸との交点を求めることができる関数y=-x²+6x-8を題材にとり、その重要な特徴を文章で列挙することを求めた。「重要な特徴を挙げよ」という設問は、個人の価値観に関係するものであるため、このような設問を設定することについては内部でも異論があった。しかし、他の専門分野と同様に、「何が重要な特徴であるか」を判断し抽出することは、数学においても不可欠である。この観点において、論理的に正しいことは価値を持つための必要条件であるが十分条件ではない。若い世代に数学を伝える（教える）にあたっては、価値観も含めた数学の知恵を伝えることも必要であろう。
（中略）
与えられた放物線の特徴をつかむ方法として、中学3年および高校1,2年では次のような方法を学ぶ。
1.二次の係数から、上に凸（下に開いている）か、下に凸（上に開いている）かを決定する。
2.軸と頂点を求める。
3.x軸との交点があるかどうかを調べ、もしある場合にはその個数と座標を求める。
4.y軸との交点を求める。
5.導関数を求めて、その点で最大値（あるいは最小値）をとるか調べる。
さらに、高校3年では放物線の焦点と準線を求める方法を学ぶ。
以上のうちから適切に3つの観点を選び、数学的に正しいことを述べているものを典型的な正答例とする。

この記述のどこに「数学の価値観」や放物線のどのような特徴が「重要であるか」の判断基準が語られているだろうか。単に「価値観を伝える」と言ってみた所で、具体的なこの問題で何も語れないとしたら意味がない。一体放物線の特徴として何が重要な特徴なのか。「私達は何かのコンセンサスでこういうものが大事だ、こういう特徴が大事だっていうふうに思っている」というのだから、何か「コンセンサス」があるというのが前提なのだろう。しかしそれが何かはっきりしない。上で述べられている5個の観点は、みなそれぞれ単独では放物線の特徴の一つを述べただけだ。それでも「原点を通らない」とか、単に「実数解が2個ある」というよりはずっと具体的ではあるし数量的なものではある。しかし、単体で見れば、例えばy軸との交点（0,-8）と、別の通過点（1,-3）とに重要性の観点で優劣があるかという問題は当然出てくる。
　実は、報告書抜粋の「準正答」に関する部分で次のような記述がある。

軸と頂点の座標を異なる2つの観点として挙げ、残る一つの観点を加えても二次関数が決定できない場合、準正答に分類した。（軸がx=3であることは頂点が(3,1)であることに直接的に含まれる条件であり、異なる重要な観点として挙げるのは好ましいとはいえない。）

この説明を見ると、「3つの条件で二次関数が決定できること」というものを「重要な性質」として捉えているのだろうか。しかしそれでは、「(0,-8)を通る。(1,-3)を通る。(２,0)を通る。」でも「二次関数が決定できる」と既に指摘してきた。この3つの条件は「通過点を与える」という意味では全く同じ観点と言えるが、異なる通過点を挙げているという意味では異なる観点である。また逆に、「上に凸である。x=3に関して線対称である。y軸と(0,-8)で交わる。」という3つの観点はいずれも放物線の特徴について述べているが、これではもとの二次関数は決まらない。これは「重要な特徴を文章で3つ」という指示に該当しないのだろうかという疑問は解消されない。

　　私は、二次関数を決定できる要件が「重要な特徴」という設問に適っているということには同意する。（他の観点もあるかもしれないが。）しかしそれが、「上に凸である。頂点の座標は(3,1)」である。y軸と点(0,-8)で交わる。」という3つに限られるとか、報告書抜粋にある％つないし6つの観点から異なるものを選ぶことに限定されるという意見には同意できない。、「(0,-8)を通る。(1,-3)を通る。(２,0)を通る。」は重要な3つの特徴である。「焦点が(3.3/4)で準線がy=5/4」というのは2つしかないが二次関数を決定する重要な観点である。「二次の係数が-1である。頂点が(3,1)である。」は二次関数を決定するのに十分な性質だが、放物線の特徴なのかと言われると少し疑問の余地はある。しかし、二次関数の重要な性質であることは間違いがない。
　　
　　私は、「価値観を伝えるべき」と言っておきながら、何が重要な特徴であるかを判断する基準なのかを明示せず、単に放物線から何か数量的なデータを読み取る操作だけを列挙するという態度はいささか納得できないし、また「正答例以外にも二次関数のグラフに関する観点は存在しうる。その場合には、複数の数学者による合議により正答かどうかを判定した。」などと述べておきながらどのような答案を正答と判断したのかを明示しないという態度にも納得できない。それ以上に納得できないのは、「3つ」という条件設定の拙さである。二次関数を決定するというだけなら2つで十分な場合もありえる。調査側が、様々な「重要な特徴」を列挙し、そのどれでも正答とする用意があることを表明しておかなければ、ここに挙げられた正答例やそれに準ずるものしか日本数学会は認めないのかと思われてしまう。そして私はまさに調査側がそういう答えしか端から想定していなかったし、実際に答案の中にそのようなものがなかったのを良いことに、「コンセンサス」だとか「価値観を伝える」と居直っているようにさえ見えてしまう。結局のところ、価値観を問う出題というのは非常に作成が難しく、何を正答とするかを限定することが難しい。それは仮に採点や統計上問題がなくても、それ以外の「価値観」には触れないという形でそうした異なる価値観を忘れさせてしまう危うさをはらんでいる。新井氏の発言は、そうした微妙な問題を置き去りにした極めて感覚的な議論であると言わざるを得ないのである。
　

問3について

この問題については、調査に協力してくださった方からも、何でこんな問題を聞いたんだというご意見がたくさんあった。
しかし、教科書には全部載っている。載っているのに学生が覚えていない。それはいったい何なんだろうということで調べたということです。
どこの偏差値群でもほとんど変わらない形になるということは、みんな知らない、みんなにとって非常に難しかったということですから、
いくつかの可能性があると思います。
教科書にはのっているんだけど、おしえられていない。さらっと教えられている。何につながるかわからなかったので教えられていない。
確かにこの問題って教えようとすると、定規とコンパスを取り出させて作図をさせなければならないので時間がかかる。
やるとなると三年生の二学期の後半くらいになることが多い。受験を考えると時間が惜しいと現場の方が考えられてやられていないのかもしれない。

「覚えていない」というコメントが出てくるということは、この問題は「その場で考えればできる」ということを意図したのではなく、単なる《暗記的知識》と問うたということになってしまう。
もともと10分という回答時間では、知らなかった学生はほとんど回答しようがなかっただろう。私は、他の問題にくらべてこの問題だけ、教科書の中でもかなり詳細な部分の「知識」を問うていることに違和感があったが、新井氏を含めた調査側はそれでも良いと判断したのだろうか。考える力と覚える力の間にそれ相応の関係があることは否定しないが、この問3ではあまりに「知識」「覚える力」に寄った問題になってしまっていることを、調査側が図らずも（？）露呈させてしまった。この問題が調査の目的に合致しているかどうかは、結果が非常に悪かったことも含め十分に検証するべきだ。

また、この発言の仕方だと、全ての教科書に載っていることは「覚えていなければならない」ということになってしまいかねない危うさがある。もしそのようなことを主張したいのなら、それだけの条件をまず自分（たち）が満たしていることを明らかにしなければフェアとは言えない。理科や社会でもそうなのだと身をもって証明できるのだろうか。英語や国語にしてもそうだ。全ての教科書に載っているのに覚えてないのがまずいという趣旨の議論に持ち込んではいけないと思う。

偏差値下位群では実測して3等分するという答えを書いた方が少なくなかった。
何がいけないんだっておっしゃる方もいらっしゃったんですけど、
実際は5cmなんです。測っていただいても、割り算をしても正確に三等分することはできない長さで出題しています。
私は大変印象深かった答案がありまして、
測ったところ4.8cmだったと。
３等分すると1.6ｃｍになると書いてあって3等分してあった。
2mmって結構大きい。
たぶん測って5cmで困ったんだと思うんですね。4.8cmだって書いちゃった。
それって工学部的にも倫理的にもいけないんじゃないかって思いました。

　これは学生の答案からはわからないことを推測して、その学生を倫理的に批判している。こういう批判は、もともとあまりフェアなものではない。
単に学生が測り間違えただけかもしれないからだ。どうせ３で割り切れるに違いないという思い込みで4.8cmに見えたかもしれない。
それは確かに誤りだが、しかしそうだとしても「5cmで困った」から「4．8cm」とごまかしたわけではない。先入観で見誤ることと知っていてごまかすこととには雲泥の差がある。
新井氏の発言は明らかに学生が「知っていてごまかした」という学生の意図を断定するものであり、適切かどうかかなり怪しい。学生を嘲笑しないという趣旨から言って、このような倫理的批判を行うことは避けるべきだったと考える。しかももしそれが事実でなければ誹謗としか言い様がないものだ。

　実は、この問題で実際に4.8cmだった可能性があるのである。私は自分で印刷したpdfファイルの線分の長さを計測してみた。4.8cm弱だった。
なぜこのようなことが起きたのかというと、pdfファイルの印刷時に「用紙にあわせる」を選択しているとわずかに縮小されて印刷され、線分の長さが短くなるのである。
実際に「4.8cmだった」と書いた学生の答案に印刷されていた問題の線分が5cmであることを確認していることをまず明言してから話すのが最低限の責任だろう。
なお、今回の調査で実際には4.8cmだったということが広範に起きていないことを確かめるためには、調査に用いた問題用紙＋解答用紙がどのような方法で作成されたかを明らかにする必要がある。
使用した問題用紙＋解答用紙はすべて調査側が一括して印刷し、それが5cmであることを確認してあれば問題ない。逆に、調査に協力してもらった教員にpdfファイルだけをメールで送信し、教員側がpdfファイルを人数分印刷したというような場合には、上のような事情で実際の線分の長さが4.8cmだった可能性が出てくる。

国語が得意かどうかとの負の相関について

私はもともと文系で、もしかしたら国語が得意、数学が苦手という状態で中高を過ごしたんじゃないかと思うんですけれど・・・

国語っていうのは、主観的な印象と客観的な性質をきちんとわけたりだとか、論理的な判断力とかそういうことをきっとやっている科目のはずなので、
どうしてそこでちゃんとスクリーニングされないで、得意だと思っちゃったのかなぁと。

　　国語が得意かどうかと今回の調査結果に負の相関が出ていることについて、新井氏のみならず会場からの質疑で話題になったことは既に（その7）で指摘した。
しかし、新井氏が行った第一の発言を見る限り、新井氏は上の第二の発言を自身に自問してみるべきなのではなかろうか。国語が得意かどうかと数学が得意かどうかということに負の相関があるかもしれない、その実例に新井氏自身が含まれていること、第一の発言が示しているのだから。新井氏の議論は、新井氏が考えるところの「論理的思考力」を持ち合わせてない学生が、国語を得意と思ってしまったことをありえないことだと考えているようだが、「どうしてそこでちゃんとスクリーニングされないで、得意だと思っちゃったのかなぁ」という発言は、第一の発言と合わせて、自分の場合さえ検証しきれていない独りよがりな発言としか思えないのである。

　　あえて率直に言えば、国語で扱う論説文というものは、主観的文章に過ぎないことが多い。少なくとも簡単な命題論理さえ満足に証明したことになっていない場合もある。しかし、国語で論説文を読む場合は、その対象となっている文章を批判的に読んではいけない。どんなにその文章が論理的に破綻していても、その破綻している論理に寄り添って、筆者が何を言いたいのかという「設問」に答えなければならない。その設問に答えることは、回答者が自分の主観/批判的批評を入れてはいけないという意味では客観的な性質だけをもとに答える必要があるが、数学における客観性＝「論証の正しさ」とは質的に異なっている。論説文の読解と数学における論証ではそうした頭の切り替えが必要になることは言うまでもない。
　　国語が得意な側からすれば、やはり数学における論理/論証の厳密性、概念、言語いずれも日常体得しているものとは異なりすぎている。他方、数学が得意な側からすると、論説文で扱われている文章そのものが極めて主観的に見えがちであり、しかも選択肢を選ぶ場合であれ、記述式の場合であれ、何が正解かということの客観性に疑念を抱きがちであると思う。もちろん、国語も数学も得意だという人はいるだろう。しかし、普通は、国語と数学の間にはこうした論理の質的違いや互いの科目の性質の違いから来る困難などがあり、両者の得意さに正の相関があると考える方が非自明であると私は考える。
　

大学の講義や入試問題作成について

数学の知識を基本的には求めないような問題で、比較的容易な条件文の読解が難しかったということになりますと、
たぶん数学の抽象的な教科書の条件を読むのがとても難しいのだろうと思う。
だから覚えることでなんとかしようと思いがちになってしまわないかと心配している。

逆行列や行列式の計算や初等関数の微積分の計算は、それほど困難を教えるときに感じていないとお答えでした。
それよりやや困難を感じているのは、部分集合と元を区別するというのが、意外に困難だった。
とっても困難だとおっしゃっているのは、写像の理解。全射とか単射とか、その区別ですね。それから存在命題が正しいことをどう証明するか。
これよりさらに難しいのが全称命題が正しいことをどう証明するか。
一番難しいとおっしゃったのが、同値関係、同値類、商、代表元。このあたりが一番困難だというふうにお答えされていました。
やはり定義とか、条件文からいくつかの例を思い描くことがとっても難しいというふうに皆さんおもってらっしゃって、
そのことっていうのは今回の調査結果と非常に符合する。
条件文が読めないとか、重要な特徴がつかめないとか、そのことからスタンダードな例と極端な例をいくつか思い浮かべられないとか、
そういうことが難しいという実態が、大学でどういう単元を教えるのが難しいかというふうにみなさん思っているかということととても符合するなと思いました。

　ほんとうにそうだろうか。

　そもそも今回の調査は、ほんとうに「条件文が読めない」ということの証明になっているかどうかも怪しい。今回の問1-2の問題文「公園に子供達が集まっています。男の子も女の子もいます。よく観察すると、帽子をかぶっていない子供は、みんな女の子です。そして、スニーカーを履いている男の子は一人もいません。」はいかにも問題のための問題のようで、数学的な文章とは言いがたい。これは報告書抜粋の言うように「自然言語で書かれた文章から論理的な骨組みを正確に取り出す」ことを試している問題に過ぎない。数学の教科書にはもっとずっと厳密な書き方がしてあるはずだ。「重要な特徴がつかめない」というのも、今回の問2-2のような形で問うことは適切とは言いがたいし、これが数学の教科書を読むのにどの程度関連しているのか不明だ。「スタンダードな例と極端な例をいくつか思い浮かべられない」とか「定義とか、条件文からいくつかの例を思い描くことがとっても難しい」ということを今回の調査から結論するのも無理がある。今回はそうした「例を実際に作ってみせる」という設問は用意されていないのだ。例えば問1-1や問1-2は、回答者が自分で反例を考える必要があるが、それでも7割ないし6割の解答が完全に正解しているのである。もしこれらの学生がみな反例を適切に構成できているとすれば、このような批判はあたらない。しかし実際にそうであるかをこの調査結果から確かめる方法はないのである。

　そして私はこのような議論を目にするとき、論理的に考える能力があれば、数学的概念を必ず理解できるかのような決め付けが働いているのではないかと疑ってしまう。もちろんここでの主張を命題論理的に解釈すれば、「条件文が読めない、ならば、大学数学で登場する概念が理解できない」ということだろうから、かりに条件文が読めたとしても大学数学の概念が理解できるとは限らないということを含意している。しかし新井氏を含め、このような主張をする場合、「条件文が読めれば、大学数学で登場する概念は理解できる」と言っているように聞こえてしまうのである。大学数学で登場する概念は、例に挙がっている写像の性質や同値関係などにしても、もともとそれほど理解しやすい概念とは言えないと思う。概念それ自体が難しいのである。それをどう教えるかは、例えば動機付けの問題などとも絡んでいるし、そう簡単に断言できることではないと私は考える。単に論理的であればよいというものではないと思うのだ。

私見ですが、入試問題作成をするとき、数学的に厳密であるかってことを皆さんとても気にされていると思うんです。
でもそれを追い求めすぎると、出題範囲とか出題形式とかがものすごく限られてきちゃって、それはもう予備校側にも学校側にも読まれてしまうような気がするんですね。
その中でトレーニングをしがちになってしまうので、スクリーニングに失敗しやすいのかもしれない。
できるとわかるの違いを見ようと思ったら、そこまでの厳密性ということじゃなくって、もう少しおおらかな問題というのもあっていいのかなぁと、今回調査をしてみて、あんな問題でスクリーニングできてしまうことにショックを受けつつですね、
そういうふうに思った次第でございます。

そして新井氏の報告を締めくくるこの発言は、いままでの議論の根底にあったものを打ち壊してしまう酷い議論だと思う。

　　第一に、少なくとも新井氏は、今回の調査に関して寄せられたであろういろいろな疑問に対して、「これは試験ではない」ということを理由に自らの妥当性を主張していたのではなかったのか。試験ではないのだから、問題の設定や正答と判断する基準に少々の曖昧さがあっても統計的分析結果が妥当なら許容してくれと要求していたのではなかったのか。にもかかわらず今回の調査結果を根拠に、入試問題の作成について意見を述べるというのは完全に今までの態度を翻してしまっている。入学試験は当然受験生の一生を左右する可能性がある。だからこそ数学的に厳密であることは当然要求されるものだ。1点が合否を分ける以上、その基準はたとえ数学者たちの合議で決まるとしても答案を差別化する基準は明確でなければならない。今回の調査の問題、特に問2-1や問2-2はそれにはそぐわないと考える。また、現実問題として平均してみると6割以上の学生が正解してしまうような問1-1や問1-2も実質的に入試の合否判定においてはあまり役に立たない設問である。特に国公立Sでは9割から8割の学生が正解しているので尚更である。逆に問3は準正答まで入れても全体平均7.6％の受験生しか解答できないことになり、やはり合否の判断には役に立たない。国公立Sならば222.6％だからかろうじて判定の役には立つかもしれないが。結局、設問の適切性から言っても平均的な正答率から言っても、今回の5問いずれをとっても実際の入試問題に供するには不十分であるというのが私の考えである。

　　第二に、いったいいついまの入学試験が「スクリーニングに失敗」したというのであろうか。実際には、今回の調査結果と大学の偏差値群というのは正の相関を持っているのであり、入学試験でのスクリーニングと今回の調査に使われた問題におけるスクリーニングでは、ことスクリーニングが可能であるという点でみる限り何の優劣もないし、入学試験がスクリーニングに失敗しているなどという結論は導かれえない。「出題範囲とか出題形式とかがものすごく限られてきちゃって、それはもう予備校側にも学校側にも読まれてしまうような気がするんですね。その中でトレーニングをしがちになってしまうので」というのは今回の調査結果とは何の関係もない、単なる新井氏の主観の表明に過ぎない。
　　スクリーニングという観点では現在の入学試験のレベルと今回の調査に優劣がない以上、この観点ではどちらを採用することも一見可能である。しかし、私は、今回の調査のような問題を大学入試問題として利用することには反対だ。その理由は、大学入学試験で課される数学の内容は、結局のところ良かれ悪しかれ高校までの数学としてこなしておくべきゴール地点を明示するものだからである。今回の調査問題で使われた5題を高校までの数学でこなしておくべきゴールとはみなせないと考えるからだ。たとえ、「偶数＋奇数が常に奇数であること」を「2n+2m+1=・・・」と厳密に論証できるようになったとしても、微積分に一度も触れたことがないような学生が大学4年間で微分積分の厳密な取り扱いを学べるはずがない。それには4年間という時間は短すぎる。今回の調査問題のような形の入試問題が増えればそこがゴールになってしまう。内容を少し削ってそれぞれの話題を確実に理解させようという考え方は一見すばらしいかに見えたが、結果的には学生が理解したり触れたりしたことのある分野の量も質も低下してしまってその先が積み上げられなくなってしまった。それが「ゆとり教育」に潜むひとつの陥穽であったはずだ。今回の調査問題のような問題を大学入試問題でも使うべきだとする新井氏の議論には、実は同じような陥穽が潜んでいると私は考える。
　　確かに数学は積み上げ式の学問なので、以前までのことの理解がおろそかな場合、その次を積み上げることが難しい場合もある。しかし、それはただ徒に基礎基本にもどって一から論理的に組み立てましょうということではない。高校までの数学の理解において、少々理解の厳密さに怪しさがあったっていいじゃないか。意味はよくわからないけれど計算や操作はできるという部分があったっていいじゃないか。それはやがて大学でより体系的に整理された形で与えられ、そしてより進んだ内容がさらに積み上げられていくのだから。すべてを一から完璧に積み上げておかなければ先に進めない、次をつむことは決して出来ないという考え方に私は与しない。少し意味がわからなくても考え方や例や計算に触れておくことで、やがて別の視点や方法が与えられたときに理解できる可能性が増すのだ。

　　以上、報告会の新井氏の発言を分析してみた。あえて率直に言えば、新井氏の発言には、新井氏自身の価値観が反映されているという意味で主観的な発言が非常に目立ち、議論としてはかなり丁寧さを欠いていると私には感じられた。