日本数学会による大学生数学基本調査への疑問(その5)─報道とのギャップや関連コメントなど─

  • ゆとり教育世代」と今回の調査結果の関係が不明確である。

今回の「大学生数学基本調査」は複数の報道機関で報じられ、その多くが「ゆとり教育世代」と「学力低下」を結びつける内容のものであり、また情報を受け取る側も、「ゆとり教育世代」の「学力低下」の一例であると見た人が多かったと感じられる。

しかし、今回の「大学生数学基本調査」の文面をよく眺めると、厳密には、「ゆとり教育世代」であることと「学力低下」を明示的に結びつける文言はない。FAQp.3のQ.13に「この調査を受けた大学生は、いわゆる『ゆとり世代』です。」という表現がある程度である。むしろ提言p.1にあるように、

  • 1996年に大学教員を対象とする「大学基礎教育アンケート調査」を実施しました。この調査によって、1.読解・表現など国語力、2.抽象的・論理的思考力、3.知識に対する意欲や忍耐力といった、ごく基本的な能力が学生の間で低下しつつあるという現実が浮き彫りにされました。
  • ここ数年に至っては多くの会員から、「入学試験や1年生の期末試験における数学の答案にまったく意味の通じないものが増え、どう対処したらよいか当惑している」という声が寄せられています。教育委員会メンバーがさまざまな大学の教員から意見を集めたところ、論理的文章を理解する力、論理を組み立て表現する力が学生から失われつつあるのではないか、との危惧が教育現場に広がっていることがわかり、今回「大学生数学基本調査」を実施することとなりました。

という文章がある。ここでは「ゆとり教育世代」ということに必ずしも限定されない「学力低下」が問題とされていることに注意したい。

つまり、報道側や報道の受け手側は、この問題が「ゆとり教育世代の学力低下問題」であるとカテゴライズしている一方で、提言や報告書概要版の中では、必ずしも「ゆとり教育世代」との因果関係を明示してはいないというギャップが存在する。

しかし、例えば、産経ニュースにあるように

日本数学会理事長の宮岡洋一東大教授は「ゆとり教育と入試制度が学力低下に拍車をかけた。数学は科学技術を支える基盤であり、数学で育まれる論理力は国際交渉でも不可欠だ」と話している。

というのが事実であるとすれば、「ゆとり教育」と今回の調査結果との因果関係に言及していることになる。調査の評価を述べる際には、「ゆとり教育世代」ということと今回の調査結果の関係をどこまで言及できるのか、またするべきなのか丁寧に説明するべきだし、もし報道側や報道の受け手側に十分伝わっていないと考えるのであれば、少なくとも再度のコメントを出すべきであると考える。

 ところが、この問題はこれだけに留まらない。今回の調査に関係している新井紀子氏は、2/24のツイッターで次のように述べているのである。

調査をした私たちは誰も「大学生がわるい」とは思ってません。し、数学の時間を増やせば解決できるとも思ってない。これは複合汚染みたいなものだから。理由が「ゆとり」だとも思ってない。でも、調査してみないと出発できないところがあった。そゆこと。

この発言には様々な問題点があると考える。

 まず第一に、「調査をした私たち」という主語の範囲が不明確である点が挙げられる。例えば、日本数学会は、社団法人日本数学会の名前で「『大学生数学基本調査』に基づく数学教育への提言」を発表し、その冒頭で、

日本数学会、2011年4月から7月にかけて全国の大学生約6000人を対象に、テスト形式の「大学生数学基本調査」を行いました。

と明確に述べているのである。実施主体は、「日本数学会」である。とすれば、新井氏の発言にある「調査をした私たち」とは日本数学会のことなのか。それとも調査そのものを主導したと思われる「日本数学会教育委員会」のことなのか。
新井氏は、「調査をした私たちは誰も」と述べているのである。「誰も」とは「すべてのメンバーが」という意味でしかありえない。とするならば、その「すべて」がどの範囲なのかを明示しない限り意味を持たない。
そして、もし上で引用した「日本数学会理事長の宮岡洋一東大教授は『ゆとり教育と入試制度が学力低下に拍車をかけた。数学は科学技術を支える基盤であり、数学で育まれる論理力は国際交渉でも不可欠だ』と話している。」が事実だとすると、宮岡氏は、「ゆとり教育」が「学力低下」の一因であると述べていることになる。「理由が『ゆとり』だとも思ってない。」という新井氏の発言と完全に矛盾しているのである。

ゆとり教育世代」ということと今回の調査結果との因果関係についてどのように考えるのかはっきりしないのに、またはっきりさせることができていないのに、「ゆとり教育と入試制度が学力低下に拍車をかけた。」と発言するのは拙いし、そうした意思統一が十分ではないにも関わらず「調査をした私たちは誰も・・・理由が「ゆとり」だとも思ってない。」などと発言するのは非常に拙いと考える。

 第二に、新井氏の発言で問題なのは「数学の時間を増やせば解決できるとも思ってない。」という部分だ。日本数学会は社団法人日本数学会の名前で「『大学生数学基本調査』に基づく数学教育への提言」を発表し、その中で、

基本調査によって明らかとなった問題点を踏まえ、日本数学会は以下の提言をいたします。
中等教育機関に対して:充実した数学教育を通じ論理性を育む。証明問題を解かせる等の方法により、論理の通った文章を書く訓練を行う。
大学に対して:数学の入試問題は出来る限り記述式にする。1年次2年次の数学教育において、思考整理と論理的記述を学生に体得させる。

と述べているのである。これは明らかに「数学教育」の「充実」を求める内容になっている。「充実」の中には「数学の時間を増やすべきだ」という主張が全く含まれていないと考えるのは無理がある。例えば、報告書概要版の中でも文学系や学際系などで結果が思わしくないことが強調されている。日本数学会の提言の中には、やはり文理の枠を問わず、有る程度広範なレベルで数学教育を施すべきであるという主張が含まれているのではないか。そうした「提言」の内容と、新井氏の発言「数学の時間を増やせば解決できるとも思ってない。」の間には明確なズレがあると考える。このような発言は決して望ましいものとはいえない。

 第三に、「『大学生がわるい』とは思ってません。」という発言の意味が不明確だということである。「大学生がわるい」ということの意味が判然としない。新井氏が今回の調査に対するどのような反応を想定して「そうは思っていません」と発言したのかがわからないのである。例えば「大学生がわるい」というのは、「大学生の学力がわるい」という意味だろうか。まさか「論理的コミュニケーションの前提が崩壊している答案が増えた」とコメントしている当の新井氏が、「大学生の学力がわるい」とは思ってませんなどというつもりはないだろう。だとすれば、「大学生がわるい」というのは、「論理的コミュニケーションができないのは当の大学生自身の責任だ」という議論を想定して「そうは思ってません」と言っているのだろうか。しかし報道側は、「ゆとり教育世代の学力低下」を論じる際、当の大学生個人の責任を云々するよりも、「学習指導要領」などの外形的要因を主として批判しているわけだから、このような議論を想定しているというのも少しポイントがズレているように感じられる。要するによくわからないのである。

 第四に、「複合汚染のみたいなもの」という単語の選び方の拙さがある。大学生は何かに「汚染」されているのだろうか。「清浄」な誰かと「汚染」された誰かがいるとでも言うのだろうか。自分達は「清浄」で、今の大学生たちが「汚染」されているというのだろうか。どうして「汚染」という言葉遣いになってしまうのか、私には到底納得が出来ない。おそらく「複合的な要因が絡んでいる」と言いたいのだろう。ならどうしてそう書けないのだろうか。こういう書き方は極めて不適切であり、「複合汚染みたいなもの」という感覚が調査側に共有されてるとすれば考えを改めた方が良いと考える。新井氏はこの表現を撤回するべきだ。

日本数学会による大学生数学基本調査への疑問(その4)─「論理」の氾濫─

今回の「大学生数学基礎調査」の報告書概要版とそれに基づく「数学教育への提言」の中には、「論理」という言葉がふんだんに使われている。しかし、それらの言葉や文脈は、詳細に見てみるとどのように定義されるものかが曖昧であったり、「論理」と「数学」との結びつきに対する説明が不足していると感じられる部分が多かった。これでは、見る人によっては、もはや「論理至上主義的」としか言いようがない形になってしまっているとさえ言っても過言ではなく、それは決して今回の調査を肯定的には理解してくれないということに直結してしまいかねないと危惧する。

まずこの点について具体的に見ることからはじめたい。

  • 「論理」に関する記述が主観的/観念的なものに留まっている上に断定的である。

提言p.1にある「大学生数学基本調査」の目的には

高等教育を受ける前提となる数学的素養と論理力を大学生がどの程度身につけているのか、その実態を把握し、大学教育の改善に活用するとともに、初等中等教育に対する提言の材料とすること

とある。この目的にある「高等教育を受ける前提となる数学的素養と論理力」という表現が抽象的であることは既に指摘した。日本数学会は今回の調査で使用した問題5問が「高等教育を受ける前提となるどのような数学的素養とどのような論理力」を試す問題であるか明確に説明するべきである。

しかし、提言p.1-2にある「基本調査の内容」を見てもさらに抽象的で概括的な言葉が並ぶだけである。曰く、

問題は別紙にある通り、3問からなっています。基本的に、問1は文章に含まれる論理を的確に読み取れるか、問2は論理的に正しい記述ができるか、問3は数学の基本である比例と作図を理解しているか、をテストしています。

である。また続く「基本調査の結果とその分析」(提言p.2)では

問1では「平均の定義と定義から導かれる初歩的結論」、「少し複雑な命題の論理的読み取り」のどちらも誤答率が高く、論理を正確に解釈する能力に問題があることを示しています。
問2.記述式入学試験を課している難関国立大学の合格者を除くと、「偶数と奇数の和が奇数になる」証明を明快に記述できる学生は稀、という結果になりました。二次関数の性質を列挙する問題では、意味不明の解答が多く、準正答のなかにも、すでに挙げた性質と重複する性質を再度挙げる解答が目立ちます。論理を整理された形で記述する力が不足しています。
問3では、平面図形を定規とコンパスで作図するということが何を意味するのか理解していない解答が多く見られました。高校までの教育で、こうしたことがきちんと教えられていない可能性もあります。

とある。

私は、これらの文章にはかなり主観的/観念的で雑な記述が含まれていると思う。

 例えば、問1に関して、「文章に含まれる論理を的確に読み取れる」とか「論理を正確に解釈する能力」というものの定義は明確とは言いがたい。これらが同じことを言っているのかさえよくわからない。「的確な読み取り」と「解釈」は同じ意味であろうか。

 具体的に考えてみると、「文章に含まれる論理を的確に読み取れる」ということと問1の2つの問がどう関係しているかはかなり曖昧であると思う。平均の定義を用いて確実にいえることとそうでないことを判別する問1-1は、「文章における論理を読み取る」というよりは、平均の定義とつき合わせて適切な反例が構築できるかどうかが問われているように思う。「文章に含まれる論理を的確に読み取る」というのは、どちらかといえば、 文章中から必要な事柄を読み取って選択肢の正誤を判断する問1-2のような問題のことだろう。しかも私にはいずれの問も「論理を正確に解釈する」という表現が妥当なようには思えない。「反例の構成」や「命題論理を使うこと」が求められているのであり、そう記述するのが最も誤解が少ないのではなかろうか。

 問2に関しても、まず「論理的に正しい記述ができるか」ということと「論理を整理された形で記述する力」という2つの表現が同じ事柄を示しているかどうかが曖昧である。「論理的に正しい」ということと「整理された形」とにはギャップがあるように思える。

 具体的に考えてみても、「偶数+奇数が常に奇数であることの文字式を用いた証明」を行う問2-1はかなり厳密な意味で「論理的に正しい記述ができるか」を問うている。他方二次関数のつくる放物線の重要な性質を3つ文章で答える問2-2は、「論理的に正しい」ということと「重要」であることとの間にはギャップがありうる。例えば重複する性質をいくら列挙しようともそれは「論理的に正しい」が、3つの重要な性質としては不十分である可能性もある。またこれは単に答えが求められている設問である以上「論理を整理された形で記述する」設問であるとは言えないように思う。さらに言えば、「重要な特徴を、文章で3つ」と言われたときに、重複した観点を挙げる答案は「論理的」ではないのだろうか。それさえ私には言いがかりのように思われる。

 このように実際に出題された問とそれを総括する際に用いられる「論理」という言葉との間に十分な連関がなく、またそれが十分に検討された形跡もないために、非常に主観的/観念的な文章になってしまっていると私は感じる。

 他にも例はいろいろある。
 
 既に批判した

論理的コミュニケーションの前提が崩壊している答案

という表現に登場する「論理的コミュニケーション」とは何か全く判然としないし、またその「前提」とは具体的に何なのかもはっきりしない。「論理的コミュニケーション」が取れないということと、その「前提が崩壊している」ということにもギャップがあるように思う。既に指摘したように、「論理的コミュニケーションを図ろうとしたが失敗して論理的にまずい主張をしてしまった」ということと、「そもそも論理的に話すつもりなんかさらさらない」ということとの間には明確に違いがあり、前者を「論理的コミュニケーション」に失敗したと形容することや後者を「論理的コミュニケーションの前提」が成立していないと形容することは、ある程度合理的かもしれないが、前者を「論理的コミュニケーションの前提が崩壊している」と形容するのは拙いと考える。

 報告書概要版p.2では、問1-2に対するコメントとして、

文の論理的読解」の正答率は64.5%。調査対象となった大学生の3人に1人が論理的読解に課題あり

という評価がある。この「(文の)論理的読解」という意味が判然としない。上でも述べたように、この問1-2で問われているのは、あくまでも「命題論理」としての理解である。「命題論理」がうまく読み取れなかった答案や学生を「論理的読解に課題あり」と評価してしまうと、数学とは限らない文章の読解全般に何らかの問題があると指摘しているかのように受け取られてしまう。何が問題なのかを明確に限定することが重要だと考える。

 同じく報告書概要版p.3では、問2-1に対する評価として

基本的論証力を身に着けているかどうかが、選択可能な進路の幅を大きく左右している可能性

とある。「奇数と偶数の和が常に奇数となること」の証明のために、2m+1と2nを持ち出して論証することが本当に「基本的論証力」だと言えるのだろうか。問題の内容に合わせて使うべき道具が変わるのは当然で、「連続する3つの奇数の和が3の倍数であること」の証明ならば文字式を使うことにかなり優越性があるが、「奇数と偶数の和が常に奇数となること」ならば、「偶数を足しても偶奇は変わらない」くらいでも十分に「論理的」であると私は感じる。

 「論理」からは少し離れるが、二次関数に関する問2-2に関して

  • 個々の知識だけでなく、知識を総合する力の有無が、選択可能な進路の幅を左右する。(報告書概要版p.5)
  • 「できる」と「わかる」の乖離を調べるために、あえてこのような設問を設定しました。本設問では、二次関数に関して学ぶ操作(例:x軸やy軸との交点を求める、頂点の座標を求める、等)がどのような意味を持つかを理解しているかを調査しています。(FAQp.3)

という表現がある。「知識を総合する力」というのが何なのか私には理解できない。「重要な性質を、文章で3つ挙げよ」と問うことが、「二次関数に関して学ぶ操作がどのような意味を持つかを理解しているか」を問うことになるのか。またこの問題の答えは、二次関数に関して学ぶ操作を3つ答えるだけである。今回のこの設問はどのような意味で「知識を総合する」必要があるのか。「『できる』と『わかる』の乖離」もわかりにくい。例えば放物線の概形を図示「できる」学生に、これ以上なにを「わかれ」というのだろうか。このような表現は主観的/観念的との謗りを免れないと考える。

  • 「数学」と「論理」の安易な関連付けや「数学」や「論理」の社会的価値を安易に断定しすぎている。

日本数学会からの提言の節(提言p.2)にも「論理」が「氾濫」している。曰く

基本調査によって明らかとなった問題点を踏まえ、日本数学会は以下の提言をいたします。
中等教育機関に対して:充実した数学教育を通じ論理性を育む。証明問題を解かせる等の方法により、論理の通った文章を書く訓練を行う。
大学に対して:数学の入試問題は出来る限り記述式にする。1年次2年次の数学教育において、思考整理と論理的記述を学生に体得させる。

とある。「論理」が3回も登場する。「論理性」とか「論理の通った文章」とか「思考整理と論理的記述」というような表現が抽象的で何を指し示しているのかが曖昧であることは既に指摘した点と同じである。しかしこのレベルになってくると、もうひとつの問題点が浮上せざるをえない。それは、ここで述べられている「論理」と「数学」の関係性である。「充実した数学教育」は「論理性を育む」のか、あるいは「思考整理と論理的記述」を体得させることができるのか。「証明問題を解かせる」ことで「論理の通った文章を書く訓練」ができるのか。

 例えば、ひとたび数学を離れてしまうと、いくつかの具体的な例を用いて説明することで、ある程度一般的に成り立つはずだと説得するしかないような場合もある。「考えられる限りの偶数と奇数を足してみたら奇数だから」というのは数学的な根拠としては、「すべての場合を尽くしている」とは言えないが、現実の問題では、そもそも「すべての場合を尽くす」ということが難しく、いくつかの典型的な例に頼らざるを得ないこともある。それを「非論理的」と切り捨てるのは簡単だが、現実はそういうことを言ってみても何も始まらないだろう。数学によって育むことのできるのは、「論理的記述」のある一部分であって、そのことと現実問題に対して論じるときの態度や書きぶりというのは、参考になる部分はあったとしても、かなり相違点も多いはずである。「数学(教育)」と「論理性」を無前提に結びつけることに違和感がある。

 これは、「将来へ向けて」(提言p.2)になるとより一層鮮明になる。いわく

資源に恵まれず災害の多い日本は、国民一人一人の知的水準を上げなければ生き残ることができません。数学は科学・技術を支える基盤です。また数学教育が育む論理力は、国際交渉の中で不可欠です。日本数学会は数学と数学教育を通じて、国民生活の向上に寄与できることを願っております。

「資源に恵まれず災害が多い」ということと、「国民一人一人の知的水準を上げなければ生き残ることができない」ということとの間に論理的つながりがあるだろうか。「国民一人一人の知的水準を上げることで生き残っていく、そういう国家像を目指すのだ」なら、それはひとつの主観の表明だが、意図はわかる。「国民一人一人の知的水準を上げなければ生き残ることができない」といわれると、本当に他の道はないのかと気になる。

「数学は科学・技術を支える基盤」であることは間違いない。しかしそのことと、数学の具体的な内容がどこまで「国民一人一人の知的水準の向上」と言う際のターゲットになるかということとは全く話が違う。

数学教育が育む論理力は、国際交渉の中で不可欠」という言い方も乱暴すぎる。これは「数学教育が育む論理力」がなければ、いかなる国際交渉も上手くいかないということを主張しているわけだが、実際には「金銭」や「バーター」が解決のための手段になっていることもままあるわけだ。それも「数学教育が育む論理力」なしでは為しえないという理屈は、少なくとも私には理解しにくいと感じられる。

(この記事は公開後も編集する可能性がある。)

日本数学会による大学生数学基本調査への疑問(その3)─結果の分析について─

 今回の調査目的は、冒頭から抽象的である。「高等教育を受ける前提となる数学的素養と論理力」とは何かということが全く定義されていない。
基本調査に至る経緯の中で、

「1.読解・表現などの国語力 2.抽象的・論理的思考力 3.知識に対する意欲や忍耐力といった、ごく基本的な能力が学生の間で低下しつつあるという現実」

という表現や

「論理的文章を読解する力、論理を組み立て表現する力」

といった表現もあるが、そもそもそういう力をどういう問題で調査できるのかということ自体非自明であり、「数学」ということとどう関係しているのかということについても十分な説明がなされているとは言いがたい。

 私は、そうした一般的な問題はとりあえずさておいても調査しデータを取ることが重要だという意見にはむしろ賛成する。データを伴わない主観の応酬を繰り広げるのと、不完全ではあるかもしれないが何がしかのデータをもとに議論するのとでは雲泥の差があると考える。だから私はこの調査を行うことそのものは賛成する。もともと十分に定義することが難しいものを何とか把握しようとしているのだから、調査には不完全で行き届かない部分があっても仕方がない。数度の調査を経ながら徐々に改善していけばよいと思う。


 しかし、得られた結果を非常に重大視することには慎重であるべきだ。その結果を針小棒大に述べてはいけないし、またそう述べていると受け取られかねない記述は避けるべきだ。自分たちにも行き届かないことがある可能性が高いのなら、それなりのトーンでしゃべるという謙虚さが必要だと思う。今回の「報告書の概要版」などに見られる書きぶりは、少なくとも私には、そうした謙虚さを欠いていると感じた。それは、見る人が見れば「独りよがり」と批判されても仕方のないものだとさえ思う。

以下、いくつかの観点を具体的に指摘したい。

  • 数量的なデータに対する主観的断定が行き過ぎている。

例えば、「提言」p.2の「基本調査の結果とその分析」では、

  • 問1では「平均の定義と定義から導かれる初歩的結論」、「少し複雑な命題の論理的読み取り」のどちらも誤答率が高く
  • 二次関数の性質を列挙する問題では、意味不明の解答が多く、準正答のなかにも、すでに挙げた性質を再度挙げる解答が目立ちます。
  • 平面図形と定規とコンパスで作図するということが何を意味するのか理解していない答案が多く

といった「高い」「多い」「目立つ」といった表現が使われている。しかし問1-1の正答率は平均で76.0%であり、問1-2は平均で64.5%が正答である。このデータを見て単に「誤答率が高い」と記述することには私は疑問がある。しかもこれは全体の平均であって、実態は国立Sから私立Cまで正答率はかなり幅がある。それをひとくくりに「誤答率が高い」と総括してしまうのはまずいと私は考える。このような書き方は単なる主観の表明に過ぎない。例えば「事前に出題者が想定していた正答率に比べると」というような表現がつけば主観の表明でも意味を持つはずだ。

こうした例は他にもある。「報告書の概要」p.2では、問1-1の平均に関する問について

理工系でも約2割が不正解。
理系高校生の2005年度基礎学力調査報告(東京理科大数学教育研究所)によれば、平均を求めさせる典型的計算問題(問題B5)の正答率は92.5%。単純には比較できないが、「平均を計算できる」のに「平均の正しい意味がわからない」という層がかなりいることがうかがえる。

という文章がある。理工系以外もすべて含めて単純に正答率を比較すると、92.5%-76.0%=16.5%である。理工系の正答率82.0%なので、この場合は92.5%-82.0%=10.5%である。これがすべて「平均を計算できる」のに「平均の正しい意味がわからない」層であると仮定したとして、それは16.5%あるいは10.5%である。これを「かなりいる」と記述してよいかどうか。私はそれは主観に過ぎないと思う。
 あえて私の主観を述べるなら、私はこの数字から「平均を計算できる」のに「平均の正しい意味がわからない」層は意外に少ないという印象を持った。もっと間違いが出てもよい気がした。しかし、それは、なぜこの選択肢が正しくないのかという根拠を明示できるかどうかを調べてみるまではなんとも言えないという印象もまた持たざるを得ない。


もうひとつの例はFAQp.3のQ11にある。

二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層が存在し、また、それが無視できないほど大きな割合になることが明らかになりました。

という表現が使われている。単純に正答率を見ると、39.5%が正答、準正答をあわせると合計53.0%である。のこりの47.0%がすべて「二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層」なのだと判断しているのだとすれば、それはそれなりに大きい数字で「無視できないほど大きな割合」かもしれないが、しかし少なくとも私は典型的誤答の例として掲げられている

「間違った観点を挙げる(例:原点を通る、頂点は(3,-17))、自己流の用語の導入(「上に凸」を「∩型」と書く)」、挙げるべき3つの項目のうち空欄がある等」

という答案をすべて「二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない」と断定してしまうのは無理があると思う。しかし、もし誤答者をすべて「二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層」だと判断したというのなら、少なくともそう明言するべきだ。いったいどれだけの答案を「二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層」と判断しているのか、「無視できないほど大きな割合」とは具体的にどういう値なのかが判然としない。こうした書き方は主観的との謗りを免れないと考える。

  • 今回の調査だけを根拠に断定する記述が多すぎる。

今回はせいぜい5つの問を用いた調査である。しかもこれは第1回の調査である。そうした限定的な例だけを根拠に、例えば

  • 論理を正確に解釈する能力に問題があることを示しています。(提言p.2問1についての分析)
  • 論理を整理された形で記述する力が不足しています。(提言p.2問2についての分析)

という記述が出てくる。問1は平均に関する問題と論理的文章の読解をそれぞれ1つずつ試してみただけではないか。問2-1はあまりに基礎的過ぎる「偶数と奇数の和が奇数であること」の証明を求めただけであり、問2-2は放物線の特徴を問うただけではないか。(しかも問2は私が考えるに、問題文自体に調査者の要求がないかを具体的に示しきれていない点があったと思う。仮にそのことを別にしたとしても、)たった2つずつの問から「論理を正確に解釈する能力」や「論理を整理された形で記述する力」について、一般的な断定を行うこと、またそのような断定を行っていると受け取られるような記述は避けるべきだと考える。

 他にも行き過ぎた断定と感じられる箇所がある。
 例えば、大学の授業に関連した次の2つの記述である。

  • (問2-1に関連して「報告書概要版」p.4)国公A・B群、私A・B・C群においては、1クラスの中で、数学の記述試験の経験がある層とそうでない層との間にバラつきが大きい傾向が見られ、授業の成立を困難にしていると推測される
  • (問2-2に関連して「報告書概要版」p.5-6)国公A・B群、私S・A・B・C群では、1クラスの中で、数学の記述試験の経験がある層とそうでない層との間にバラつきが大きい傾向があり、授業の成立を困難にしていると推測される。

問2-1は「偶数+奇数が奇数になることの理由説明」を「文字式を用いた厳密な証明を与えること」と諒解した上で正しく述べられることが要求されている。また問2-2は、与えられた放物線の重要な特徴を3つ、文章で答えさせる問題だった。この2つの結果が「試験を受けているかいないか」という軸でばらついているということを根拠に、「授業の成立を困難にしている」要因のひとつが記述試験の経験の有無だというのは言いすぎではないか。確かに「記述試験の経験の有無」がこの2問の出来をわけたことは事実で、それはより広範なレベルで数学の基礎学力の差を生んでいる可能性はある。しかし、そもそも記述試験を受けていても、大学の授業の成立を困難にしてしまう要因を持っている可能性もまたある。記述試験の経験がある層の中でもさらに基礎学力のバラつきがある可能性はかなりあるのではないか。こうした様々な可能性があるなかで、「記述試験の経験の有無」が大学の授業を成立させるか否かを分けるかのように書いてみたり、またこのことを根拠に「記述試験を設けるべきだ」と一般的な主張してしまうのは行き過ぎだと考える。


 もうひとつの例は、選択可能な進路に関する記述である。

(問2-1に関して「報告書概要版」p.3)私S群では4人に3人が準正答に到達せず、国公A群における正答+準正答率が35.7%%(ママ)と、国S群の半分を切っており、国S群とそのほかの群との傾向の差が著しい。(グラフ1)
基本的論証力を身につけているかどうかが、選択可能な進路の幅を大きく左右している可能性


(問2-2に関して「報告書概要版」p.5)国公立は正答+準正答は5割を超えたが、私立ではS・A・B・Cすべての群で5割を切る。国S群では「重篤な誤答」を書く学生はほとんどいないが、私S・B・C群では2割以上の学生が「重篤な誤答」を書く。(グラフ2)
(中略)
個々の知識だけでなく、知識を総合する力の有無が、選択可能な進路の幅を左右する。

まずこの2問だけで「基本的な論証力を身につけているかどうか」や「知識を総合する力の有無」が測れているとするのは行過ぎているのではないかということはすでに指摘した。また、こうした問題の出来がある程度大学の偏差値に連動しているのは当然で何も目新しい結果ではない。本人の持っている学力(やや乱暴に言えば試験の成績)が「選択可能な進路の幅を左右する」のは当然である。いまさら声高に言うべきことだとも思えない。また、それが「基本的論証力」や「知識を総合する力」とどの程度関係しているのか、この2問だけで判断することは到底無理だ。そもそも「基本的論証力」や「知識を総合する力」という表現自体抽象的でどういうことさしているのかはっきりしない。この2つの記述は、「基本的論証力」や「知識を総合する力」が、偏差値の高い大学へ進学するためのバロメータであり、それが最終的な就職先や年収などに関わってくるのだという主張を補強したいためになされているのではないかという疑いさえ抱かざるを得ない。ちなみに、2つめの記述では1つめの記述にあった「可能性」が抜け落ちた断定になっていることにも注意するべきである。


  • 比較の方法や結論の出し方に問題を感じる部分がある。

 「報告書概要版」p.3に、問2-1に関連して次のような比較の文章がある。

文部科学省による中学3年生を対象とした平成22年度全国学力調査では「3つの連続した奇数の和が奇数になる」ことの論証問題が出題され(B問題2-(2))、正答率は26.4%。私立のすべての群において、この結果と同程度か下回っている。

実際に全国学力調査で出された問題は次のようなものだ。

ちなみに、この問題は「3つの連続した奇数の和が奇数になる」ことの証明ではない。「3の倍数になること」の証明である。報告書概要版の記述は正しくない。
それはさておくとして、この問題は(1)で「3つの連続する奇数の和は9の倍数となる」という間違った予想の反例を考えさせた上でこの(2)の問題に至る。(その1)で私が述べた考え、つまり、予想することと証明することの違いを明確化させることについて配慮されていると感じた。それはさておくとして、この問題の質問形式は、「予想が正しいことの説明を完成させなさい」である。
これは次の2つの点で今回の「偶数と奇数をたすと、答えはどうなるでしょうか。次の選択肢のうち正しいものに○を記入し、そうなる理由を下の空欄で説明してください」とは異なっている。
第1に、命題の真偽があらかじめ与えられているかどうかの違い。学力調査では「3の倍数になる」ということは与えられているが、数学基本調査では「いつでも偶数、いつでも奇数、偶数・奇数どちらもある」から選ぶ形なので結論はどれかあらかじめ与えられれているわけではない。
第2に、学力調査の問題では、「n を自然数とすると,連続する3つの奇数は,2n-1,2n+1,2n+3 と表される。したがって,それらの和は,(2n-1)+(2n+1)+(2n+3)=」までが誘導されている。これらなば文字式による証明が求められていることは一目瞭然である。
この2つの点で数学基礎調査が全国学力調査の形式を採用していれば、正答率は向上したに違いない、と考えるのは十分合理的であると私は思う。その意味で、全国学力調査の問題と今回の数学基礎調査の問題を比較し、「正答率は26.4%。私立のすべての群において、この結果と同程度か下回っている。」などとことさらに強調するのは間違っていると私は考える。


 もうひとつの例は作図に関する問3である。報告書概要版のp.6に次のような記述がある。

理系高校生の2005年度基礎学力調査報告(東京理香大数学教育研究所)によれば、相似と比に関する典型的問題(問題D6)の正答率は87.9%。単純には比較できないが、比や相似を現実的な問題解決(測量等)に利用する数学活用力に課題があるのではないか。

この「相似と比に関する典型的問題」というのがどういう問題だったのかはネット上で見られる形になっていないようなのでわからなかった。しかし、おそらくそれは作図に関する問題ではなかったのではないか。問3で正答率が伸びなかった原因は、相似の利用云々以前に、作図問題であるということのハードルの高さだったのではなかろうか。提言p.2では、

問3では、平面図形を定規とコンパスで作図するということが何を意味するのか理解していない解答が多く見られました。高校までの教育でこうしたことがきちんと教えられていない可能性もあります。

と述べている。つまり、「定規とコンパスで作図する」ということに対する理解が正答率を下げた最大の要因なのではないか。にも関わらず報告書の概要版では、「比や相似を現実的な問題解決(測量等)に利用する数学活用力に課題があるのではないか」と評価してしまっている。これでは提言の記述と報告書概要版の記述がズレてしまっているといわざるを得ない。

またあえて指摘するなら、目盛りのない定規とコンパスを用いて与えられた線分を3等分することが、本当に「現実的な問題解決(測量等)」に「相似や比」を利用する「数学的活用力」を見ることになっているのかという疑問がある。現実問題として与えられた線分を三等分せよと言われたとき、目盛り付きの定規で実測するというのが常に誤りであるとは到底思えない。測量というのが多くの大学生にとっての現実的問題かどうかもにわかには肯定できない。こうした疑問は誰でも考えうるものであり、この報告書概要版のような記述をするのであれば、十分な説明が必要であると考える。

  • 対照群の設定の拙さがある。

日本数学会が今回の調査結果といわゆる「ゆとり教育世代」との因果関係をどう考えているのかが不明瞭であること、報道された内容や理事長の会見での発言、新井紀子氏のツイッターでの発言の間に齟齬が見られることは(その5)で指摘するが、実施した日本数学会の真意がどこにあるかは明確にされていないようだが、報道する側が「ゆとり教育世代」の「学力低下」という切り口で報道したことは事実であり、また受けての側もそのような受け取り方が少なからず見られたことは間違いない。
 しかし、今回の調査だけを根拠に、「ゆとり教育世代」の「学力低下」が裏付けられたとするのはやはり問題があると考える。そのもっとも重要な理由は、今回の調査では今の世代しか調査対象となっていないからである。
 提言p.1では、1996年に行われた大学教員を対象とする「大学基礎教育アンケート調査」について触れたり、「教育委員会メンバーがさまざまな大学の教員から意見を集めたところ」といった記述がある。しかしこれらの調査や意見がどれだけデータを根拠にしたものかは不明である。教える側の教員の「体感」というのは根拠としてはデータに基づいたものではないという点で客観性に欠けている。
 当然過去の同様の調査との比較や現在の多様な世代で同じ調査を実施した結果と比較するというような対照実験を行わない限り、「ゆとり世代」ということと「学力低下」を結びつけることは難しい。もし日本数学会が「ゆとり教育世代」と「学力低下」の因果関係について何らかの結論を下すなら、こうした対照実験は不可欠のものであり、その点では調査に不備があるといわざるを得ない。

 こうした対照群の設定の拙さをうかがわせる記述が個別の論点でも見られる。

 「単純には比較はできないが」という注釈がついているとは言え、報告書概要版p.2とp.6で「理系高校生の2005年基礎学力調査」が引用され対照群として取り上げられている。
 それを根拠に問1-1について「『平均を計算できる』のに『平均の正しい意味がわからない』という層がかなりいることがうかがえる」と結論している。この結論の出し方の主観性についてはすでに(その3)で指摘した。しかし対照群という意味で考えると、2005年に高校1年生だった人は、2012年に大学4年生になることになるので、今回の調査で実際に調査対象となった大学生は、2005年に中学生だった可能性もある。少なくとも、例えば問1-1では、実際に平均の計算を行う問題と問1-1を並列して出題し、両方解かせればわざわざ2005年の調査を持ち出す必要はなかった。
 問3の作図の問題でも、「相似と比に関する典型問題」の正答率との比較が行われているが、これの場合には、問題のレベル、特に作図法が扱われているという点が決定的に異なっており、単純な比較は意味をなさないと思われる。
 他にも、報告書概要版p.3では問2-1に関して、「中学3年生を対象とした平成22年度全国学力調査」が取り上げられている。しかしこれも単に「3つの連続した奇数の和が3の倍数になること」の証明を直接問うたのではなく、文字式を用いて論証するように誘導をつけたもので、問題の形式自体は異なっている。こうした問題と比較することには無理があると感じられる。

 FAQp.3Q.11にある問2-2に関する記述でも、「『できる』と『わかる』の乖離を調べるために、あえてこのような設問を設定しました」とあるが、これも何が「できる」であり、何が「わかる」なのかが曖昧であるために、適切な対照群を設定できているとは言えないと思う。もし何かこうした「乖離」の実態を明らかにしたいならば、両者の観点からの設問を設定するべきであり、問題文の書きぶり「重要な特徴を文章で3つ」からそうした乖離が明らかに出来ると考えるのには無理があると考える。

  • 重篤な誤答」という表現は酷すぎる。

(その3)の最後に、「重篤な誤答」という表現に関わる問題も指摘しておきたい。
重篤な誤答」という表現は、報告書概要版の問2-1,問2-2に関する分析で登場する。
問2-1に関する分析(p.3-4)では、

重篤な誤答には、1.いくつかの例を示すことで論証したと考えるタイプ、2.奇数や偶数の定義が間違っているタイプ、3.トートロジーを繰り返す、4.あいまいな言説への逃避や無関係な事柄からの類推、などがある。以下が実際の答案の例。

  • 「2+1=3、4+1=5だから」(タイプ1)
  • 「思いつく奇数と偶数を足してみたらすべて奇数になったから」(タイプ1)
  • 「偶数を2x、奇数を1とおくと、その和は2x+1」(タイプ2)
  • 「割り切れないから」(タイプ3)
  • 「奇数は奇数をたさないと偶数にはならないから。」(タイプ3)
  • 「偶数は2で割り切れて、奇数は2で割ると1余るということから」(タイプ3)
  • 「どんなに数が大きくなろうとも、1の位は同じ循環をし続けるから」(タイプ4)
  • 「偶数をたすことは和の偶奇に影響を与えないため、奇数に偶数をたすと、いつも必ず奇数になるから」(タイプ3,4)
  • 「三角と三角を足したら四角になるのと同じで、四角と三角では四角にならないから」(タイプ4)

この例示においても、例えば3番目はタイプ2というよりタイプ1であろう。4番目、6番目、8番目を「トートロジーを繰り返す」と断定することに問題があると思われる点は既に指摘した。しかし、少なくとも私には、これらの解答がたとえ数学的には不十分であっても、当たり前のことを聞かれて戸惑いながらもなんとか説明しようとした気配が感じられる。「割り切れないから」などというのはもうこれ以上どうかけばよかったのかわからなかったのだろう。余りに当たり前すぎる問題だからこういうことが起きてしまったのだということをもう少し考慮するべきだと考える。


しかしよりいっそう問題なのは、「重篤な誤答」の定義である。これが問題2-2の分析(p.5)に出てくる。

重篤な誤答とは、採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難な、論理的コミュニケーションの前提が崩壊している誤答である。以下が実際の答案の例。

  • 「原点は-の位置にある」「左上がりの放物線」「右下」「原点がy軸より右」「原点が上」「真ん中より下」「線は左上から右下へ書かれる」「右上にある」「直線。下から上へ」「-6ずつ下がる」「2本できる」「曲がった感じのやつ」「反比例している。反対側にグラフができる。」「マイナスの場所」「2の値を通る」「傾きは-8」「ゆるやかな曲線」「xに1,-1など数字を代入して出た値をグラフに点を打っていくと正比例になる。」「細い」「プラスには存在しない」「直線の交わってる」「xは-6」「-8が重要。+6xも大切。」

問2-1の分析に出てきた「重篤な誤答」と問2-2の分析に出てきた「重篤な誤答」というのは、当然同じ定義なのだと理解してよいと思う。そうすると、問2-1で挙げられた例は、「採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難」な答案なのか*1。「割り切れないから」とか「偶数は2で割り切れて、奇数は2で割ると1余るということから」とか「偶数をたすことは和の偶奇に影響を与えないため、奇数に偶数をたすと、いつも必ず奇数になるから」という理由説明が「採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難」だというのは到底信じがたい。それが数学的な説明として十分ではないということと「採点者がかなり想像力を働かせても、回答者が何を意図しているかを理解が困難」であるかどうかはまったく別の問題である。この定義と例に、私は到底納得できない。


ましてや「論理的コミュニケーションの前提が崩壊している」などというのは罵倒であり誹謗中傷ですらある。「割り切れないから」「偶数は2で割り切れて、奇数は2で割ると1余るということから」「偶数をたすことは和の偶奇に影響を与えないため、奇数に偶数をたすと、いつも必ず奇数になるから」などと答えた人に向かって、「あなたの答案は論理的コミュニケーションの前提が崩壊している」と批評するのは行き過ぎとしか言いようがない。数学的内容が不十分であったり、数学的誤りが含まれている答案を書いてしまうことと、その答案において「論理的コミュニケーションの前提が崩壊している」こととは全く別の問題だ。やはりこの定義と例に私は到底納得できない。


あえてもう少し踏み込みたい。例えば問2-1で、「思いつく奇数と偶数を足してみたらすべて奇数になったから」というような答案であっても、「回答者が何を意図しているか」は理解できる。その答案を書いた人がどういう拙い論証をしてしまったのかは理解できる。これは重篤というよりむしろ「典型」だ*2。この答案を書いた人の論理は確かに間違っていた。しかし、「すべて」を論証するべきときに、「いくつかの具体例」で論証したつもりになってしまった人が、「論理的コミュニケーションの前提が崩壊している」と断定されなければならないのか。この答案は、少なくとも「理由を説明してください」という問いかけい対して応えたのである。「論理的コミュニケーション」を行おうとしたのである。しかし間違えたのである。それを「前提が崩壊している」と断定するのはあまりにも酷すぎる。「今あなたが使った論理は正しくありません。それではすべての場合について示せたというのは不十分です」と指摘すればよいだけのことだ。


これはこの調査の分析に関して幾度となく使われている「論理」という言葉の問題に関係している。それらは次回述べたいと思う。


もうひとつ付言しておくと、この調査に基づく提言の発表記者会見に出席していた新井紀子氏は、NHKのニュースの中で、「論理的コミュニケーションの前提が崩壊している答案が増えた」というコメントをしていた。これは、「論理的コミュニケーションの前提が崩壊している」という表現の拙さという今指摘した点に加えて、「増えた」という量的表現にも問題があると思う。これは第1回の調査であり、増えたかどうかを議論するためには、何らかの別のデータとの比較が必要だからである。その別のデータが何かをはっきりさせない限り、それは単なる主観的な印象の表明に過ぎないことになってしまう。





(この記事は公開後も加筆する可能性がある。)

*1:問2-2で出てきた例のレベルと問2-1で出てきた例のレベルがかなり食い違っているように思えることも指摘しておきたい。

*2:問2-2では二次関数なのに、比例や一次関数を思い浮かべている人がいる。これは二次関数というものの理解ができていないという意味で「重篤」だと私は考える。しかしそれは「回答者が何を意図しているか」が理解できないとか、「論理的コミュニケーションの前提が崩壊している」というような性質のものではなく、単に内容の理解や自分の手で実験してみることや数学的現象を日本語で表現することが不十分なだけだ。

日本数学会による大学生数学基本調査への疑問(その2)─問題およびその正答例の妥当性について─

今回の調査は、「高等教育を受ける前提となる数学的素養と論理力を大学生がどの程度身につけているのか、その実態を把握」することをひとつの目標に行われたものである。
用いられた問題は3つのステージ合計5問であった。調査票+問題はこのpdfファイルにある。また、正答例はこのpdfにある。

私が問題だと感じる点を列挙すると次のようになる。

  • 問1-1、問1-2にも根拠を説明させるべきだった。

 この2問は、いずれも3つの選択肢の正誤を判定させる問題だったが、この2問には回答を選んだ理由や根拠を述べさせる欄がなかった。○か×かが重要なのではなく、どのように考えた結果間違えたのかを探ることこそ重要である。正誤を正しく選択できた人でもその根拠が誤りである場合は当然ある。問2-1では厳密な「証明」を要求しているにも関わらず問1-1,問1-2ではそうした観点がなぜなかったのか不思議である。これでは「数学的素養」と「論理力」を十分に把握できるとは思えない。

この問1-1に対して、冒頭で紹介した水無月ばけら氏のブログでは、有効数字に関する問題点が指摘されている。この問題点に関してツイッター上でh_Okumura氏が「数学科で問題に163.5と書いてあれば163.5として計算してよいというのがお約束だが,現実世界での163.5は163.45以上163.55未満のこと。このあたりの頭の切換えができないと日本数学会は有効数字も知らないと批判する人が出る。」とコメントし、それに対して新井紀子氏が「そのご指摘があったことは承知しており、データを精査しています。いずれ正式にお答えすると思います。」と述べている。しかし、この設問のように「理由」を述べさせる形になっていないと、どれだけ「データを精査」したところで得られるものは少ないと考えられる。やはり、根拠を述べさせることは必要だったのではないか。

  • 問1-1,問1-2合計で5分という回答時間が適切かどうか疑問である。

回答時間をどの程度厳密に測定したのかはわからないが、全部で6個の選択肢の正誤を判定させるのに5分というのは少し酷だと思った。考える速度が速いか遅いかは少なくとも第一義には「数学的素養」や「論理力」と等価ではない。時間は十分に与えるべきだったのではないか。FAQのp.2のQ7で「調査協力者によれば・・・・解答に必要な時間は十分でした。」とあるが、それは一体誰がどういう根拠でそう判断したのか不明である。

  • 問2-1では問題の内容が余りに基本的過ぎた。

 「偶数と奇数を足したら奇数になる」のは当たり前だすぎるくらい当たり前だ。
それを、「整数n,mを使って2nと2m+1とおいて、その和が2(n+m)+1で、n+mは整数だから、2n+2m+1は奇数だ。」とかけないと「正答」とはみなさないと考えるのはもちろんそれでひとつの立場だ。私は、偶数を2n、奇数を2m+1と文字式で表すということの重要性は強調するに足ると思っている。一般項を設定できることは数学の発展にとっても非常な重要な側面を持っていると考えるからだ。しかし、その重要性はすくなくとも報告書の「概要版」では述べられていないし、またその重要性をこの問題を通じて理解してもらおうということには問題の内容があまりに当たり前すぎるという点から無理があると思う。

 例えば「報告書の概要版」p.4で例としてあげられている「割り切れないから」という回答を「トートロジーを繰り返す」回答であると断定したり、「偶数を足すことは和の偶奇に影響を与えないため、奇数に偶数をたすと、いつも必ず奇数になるから。」という解答を「トートロジーを繰り返す」とか「あいまいな言説への逃避や無関係な事柄からの類推」と断定し、「重篤な誤答」とするのはあまりに酷だと思う。「小学校の説明活動のように、文字を用いず碁石などを用いて直感的に説明する」というものを「典型的な誤答」と断定することも同様だと考える。それらは確かに厳密な論証とはいえないが、「理由の説明」として「誤り」であるとまでは言えないのではなかろうか。

  • 問2-1では質問の形式「理由を説明してください」にも問題があった。

 これには問題文の記述の拙さもある。「次の選択肢のうち正しいものに○を記入し、そうなる理由を下の空欄で説明してください。」という記述では、それが厳密な証明を求めているのか、もう少し直感的なことでいいのか判断できないし、また聞かれている内容が基本的であるからこそなおそこで戸惑う可能性が高いと思う。
 しかし、問2-1の結果について、

「偶数と奇数の和が奇数になる」証明を明快に記述できる学生が稀(提言p.2)
偶数+奇数は奇数になることの論証の正答+準正答率は33.9%(正答率は19.1%)であり(報告書概要版p.3)

と断定している。「理由を説明してください」は「証明してください」や「論証してください」と等価な質問である、あるいはそのように解釈しなければならないということにされてしまっている。
 FAQのp.2にあるQ10で「『証明せよ』と書くとそれだけで無回答が増えるという可能性があるので避けた」という説明や、「『理由を説明せよ』ということをどう受け取り答えるかを見ようと意図」という説明があり、「『すべての場合を尽くした』説明をする上では文字式等を用いた一般的な説明が求められること」を重視するのだという見解が述べられているが、「理由を説明せよ」という問題文がそうした「文字式を用いた証明を与えよ」ということだと了解できるかどうかは別の問題だと考える。

 冒頭で紹介した水無月ばけら氏のブログでは、この問い方を「カジュアルな感じ」と評しているが、私は調査もコミュニケーションである以上、調査側が何を求めているかははっきりと明示するべきだと考える。「理由を説明せよ」が「厳密な論証」を求めることと等価であるというのはあまりに錯誤的で独りよがりだとさえ感じられる。
 「重篤な誤答」の一例とされている「思いつく偶数と奇数を足してみたらすべて奇数になったから」というのは、確かに「すべての場合を尽くしているか」という点に問題があり、またそれは厳密な意味で他者を説得できる根拠とは言えないという点に問題がある回答である。しかし、こういう回答を前にして、「やっぱりこういう回答があるんですね。」と愚痴っても仕方がないのであり、私は、調査の問題の中で、「手近な例で予想すること」と「その予想を証明すること」とは別であることを明示した形で問えばよかったのだと考える。
 この問題は、例えば「4で割った余りが3の数Aと4で割った余りが2の数Bの和A+Bを考えます。A+Bを4で割った余りはいくらになりますか?まず予想してください。次にそれを証明してください。」ぐらいでも良かったはずだ。

  • 問題2-2は質問の形式「重要な特徴を、文章で3つ答えてください」に問題があった。

 どう考えても「重要な特徴」というのは主観的過ぎて何を問うているのか不明だ。例えば、「上に凸である。x=3に関して線対称である。y軸と(0,-8)で交わる。」という3つをあげた場合、それは「重要な特徴」をあげたことになるだろう。しかし厳密にはこの3つの条件だけからもとの2次関数を復元することはできない。つまりこれは「重要」かもしれないが、もとの2次関数を特徴付ける必要十分な条件とは決して言えない。他方、「(2,0)を通る。(4,0)を通る。(0,-8)を通る。」はどれも通る点について述べたという意味では同じ特徴が「重複している」が、もとの2次関数を特徴付ける必要十分な条件である。こういう回答を「重要な特徴を、文章で3つ答えてください」という質問の「正答」としうるのかどうかはなはだ疑問だ。

 FAQのp.3のQ11の中で、「価値観を問うようなたずね方は不適切なのではありませんか?」という質問に対して、「本調査は、成績や進路に関係するものではありません。ですから、設問の妥当性は調査目的に合致しているかどうかによって判断されるべきだと考えます。」といういささか官僚的な見解に続いて、

「個別の操作(計算等)は比較的よくできるが、その操作の意味がわかっていない・考えない大学生が増えた」という意見が、これまで日本数学会会員から多数寄せられてきました。そこで、「できる」と「わかる」の乖離を調べるために、あえてこのような設問を設定しました。本設問では、二次関数に関して学ぶ操作(例:x軸やy軸との交点を求める、頂点の座標を求める、等)がどのような意味を持つかを理解しているかを調査しています。これにより、二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層が存在し、またそれが無視できないほど大きな割合になることが明らかになりました。

という見解が述べられている。《「できる」と「わかる」の乖離》というのは抽象的過ぎて私にはどういう意味か一概には言えませんが、「重要な特徴を、文章で3つ答えてください」という質問形式にすることが、「二次関数のイメージが根本からずれてしまっている層や、自分が受けた印象と客観的であるべき特徴との違いを認識できていない層が存在し、またそれが無視できないほど大きな割合になること」を示すために必要不可欠なものであったのかどうか疑問が残る。しかもあえて付け加えるなら、この問題に対して、「報告書の概要版」p.5であげられたような「重篤な誤答」を書いた回答者が、「x軸やy軸との交点を求める、頂点の座標を求める」といった計算ができる層なのかも判然としない。

端的に、「この放物線の概形を描いてください。」と質問するのよりも、「どのような放物線でしょうか。重要な特徴を、文章で3つ答えてください」と質問する方が調査の目的により合致しているとは到底思えないのである。「重要な特徴を、文章で」などといわれるほうがよほどまごつく。「文章」と「式」や「描図」とにはギャップがあるかもしれないからだ。

  • 問3は、問題の選択に無理があった。

 私は作図の問題が重要ではないというつもりはない。しかし、この問題が「高等教育を受ける前提となる数学的素養と論理力を大学生がどの程度身につけているのか、その実態を把握」するという目的に合致しているとは思いにくい。内容がやはりマイナーだからだ。これ以外にも問うべき話題はいくらでもあるはずだ。加えて、この問題はやり方を知らない学生が10分の回答時間で一からやり方を考えるのはかなり困難だという点もあげられる。知ってるか知らないかという知識をあまりに真正面から問いすぎなのではなかろうか。
 そもそも「定規とコンパスを用いて作図する」という場合、「定規」というのは「目盛りのない定規」のことなのだというのは、一種のテクニカルタームに過ぎない。FAQのp.3のQ12で「コンパスと目盛りのない定規を用いて作図」とするべきだったのではないかという質問に、「本調査は、成績や進路に関係するものではありません。ですから、設問の妥当性は調査目的に合致しているかどうかによって判断されるべきだと考えます。」といういささか官僚的な表現を繰り返した上で、

今回の調査では、白紙をなるべく減らし、学生が持っている誤概念を浮かび上がらせるために、あえてこのような表現をとりました。これにより、国立の偏差値上位群では実測して3等分するという解答は非常に少ないのに、私立や国立の偏差値下位群では「実測派」がかなりの人数に上るという実態が明らかになりました。

と述べている。すくなくともそれで「白紙」が減ったのかどうかは検証しようがない。「誤概念を浮かび上がらせる」というのは、「定規とコンパスで」といわれたとき、「定規には目盛りはないのだ」と理解出来ていない人をはっきりさせるためということだろうか。それが、「高等教育を受ける前提となる数学的素養と論理力を大学生がどの程度身につけているのか、その実態を把握」するという目的に合致しているというのだろうか。しかも「実態が明らかになりました」といってもそれは結果論に過ぎない。

  • 問3の正答例は不足箇所があり十全とは言えない。

正答例では「コンパスと定規を使って、点Dを通り線分BEに平行な直線を引く」方法が何も述べられていない。これは、ステップ4にある「定規を使って点Bと点Eを結ぶ」よりもはるかに非自明な操作であり、ここに何も説明を述べないことが「正答例」として容認されるとは思えない。「報告書の概要版」p.6では、「作図方法を過不足なく表現した回答は稀であった。」と評価しているが、そもそも正答例にさえ「不足部分」があると私は考える。

また、これは回答時間との関係もあるのだが、FAQのp.2でQ7への答えとして

ステージ3(3)は、解答を思いつくのに時間がかかり、そのため手順を箇条書きに書くまでに至らなかったと見られる答案がかなりありました。このような答案は準正答と判定しました。

というものがある。しかし、これもどのレベルが「準正答」と判断されたのか非常に紛らわしい。平行な直線を引くことについて十分な説明がなくても「準正答」と判断された可能性も否定できない。


(この記事は公開後も必要に応じて加筆する可能性がある。)

日本数学会による大学生数学基本調査への疑問(その1)

日本数学会が「大学生数学基本調査」を行い、それに基づいて、2012年2月12日に《「大学生数学基本調査」に基づく数学教育への提言》を発表した。
2012年3月11日現在、まだ「大学生数学基本調査」の正式な報告書は発表されておらず、日本数学会のページでは、報告書の概要版、実施問題とその正答例、FAQが公開されている段階である。

日本数学会の行った記者会見の様子を含めた報道が行われた当初から、私はこの調査とその結果分析には様々な疑念を持っていた。
今回、日本の数学は大丈夫なのか(水無月ばけらのえび日記)がいくつかの観点で問題点を指摘していることを知り、
私も自身の見解をまとめておく方が良いかと思い、ここに記しておくことにした。*1

なお、私は日本数学会の会員ではないことを予めお断りしておく。

私が今回の調査とその結果分析に関して問題だと感じている点を大きく分けると次の3点になる。

  1. 調査に使われた問題およびその正答例の妥当性に疑念がある。(その2)
  2. 日本数学会が公表した概要版における結果分析の内容や議論の姿勢に疑念がある。(その3)(その4)
  3. 報道された内容と実際に日本数学会がどのように考えているのかという点に著しい乖離がある可能性が拭えない。(その5)

この3点について順次述べていきたいと思う。

*1:水無月ばけら氏は「調査はほとんど失敗と言って良いのではないか」と批評しているが、私はそこまで断定するつもりはない。

片瀬久美子氏の付録への疑問─番外編&備忘録─

もう終わりにしようかと思っていたのだが、その後もいろいろな発言が飛び出しているので、いくつか拾い出して批判しておきたい。
なおこの記事は必要に応じて随時追加していく。

(1)Impact Factorはいつから論文の信頼性をはかる尺度になったのか。(2011.12.29)

北米で福島原発事故以降乳幼児の死亡数が増加しているとする論文が各所で批判されている。特にその統計的主張が誤りであるようだ。私はそのことを否定したいわけではない。
しかし私は片瀬氏の次のような発言を看過することはできない。

ちなみに、シャルマンさん達の論文を掲載した専門誌のImpact Factorは0.98。信頼性は低い方です。

ここで言及されている専門誌とはINTERNATIONAL JOURNAL OF HEALTH SERVICES誌で、私が調べたところ、2010年のデータではIF値0.869だった。2005年だと0.595。2000年だと1.217だった。

雑誌のImpact Factorは、トムソン・ロイター社の提供するデータを用いて当該論文誌に掲載された論文数と論文の被引用数に関する直近3年分のデータを用いて算出される数値である。Wikipediaにある説明を見るだけで計算の方法はわかる。このIF値が大きければその論文誌に掲載された論文は平均的に見て引用されやすく学会に与えるインパクトが大きいということになる。

片瀬氏の上の発言は二重の意味で間違っていると考える。
第一に、IF値を使って個別の論文の被引用数に関する質を論じること自体が誤りである。
第二に、If値を使って個別の論文の結果に信頼がおけるかどうかを論じること自体が誤りである。

Wikipediaの説明にも書いてあるように、「インパクトファクターは「学術雑誌」の評価指標であって、学術雑誌論文はもとより研究者の評価に用いるものではない。」上の片瀬氏の発言はまさにその誤りを地でいくものである*1インパクトファクターが高い雑誌に載っているから質が良いとか、インパクトファクターが低い雑誌に載っているから質が悪いと断定すること自体間違っている。IF値はそういう使い方をしてはいけない。

IF値が高い雑誌に掲載された論文の引用頻度は相対的に高いであろうと推定することには、ある程度の合理性があると考える向きもあるかもしれない。しかし、IF値はあくまでも平均的な値に過ぎない。IF値が高い雑誌であっても、あまり引用されていない論文が掲載されていることはある。逆にIF値が低い雑誌の場合はさらに微妙だと考える。IF値が低いということから考えられる大きな可能性は、その論文自体もあまり引用されていないということ以外にも、論文誌の中に注目を浴びる論文とそうでもない論文とが多数混在しているような状況がありうる。特に年間の掲載論文数が多い雑誌の場合には、半分程度が注目されるものであったとしても、それらの実際の引用状況よりもIF値が低く出てしまうことになる。こうした点からも、ある論文が実際にどの程度引用され影響力を持っているかということは、個別の論文ごとに議論する以外にないのであり、掲載雑誌のIF値は参考値にさえならないと私は考える*2

こうした観点から、特にIF値が低い雑誌に掲載されている論文の引用頻度やインパクトが低いと断定することは間違っている。それは個別の論文の引用頻度を直接調べる以外に正確なことはなにもいえない。

そしてより重要な点は、第二の点、つまりIF値が低い雑誌に掲載されている論文だからといって、その論文の述べている結果の信頼性が乏しいなどというのは暴言だということだ。IF値が低いということは、その雑誌に掲載されている論文たちは、平均的に見るとあまり引用されておらず学会におけるインパクトが低い可能性があるということだけしか教えてくれない。上でも述べたように個別の論文の引用頻度という質は掲載雑誌のIF値を見るだけではなにも判断できず、個別の論文ごとに判断するしかない。繰り返すが、ここで言っている質というのは、引用頻度=学会に与えるインパクトが大きいかどうかという点だ。片瀬氏はあろうことか影響度という質だけではなく、論文の内容そのものの信頼性をIF値ではかろうとしている。それは誤りだ。あまり引用されていない論文というものは、内容がマイナーだったり結論が注目を集めるほどsuprisingなものではなかったというものであり、引用されていないからといってその結果の信用性に問題があるわけではない。上の片瀬氏の発言のように、「IF値0.98の専門誌の信頼性が低い」などという一般的な価値判断をしてしまったら、INTERNATIONAL JOURNAL OF HEALTH SERVICES誌に掲載されている全ての論文の信頼性を断定していることになってしまう。その他のIF値の低い雑誌に掲載されている全ての論文がその射程に入っているのだ。そこまでの覚悟をもって発言しているとは思えない気軽さが問題であると考える。IF値が低いことをもって信頼性が低いなどと包括的に断定すること自体が失礼だし、ある論文の信用性をそのような概括的な基準から演繹して批判するなどもってのほかだと言わざるをえない。論証はあくまで個別の論文ごとに行う以外にないのである。

まさか片瀬氏は、インパクトが低い(あまり引用されていない)ということと「結果の信頼性」を同じものだとみなしているのだろうか。そんなことはにわかには信じられない。しかし

という4つの発言を時系列順に並べてみると、片瀬氏の発言はかなりエスカレートしているように見える。最初のうちは少なくとも引用という意味でのインパクトが問題にされていた。ここでもすでに個別の論文の引用頻度という質が掲載雑誌のIF値と結びつけるという誤りが行われている。しかし、第3、第4の発言は、論文の信頼性へ疑義がIF値を根拠にして行うという第二の誤りが現われている。

片瀬氏は、IF値が高い雑誌に掲載された論文の中にも質が悪いものが混じっていると考えているが、IF値が低い雑誌の場合には、その論文の信用性に疑いが生じると考えているように見える。片瀬氏はIF値と引用回数と信用性を同じものとみなして、当該論文の信用性をあたかも掲載雑誌のIF値で判断できると考えているのではないかという疑念さえ生じる。そんな議論は全く根拠のない暴論であると言わざるを得ないのである。


少し別の角度で見てみたい。片瀬氏は、科学研究の組み立て方−アップルペクチン(ビタペクト)論文の検証付きの中で、セシウムの排出と被験者の体重の関係について、HEALTH PHYSICS誌に掲載された論文を引用して、被験者の体重データを明記しなかった点を問題視していた。以下にHEALTH PHYSICS誌のIF値とINTERNATIONAL JOURNAL OF HEALTH SERVICES誌のIF値を10年分列挙してみる。

IF値がかなり似通っていることは一目瞭然である。片瀬氏の議論に従えば、HEALTH PHYSICS誌も「信頼性は低い方」だということになるにも関わらず、その「信頼性の低い」雑誌*3に掲載された論文を根拠に、別の論文の結果の信頼性に疑問を呈していたのはほかならぬ片瀬氏自身ではなかったか。このような議論の仕方は、少なくとも私にとっては二重基準であるとしか見えない。

さらに2点追記する。

第1に、科学研究の組み立て方−アップルペクチン(ビタペクト)論文の検証付きの中で、セシウムの排出に関する生態半減期についての「従来の知見」を取り上げている。参考にされている資料は食品安全委員会作成の資料だが、それによれば、セシウムの生態半減期に関して引用されている論文の出版雑誌は、HEALTH PHYSICS誌とRADIATION RESEARCH誌が多いようだった。RADIATION RESEARCH誌のIF値は2010年2.578(5年IF値は2.795)で、2004年3.208だった。確かにこれは前の2誌よりは大きな値である。
しかし、片瀬氏は以前に

『Journal of Gerontology』のImpact factorは3.083。これだけが指標ではないけれど一流誌とするかどうかは…。むしろやや中堅誌という感じ? それと最終的な評価は論文そのものの内容と質であるし、掲載誌のレベルだけからは判断はできませんしねぇ…。

という発言を見ると、IF値が3程度でもどうやら質に疑問を持っている様子である。疫学的な結果は様々な雑誌に掲載されているのだろうが、片瀬氏のIF値を用いた発言は、自分の批判したい論文に対しては概括的演繹という断定として用いられ、自分が引用した結果に関しては十分に検討されていないと言わざるをえず、これは明確な二重基準である。論文の内容に問題があるなら、その問題点を指摘すればよいのであって、IF値という外形的なものを誤った方法で適用したり二重基準に陥ったりするのは避けるべきだ。

第2に、片瀬氏は、「ジャネット・シェルマンさんら再び」の記事中で、Scientific Americanに掲載されたMichael Moyer氏による批判記事を「翻訳」している。
そこでMoyer氏の記述
Now the authors have published a revised study (PDF) in the International Journal of Health Services. A press release published to herald the article warns, “14,000 U.S. Deaths Tied to Fukushima Fallout.” This is an alarming accusation. Let’s see how the authors defend it.
に対して、

今回、その著者らは修正した調査(PDF)をInternational Journal of Health Services*[参考:Impact factor=0.98] で発表しました。その記事の警告を告知する報道発表はこちらです「福島からの放射性降下物に関連する米国の死者は14000人*」。これは驚くべき告発です。著者らがどの様にそれを主張しているのか見てみましょう。

という訳文を付し、もとのMoyer氏の文章にはなかったIF値の情報を付加している。Moyer氏がIF値を記述していない以上、片瀬氏の主観的判断でこうした加工を施したことになる。翻訳と言いながら訳文に原文にはない情報を挿入するという加工をすることには疑問がある。私はIF値の情報など内容を信頼性を判断するためには何の役にも立たないと思うが、どうしてもそうした情報を追記したければ、その後の片瀬氏自身のコメントの中で述べるべきであろう。最低限、「参考」ではなく「訳者注」とするべきだ。これは「翻訳家の倫理」とでも言うべき問題ではなかろうか。

片瀬氏はシェルマン氏らの論文の内容的信頼性を批判したいのだろう。しかし、IF値などという論文の内容的信頼性とはほとんど無関係の「属性」を持ち出すことのは無意味だし、それで何かが論証されているなどという印象操作を行うのは間違っている。

(2)内田氏に対する発言の問題(2011.12.29)

私の記事でも指摘した内田麻里香氏に関する片瀬氏のコメントについて、片瀬氏は12/25に次のように発言している。

1年程前に、内田麻理香さんが科学リテラシーは一般の人には不要ではないかと書いておられた記事に対して、私が科学リテラシーの必要性を感じないのは彼女が若く経験不足だからではないかとあるブログのコメントに書いたのは、私の勝手な憶測からの偏見であり、ご指摘を頂いて何度も謝罪をしております。

私は、片瀬氏が問題の本質を外していると考える。

確かに、片瀬氏が内田氏を「若くて未経験であるに違いない」という主旨の批判をしたことは事実であり、そのことも問題だ。特にそのことに対する表現「人生の明るい面しかまだ知らない無邪気なお嬢さんという印象」もまずかった。

しかし、片瀬氏の発言で問題なのは、むしろコメントの後段にある。それは、片瀬氏が能力を持っているにも関わらず、能力のない内田氏がその若さと容姿を理由に採用されているというような断定をしたことである。「おばちゃん博士よりも若くて大衆受けが良さそうな女性の方が「サイエンスコミュニケーター」の適格者なのでしょうねぇ。」とか

「「科学についての造詣が深くて」きちんと理解した上で分かり易く正しく一般の人達に科学を伝えて啓蒙する能力が高い人かどうかよりも、まだ未熟でも仕事をさせていくうちに覚えていくだろうしそれよりも「イベントを盛り上げられる華やかさ」のある人を中心に考えられている」

という発言がそれだ。

私が問題にしていた片瀬氏の議論における態度とは、造詣のある自分と不勉強で未熟な相手という構図を極めて安易に多用している点であるといってよい。単に若くて未経験であることを批判したことが問題なのではなく、自分の方が豊富な知識と能力を持っているというある種の「上から目線」という「勾配」を設定してしまうことが問題なのである。片瀬氏はそこがわかっていないのではないだろうか。

(3)可能性と蓋然性の問題(2011.12.29)

片瀬氏は今回のブログの記事を書いた以降も、別件で「可能性」の問題について発言を続けている。

「可能性は0ではない」これを持ち出したら、世の中の数多くの事象がこれにあてはまり、何でもありの世界になります。でも、実際はあり得る程度は様々です。全てが同程度に起こり得ると錯覚しては判断を誤ります。「どの程度」の判断を加えることは必要でしょう。
「どの程度」という感覚は大切ですよね。 RT @Rsider:流産・死産・先天性異常の可能性を取りざたするなら「どの程度」を問わないと意味ないよ。ただの可能性だったら常にあるんだから。「ない」と言うことはサイエンスにはできないんだから。

私が問題としていたことは、可能性を論じるのではなく蓋然性を根拠付けて述べるべきだということだったのだが、片瀬氏にはそのような論点は目に入らなかったようだ。率直に言って、「2000〜2008年の調査では、動物試験を一通りパスしたものが人の臨床試験でも成功する確率は18%でした」という情報も持っている片瀬氏が、「マウスでもある程度普遍的なことを言えるのではないか?というのは、甘いですねぇ。実際を知らないからなんでしょう。」などと発言して18%の可能性を極めてありえないことであるかのうように扱い、他方でO157が米のとぎ汁乳酸菌に混入する可能性がかなり高いかのように発言する。そのような判断を行っている片瀬氏が、「可能性」ではなく「どの程度」を問題にすることが大事だと発言しても、私は到底信用することができないのである。

(4) トラックバックは削除されたのか?(2012.1.30)

科学研究の組み立て方−アップルペクチン(ビタペクト)論文の検証付き」に対して私がつけたトラックバックが削除されたのではないかと私は考えている。私は片瀬氏を「御用学者」とか「エア誤用」であるとか、「安全厨」であるなどとレッテル張りしたわけでもなく、氏の議論の中の拙いと考える部分についてできるかぎり冷静に指摘し、かつ応答したつもりである。片瀬氏は自身のことを「生物学の研究者」であるとか「生物学者」であると述べておきながら、自身の記事に対する批判的な引用さえも、自身の足を引っ張る議論であるとして削除してしまうのであろうか。百歩譲ってせめてこちら側へ一言あってもよいのではないか。何度も強調しているように、私は片瀬氏の研究者としてのこうした有り様に疑問を抱いているのである。

*1:まさか片瀬氏はIF値というものが分野を越えて比較するのに適しているなどとは思っていないだろうが、例えば自然科学の中でも例えば数学のような分野だと、統計学に関する論文誌を除いてしまうと、雑誌のIF値はは他の分野に比べてかなり小さい。2010年のデータだとIF値が1を越えている雑誌は49誌。2を越えているものはわずか9誌しかない。最高値も4.864だ。片瀬氏のような何の留保もつけずにIF値だけを取り上げる方法はこうした点でも問題があると考える。まさか片瀬氏も数学におけるIF値が0.98の論文誌を「信頼性は低い方です」とは言わないだろうと信じたい。

*2:もちろんIF値が高い雑誌の掲載基準はかなり厳しいものであることが多く、その点で査読を通過したということはそれなりの審査を経たものであろうというような推量は合理的だと考えられる。しかしIF値が低い雑誌の場合は、その論文の査読がゆるいものであったのだという推測は不合理だ。

*3:念のため、私はHEALTH PHYSICS誌が信頼性の低い雑誌であると思っているわけではない。2010年度のデータで見ると、直近の2年で280件の論文が掲載され、2010年に338回引用されている。これは、INTERNATIONAL JOURNAL OF HEALTH SERVICES誌の場合が、84件掲載73回引用であるのに比べてみれば違いは一目瞭然であると思う。同じようなIF値でも内実は様々である。私は両雑誌が信頼性に乏しいというつもりもないし、両者の格を云々したいわけでもない。

白熱教室JAPAN大阪大学小林傳司教授への疑問(その2)─第1回「BSE事件が問いかけるもの」要約

白熱教室JAPAN大阪大学小林傳司教授の第1回は、「BSE事件が問いかけるもの」と題して放映された。

率直に言って、私は、この講義は、問題の立て方自体はともかくとしても、情報提供の仕方や発問の仕方・教員側の発言・学生側の議論などの多くの部分において、手の施しようがないほど酷い構成になっていると考えている。

それらを述べる前に、第1回の様子を大雑把にまとめてみたいと思う。
このまとめは私の主観が反映されている可能性があり、興味がある方はオリジナルの映像を確認されたほうが良いかもしれない。
発言の内容にも漏れがあると思われるし、少し乱暴に要約している箇所もある。
また、顔出しされている学生を正面から批判しようというつもりではないので*1、ここでは議論の展開が追える程度に紹介する。

最初のナレーション。

「科学や技術を社会的な視点で見つめなおし、専門知識を持つ者と持たない者とのコミュニケーションの困難さを学生たちに実感させます。そして何をすべきかを考えることが目的です。講義には専門の違う大学院生が参加しています。問題解決に向けそれぞれの研究分野に立って議論する双方向型のコミュニケーションを通して社会と科学技術の関係を考えます。」

まず小林が建物をバックに登場し、次のように述べる。

「講義というよりもワークショップ形式といったほうが良いでしょう。そして複数の教員が参加して行っています。科学技術は社会に大きな恩恵をもたらしてくれますが、社会に思わぬやっかいな問題を引き起こしたりもします。例えばかつてはBSE問題がありました。今年はどうしても3.11の問題が思い浮かびます。ともすれば中学高校時代の学習の経験から、理科あるいは科学技術の問題には確実な正解があって、国語や社会とはこの点で違うというイメージを持ちがちです。しかし、現実には科学技術も不確実な答えした持っていないという場合があるのです。この授業では科学技術が正解の出せない問題で、しかも社会に対して大きな災厄をもたらした問題を取り上げ、専門家はどのような責任を負い、社会はどのように科学技術を利用していけばいいのかについて考えてもらいたいと思っています。もちろん、これも正解のない問いなのですが。さて、今回は1990年代にイギリスで大きな社会問題になったBSEを事例として取り上げます。」

ここで講義室の風景に切り替わる。

八木絵香特任准教授が、参加者すべてが自分の専門性においてコミットできるはずなので積極的に発言するよう促す。

次に小林が、今回の講義のテーマが「科学技術の不確実性と社会的意思決定(1)」だと述べる。その上で、

  • 科学技術が社会や経済のあり方を決定付けていること
  • 他方で思わぬ問題が起きてくること
  • そのような状況で、科学技術をどう使うかを誰がどうやって決めるかということが重い問題であること

を指摘し、今回は、BSEを事例として取り上げると宣言する。

BSEが何であるかということに関する予備知識の提供が行われる。

  • 牛海綿状脳症が伝達性を持つこと
  • 他にも羊やミンク、シカ、ヒト、ネコに見られる伝達性海綿状脳症の一例であること
  • 有力学説として、プリオンたんぱく質が形態異常(ヒトの体内にも存在している正常型プリオンの構造が変わる)を起こして代謝不能になり、細胞内に異常蓄積された結果、脳細胞の破壊をもたらすというプリオン学説を紹介
  • 結論を先取りしているんですが、と前置きして、牛肉からヒトに感染したとされているが、ヒトでも似た病気としてクロイツフェルト・ヤコブ病CJDがあること。しかし、発症年齢などの点で違いがあることから牛からヒトに感染した場合は、変異型クロイツフェルト・ヤコブ病vCJDと呼ばれていること
  • 治療法がないこと
  • 潜伏期間が長い(2〜8,10年)こと
  • 診断方法がないこと。異常プリオンを血液検査で見ることはできず、脳髄の組織を直接調べるしかないこと。

などが小林により説明される。

他方、プリオン学説になお異論があることが紹介される。

  • この学説が、コッホの原則を満たしているかどうかが疑問視されていることこの原則は、「ある病気の原因と成っている微生物を特定するために必要な4条件である」と紹介し、この原則をプリオンが満たしているかどうかを検討してみると、2番目の条件である「病原体の単離」から怪しくなってきて、他の個体に感染させると同じ病気が見つかるという3番目の条件までいったというような話もあるがよくわからない、2011年の今でもそういう状態だ
  • また、たんぱく質が経口摂取でどのようにして脳に蓄積するのかというメカニズムが不明であること。通常たんぱく質は胃液で消化されアミノ酸として吸収されてしまうはずで、たんぱく質のまま入ったら免疫反応を起こしてしまう。
  • 「かなり多くのというか一定数の科学者は、プリオンはほんとの原因ではなく、ほんとの原因の産物ではないか、やはりほんとの原因は、うつるんだから、核酸をもった物質であって、ウィルスではないか、というふうに主張している研究者もいます。」

小林は、有力学説はプリオンだが、ウィルス説を唱えている学者も多いということだとまとめた上で、科学においてはこのような状況であることは意外に多いと述べる。
続けて、これは理系の学生には当然でも、文系の学生には、なじみがない。
なぜなら中学高校の理科でかならず正解があったというイメージが現代の科学技術にも投影されているからだと指摘。これが科学コミュニケーションでもわりと大きな問題だと指摘する。

続いてBSE問題の年表が出る。

  • 1986.11に初めて牛のBSEが見つかったこと
  • 1988.7に反芻動物由来タンパクの反芻動物への供与を禁止したこと

を述べ、1920年代から本格化した、牛の飼料に肉骨粉が使われていたことを指摘する。
ここで専門家委員会として、「サウスウッド委員会」が設立されたことを紹介し、
この委員会の報告書では、牛の発症予想を、最大2万頭で1996年には終結するとし、人間へのリスクは極めて小さいだろうと予測したことを指摘する。実際には2010.7時点でイギリス国内で18万頭が発症したことも指摘する。

他方で

  • イギリスでは、一番汚染されている危険部位を食用から排除するという規制もかけられていったこと
  • しかし、当時、イギリスの奇病だと思われていたこと
  • 1991.5にフランスで発症が確認され問題化したこと
  • その後イギリス政府は大丈夫だと言い続けたが、1996.4に人間に感染したと認めざるを得なくなり、その後171人の感染が確認されたこと

を紹介する。

少し脱線して、日本でも献血規制が行われていることに触れる。
日本の規制は、各国の規制の中で一番厳しいものにあわせているだけだと指摘し、
日本でこの問題をちゃんと考える人が余りいないこと、血液検査の専門はいるのに、それをつかって社会でどういう規制をかけるべきかと考える専門家が少ないといった点を述べる。

次に、牛とヒトのBSE感染数のグラフを示す。

  • 牛とヒトとの間に発症期間9-10年にズレがあること
  • ここから潜伏期間を推定できること

を指摘する。そう推定することは合理的だが、最後の2009年に少し上昇していることを根拠に再度発症の波がくると主張する学者もいると述べ、どちらが正しいかを科学的に決めることは難しく、たぶん終わっただろうというのが合理的な見方だが、30-50年後にごめんなさいがないと限らないことなどを指摘する。だから科学が悪いというのではなく、われわれの有している自然を理解する能力がこのレベルなのだと考えるべきだと述べる。

サウスウッド委員会の話に戻る。

ここで具体的な発問

「どうやって専門家を集めるのか?もしイギリス農水省の課長補佐だったらどうするか?具体的にどこにあたってどういう人を集めるか?」

がなされる。

文系の学生の自信なさそうな返答のあと、

  • この病気がそれほどメジャーではないので、専門家が少ないこと
  • 考慮するべき科学的分野が極めて広いこと

を指摘した上で、具体的に考えることを指示。
学生からいくつか意見がでる。学会や大学に問い合わせるという意見が出るが、具体的にはどこかと聞かれて東大というような答えも出てくる。

それらを受けて、小林が、委員長のサウスウッドはオックスフォード大の人だった。日本だと東大になるんだろう。実際に農水省の担当者に聞くと、他にどんなやり方がありますかと聞かれたというエピソードを紹介する。専門家委員会が作られたとき、ベストな専門家が選ばれているとは限らないという問題点を指摘する。

次に、「結論の暫定性」という問題を取り上げる。

サウスウッド報告書にある文章
「In there, as in other circumstances, the risk of transmission of BSE to humans appears remote.」
「Although the risks appear remote.」
を紹介し、「appears remote=ほとんどありそうもない」は大丈夫だと言っているわけではない。科学者も自信をもって書けないのだと指摘。
その一方で、
「It is .... most unlikely that BSE will have any implication for human health. Nevertheless, if our assessments of these likelihoods are incorrect, the implications would be extremely serious. 」
と述べてていることも紹介する。
これは科学者としてどう感じるかと理系の学生に発問。

「可能性はきわめて低いと読める」という学生に対し、小林は、科学の立場から確定的なことはいえないという立場を正直に言っているともとれると指摘。私たちが間違っている可能性や大丈夫だと保証できないとも言っていると。
しかしこの報告書を誰が読み、どう使われるのかを考えてみるべきだという。学会の中ならいい。しかし読み手は規制をするかどうかを決めなければいけない役人。この報告書が、政府と食肉産業にとって、ヒトへの感染の可能性はまずないと優れた学識経験者が保障してくれているバイブルと引用されたのだと指摘する。

後にサウスウッドは、「警告が弱すぎた。しかしわれわれが騒ぎ立てれば、イギリスや他国の食肉産業全体を混乱させる危険があった」と述べていることを紹介。
「あの段階(1989年)において、もう少し強い規制をかけることを提言すべきだったかもしれないが、そのようなことすれば、欧州の畜産業界に打撃を与えることになると考えて、やめた」
BSEについては、科学は極めて不確実な状態にあり、科学者として不愉快なことではあったが、本当に確かな根拠から離れ、判断せざるを得ないことがしばしばであった。これは人が時としてせざるをえない、難しい判断であった。善良で賢明な人なら、違った結論に達することもあり得ると思う。実際には、われわれは全員一致で結論を出したが、いくつかの問題に関しては、少数意見を報告することもできたはずだと思う。あまりに多くの不確実さがそこにはあったのだから。」
という後年のインタビューを紹介する。
専門家が専門家の社会の中で通用する慎重な書き方をしても、政治・行政・社会の中に出されるとだいぶ違った受け取り方をされ、使われることを指摘する。

そこで、発問

「あなたの立場を科学者に限定したとしたら、答申はどんな表現になったでしょうか?」

が出される。

ここで学生の意見が出る*2
「人間に感染するかどうかはわからない。」
「今まで集めた知識の範囲では、まぁ問題ないだろう。」
学生B「役人さんに集められた以上、求められている答えになるようにデータを集める。」
小林「御用学者になる!?笑」
「文系の人にかき方や伝え方を相談する。」
「わからないという事実を経済学などのほかの分野の人に伝え、リスクをどう判断するか議論する。」
「たぶん大丈夫とは言ってはいけない。人間に感染する可能性は低いというべき。」
小林「事実に中立な表現にしたい?」
「はい」
「婉曲な表現や断定は避けて、事実に基づいて、あとで責められないように、可能性は低いという。」
学生A「わかりません、という。科学者として呼ばれているから。可能性が低いとか表現を変えるとかは科学者ではない。それは役人が判断してください。または国民ひとりひとりが牛肉を食べるかどうか判断してください。」
「科学的根拠にのっとって事実を淡々と述べる。あとは規制をどうかけるかは政治家が決める。」
「最初のサウスウッド委員会の段階で文系の人とかを入れるべきだった。わからないものを安全だといったのはまずかった。」
小林「実際に行政の担当者だったとしたとき、科学者が微妙と答えたらどうするか?」
「長期短期でみて、情報を開示するか隠すか、どちらにするかは国民の利益になるように考える。」
「気持ち的には少しでも危険があれば規制したいが、利益団体から圧力がかかるので、それをどう押さえて厳しい基準をつくるかを考える。」
小林「でも微妙って言われてるんだから、線引きは任意だよね。科学者は責任を政治や行政がとってくれといっている。」
小林「実際に食べる人の立場に立つとどうだろう?」
「報告書に書いてある事実さえわからない庶民はどうすれば?生活に一番近い場面で話をして欲しい。自分の立場からの目線を重視しすぎで、生活に一番近い目線というのが入っていないことに違和感がある。」
これを厳しい意見と評する小林。

ここで八木准教授が発言する。

「科学的にはここまでっていうのはわかるんだけど、この状況でここまでって科学者が言ってしまうってことは、何の対策もとらないということにつながる可能性が高いってのはわかるよね。だって危険だって言わないと対策はとらないわけだから。科学者が科学的にわからないっていうことは、このリスクを見過ごすっていうことに加担することに、科学者はなるんだけど、それについてはどう思うのかなっていうのが聞きたかった。」

学生A「そうなりますか?科学的にはならないと思う。」
と答える学生に、八木の反論。

「科学的にはならないの。社会常識的に科学者の側が、これは危険です、人間に移る可能性がありますと積極的に言わないってことは、世の中の流れ的に言うと、結局何の対策もとられないという可能性が高いと思いませんか?」

学生A「行政の側もわからないと国民に伝えれば選択権はあるんじゃないか」
と発言。それは「行政の役割の放棄じゃないか」との反論があり、学生B「みんなわかりません、みんな死にましたということもあるわけで。」
学生A「いや選択権はある」
「行政が基準をきめなくちゃいけないわけだけど、」
学生A「それがおかしい。行政はわからないという科学的事実を出せばいい。食べて病気になったら本人の自己責任。それで終わりでしょ?」
学生B「行政は何をするの?」
学生A「伝えること。」
学生B「それじゃ学者が言えばいいだけで行政はいらない。」
別の人の発言。
学生C「結論がわかっていることなら行政は規制をかければいい。役割はある。」
学生B「行政が扱う問題の中で答えがわかりきっていることってあるんですか?」
学生C「答えがわからない問題は、国民に判断を委ねるという立場。」
学生A「結局責任転嫁しあっているだけで、間違っていたら科学者のせいだっていいたいだけだ。」
家族がヤコブ病で亡くなった人が発言。
「責任転嫁ばかりしないで、どうすればベターな方向になるかを目指して欲しい」

ここまでの議論を受けて小林が最後に発言する。

  • わからないといったとき、強めの規制をかけるのは難しい。例えば畜産業界はよくわからないのになんで規制をかけるんだというだろう。しかし、よくわからないんだったら規制をかけて欲しいと食べる側は思う。そこで科学者の意見が欲しいというのが行政の側の考えだ。
  • サウスウッド委員会の評価は難しい。あなたたち責任を取れということになるか?ならないとすれば誰が責任を取るか?
  • 何か社会的に科学技術に関する問題が起きているとき、その問題に関するベストの専門家をどう選ぶか?ベストな専門家を常に選べるような制度をもっているか?それがないと出てくる結果は危ない。
  • 科学技術の専門家だけの委員会をつくって、これだけ大きな問題の結論をかいてくれといわれると研究者はつらいかもしれない。サウスウッドさんを批判してもしょうがない。
  • 科学的に不確実な問題が起きたとき、科学技術の専門家をどう使うかということが問題になっている。

これで講義は終了。

最後に研究室での小林のコメントが入る。

「やっぱり大学院生になってくると、自分のスタンスっていうのを考えているんですね。専門分野の中でトレーニングされることによって。おそらくそのものの見方というのはその専門分野に非常に強く影響されてきていますから。彼らは普通にしゃべっているつもりでも、聞いている側からするとやはり特定の専門性を背負っているような発言になってくるんですね。それは今日は非常に感じましたね。もし特定の研究科の大学院生だけでやったらあの種の議論は起こらないんですよ。もっと簡単に結論が一致してしまうとかそういうことは起こるんですが、今回ですと、やはりちょっと発散する傾向はありますけれど、そう簡単にそうだねっていうふうにならない、っていうのはああいうふうに研究科混成の特徴じゃないですかね。」

少し長くなったので、第1回の内容に対して私が問題と考える点は(その3)で述べることにしたいと思う。

*1:そうは言っても、学生Aと学生Bの発言にはかなり問題があると思う。共通しているのは議論が概念的で具体性に乏しいことだ。私の主観だが、学生Aにはあまり議論をするという気分はなさそうに見える。しかし、科学者への帰責に対する反発は強いのだと思われる。他方で学生Bは学生Aの意見に納得できないものはあるのだろうが、議論が「科学的にわかる/わからない」という二分法にかなり嵌まり込んでいるように見え、科学的にわかることなんてあまりないんじゃないかという相対主義とも懐疑主義ともつかない議論を展開しているように見える。このあたりは本来教員の側が丁フォローしなければならないと思うのだが、もともとの講義の構成の悪さがある上に、八木准教授の発言が火に油を注いだ形だ。私は学生の議論はかなり拙いと思うけれど、この講義の構成や教員側の発言を踏まえると、学生の議論の仕方に問題があると非難するのは少し学生には辛いかなとも思う。

*2:これらは私なりの要約なので発言者の意図とは違うかもしれない。言葉通りに書き起こしているわけではない。