这是「蓓说」第 6篇文章

BEITALK NO.6

日本京都大学本庶佑教授获诺贝尔奖的消息,又一次激起了大家对于基础科学研究的重视和日本教育优势的关注。进入21世纪以来,日本科学家们已经在18年间获18个诺奖,让当年听来如同狂言的“21世纪前50年获得30个诺贝尔奖”几无悬念。

每一次日本学者获诺奖的新闻,都会在中国得到很多人的关注,这种关注不仅仅是因为复杂的民族感情,经历过日本高中和大学本科学习的我,可以很负责任地告诉大家,无论从教育形式和升学体系本身来说,中国和日本有东亚教育的类似性——以被动型授课的形式为主,与欧美的倡导讨论和自我开发主题的主动型学习(active learning)形成对比,大学升学考试也是以学术考试分数为唯一判定条件。正因为这种相似度,我们才会格外关注东亚邻国们的教育水平和教育方式。

                                              (图说:日本学生参加高考)

诺奖的获得者是坐在人才金字塔的最最顶尖上的那十几个人。按照我在东京大学的恩师,日本产品和生产管理研究的第一人藤本隆宏教授的话来说,在这个金字塔研究领域的比拼中,中国的获奖只是时间问题,假以时日,只要在国际上发表的论文和研究累积到一定的量,中国的科学家们也完全能够拿到诺奖。

当然,作为一名教育工作者,我更关心的是在人工智能技术对社会的冲击下,日本的普通学历教育所面临的危机,因为,同样的危机也必当影响到中国教育。

1

机器人能否通过严酷的升学考试考进东大?

去年的围棋峰会中,天才少年棋手柯洁完败于谷歌开发的人工智能“阿尔法狗”,让大家看到了人工智能的可怕和完美之处。而年纪稍大一点的家长应该能记起1997年的国际象棋人机大战,当时的世界棋王卡斯帕罗夫在比赛中输给了IBM公司研制的机器“深蓝”。

“人们意识到机器智能的崛起,大多是在 20 年前的这一个时刻,当这个男人和 IBM 的计算机’深蓝’进行了一场历史性的国际象棋对决。当时和那之后发生的事情,给了我们一个去看待人工智能的线索。”在2017年的TED大会上,创始人克里斯·安德森向与会者这样介绍卡斯帕罗夫。来自日本国立信息学研究所的新井纪子教授也参加了这一届TED大会,她在会上分享的人工智能项目更是一鸣惊人。

新井纪子从一桥大学法学部和伊利诺伊大学数学系毕业,是东京工业大学的理学博士,现任日本国立信息学研究所教授,社会共有知研究中心负责人。她在 2011 年发起了“东大机器人计划”(Todai Robot Project),自 2013 年以来,团队每年都让机器人在真实的考场接受演练。

简单来说,新井教授的研究课题就是:机器人能否通过严酷的升学考试考进东大?

众所周知,东京大学是日本排名第一的大学,也曾是亚洲排名第一的大学。在日本,如果你说自己是东大的学生,周围都会投来惊愕和敬仰的目光。而一年只招收90名学生的东大医学部,更是犹如神一样的存在。

东大之所以令人却步,是因为它跟其他知名的国立大学一样,除了全国统考的中央考试(center exam)之外,还必须通过一个称为“前期考试”的二次考试,由东大教授自己出题和阅卷。相比其他项目的题量,东大教授可谓真正实现了化繁为简:东大物理考试仅三题,化学考试仅三题,数学考试仅六题,考试时间均为120分钟。一般来说,如果数学考试能完答六道题目中的三道,基本过关,如果能完答5道题,就能进入神一般的东大医学院。体验下下面天书一般的东大数学题目吧。

新井教授的人工智能项目历时6年,前前后后有100多名工程学、教育学、语言学的教授,及企业和大学的研究者加入。研究成果当然也是喜人的,在日本大学招生的统一考试中,“东大机器人”的排名已经在前 20%, 相当于横扫80%的考生,达到了超过 60% 的大学的入学标准。尽管人工智能无法在其他科目达到东大的录取标准线,但在东大数学模拟考试中达成了完答4题的水平!

2

人工智能的考试“秘诀”

“东大机器人”的考试技能依靠于 AI 的检索和优化能力,通过工程师设定的推理逻辑,利用自然语言处理将题目转换为可计算的公式,用搜索引擎来做选择题,所以在这些题型上都能表现优秀,尽管它根本无法真正理解题目的意思。

比方说有一个问题:莫扎特的最后一部也是最有力的交响乐跟一个行星名字相同,请问这个名字是什么?

人类找寻答案的思维步骤是:

1. 通过莫扎特,最后,交响乐,三个关键词,在wiki中搜索到第41章交响乐相关的页面。

2. 这时候看到文字表述中有写本作品有Jupiter(木星)的昵称。通过常识的判断,我们得到了最终答案。

人工智能技术寻找答案的方式则是:

1. 通过莫扎特,最后,交响乐,三个关键词,在wiki中搜索到第41章交响乐相关的页面。但光找到页面,人工智能技术无法读懂文章内容。

2. 下一步,在这些页面中寻找跟这三个关键词同时出现频率较多的文字段落。同时进行关键词“行星”的搜索,跟搜索得到的文字段落做语句匹配。

3. 最终匹配成功,得到答案。

人工智能写出的作文则是复制组合书摘和维基百科的过程,也就是说,它只会收集信息,根据事实做出分析,并不能像人类一样概括总结、举一反三。可是,为什么局限性如此大的“东大机器人”的考试表现居然会好于大多数高中生呢?

3

PK人类,人工智能还有什么不会?

今年2月,新井教授出版了一本震惊全日本家庭和教育界,畅销20万册的新书,书名叫作《AI vs 读不懂教科书的孩子们》。在这本书中,她指出未来10-20年左右,社会中将有近一半的工作被人工智能技术所替代。

牛津大学关于人工智能的研究团队(论文The Future of Employment: How Susceptible are Jobs to Computerisation?)预测了702种职业种类中将有47%的职种面临消失的危机。排名前20的职种中,属于现在我们认知的白领阶层的种类包括:

1. 房地产审核和调查

2. 使用电脑进行数据收集和分析的工作

3. 税务申报代理人

4. 银行柜员及证券公司普通职员

5. 各类贷款负责人

6. 保险业(车险鉴定,保险赔付)

很明显可以看出,这些易被淘汰的职业都与数据分析关系匪浅,人工智能技术目前还无法替代人类职业中要求交流,理解和创意的职业。新井教授和她的团队通过六年的研究项目获得了新的认知,人类对文字的阅读理解能力的纬度有以下六种:

1. 主谓宾顺序的理解

2. 代词的文中理解

3. 同义文理解(两段文字是否表达同一个意思)

4. 基于常识的推论

5. 图文对应的理解(图形和文字是否表达一致)

6. 定义与实例的对应理解

新井教授的研究表明,语言读解力中的前两者是人工智能技术可以达到的,事实上,机器人备战日本中央统考的国语考试中,在这两项的水平也的确超越了70%的日本学生,但人工智能技术受其局限性的影响,无法在后四项中达到很高的水平。

那么,“东大机器人”的成功只能说明一点,这些参加考试的人类学生也只会死记硬背,和人工智能一样不会理解,阅读能力极为薄弱。

我来举两个看起来很可笑的例子:

栗子一(测试第1项主谓宾顺序理解)

Alex是男生和女生都可以使用的名字,是女生名字Alexandra的昵称,也是男生Alexander的昵称。

请问,Alexandra是什么的昵称?

1. Alex; 2. Alexander; 3.男性;4. 女性

正确答案是1,这是个很简单的问题吧,但是,日本中学生的正确率仅为38%,高中生仅为65%。

栗子二(测试第5项图文对应的理解)

美国棒球职业选手中28%是出生在美国以外的选手,他们的国家分布中,多米尼克共和国最多,占据35%的比例。下图中哪个选择正确?

正确答案是2。可中学生整体的正确率仅为12%,高中生仅为28%,令人震惊。

新井教授的测试结果显示,六种基础阅读能力的衡量纬度中,前两项人工智能技术也擅长的能力,日本中学高中生只能说是等同于人工智能的水平,而后四项人工智能还不擅长需要人类发挥优势的能力上,学生们的水平就跟掷骰子瞎蒙出来的正确率一般。

这是否是我们填鸭式被动学习的结果?学生们为了考试而死记硬背公式与单词,但是甚至无法真正理解教科书中的文字内容?所以,根本没有阅读或者理解能力的机器人只依靠算法和搜索引擎,就超越了成千上万的高中生,这就是新井教授提出的现代教育的危机。

“东大机器人”的存在不仅让日本引以为傲的普通学历教育蒙上一层阴影,也给同属于东亚教育体系的我们敲响了警钟——

人工智能技术不可替代的人才必须拥有阅读理解能力(人工智能无法真正理解意义),不被限制禁锢(人工智能有其局限性)和能够自己思考创造价值的能力。我们这个时代对于年轻一代在这些能力和思维上的考验提升到了前所未有的高度。而新井教授正向所有人警示:我们准备好了吗?