维克托·迈尔被誉为“大数据时代的预言家”。现任牛津大学网络学院互联网研究所治理与监管专业教授。主要研究领 域为数据科学、信息安全、信息政策与战略。曾任哈佛大学肯尼迪政府管理学院信息监管科研项目负责人、哈佛国家电子商务研究中心网络监管项目负责人、新加坡 国立大学信息政策研究中心主任。曾参与欧盟互联网官方政策制定。先后担任过微软、惠普、IBM 等全球知名企业和机构的信息政策顾问。所著《大数据时代》、《删除》,皆被认为是最早洞见大数据时代趋势的开创性作品。
(下文根据演讲现场速记整理,有删节)
很多人都知道,我是一名数据科学研究者。那么,为什么我今天要来到这里,给大家讲有关学习和教育的问题呢?因为我认为,学习的未来、教育的未来都是 和我现在所做的工作相关的。也就是说,当我和那些正在学习的人以及研究教育的人坐在一起,可以一起思考如何通过大数据来改变我们的学习方式。这样,我们或 许就可以改进我们的教学,可以让教育变得更好。
这里所说的教育,不只是对那些优秀的人而言,而是对所有的人。我有一个观点,也是我的理想,那就是,所有人都应该获得配得上他的潜力的学习机会,学习怎样获得知识和洞见。我目前想做的,正是如何尽可能地帮助每个人学得更好。而在我看来,利用大数据,我们是可以在这个问题上获得新进展的。这就是我今天要讲的基本观点。
两种完全不同的教学方式
人们都赞美Mooc,认为它可以让全世界获得学习的机会。但是,Mooc的意义不仅仅在于此。还在于,通过它,可以获得大量关于人们如何学习的数 据:人们怎样获得知识?怎样获得洞见?而通过理解并且进一步考察这些数据,我们可以更好地理解人类的学习行为,进而提高人们的学习效率和学习质量。
几年前,我曾访问过不丹。那是在中国和印度之间的喜马拉雅山脉东段南坡上一个非常美丽的国家。近年来,不丹在世界上因“幸福指数最高”而闻名。不丹在商业上有很不错的发展。其中,当地高超的唐卡描画技艺给很多前往不丹的人留下非常深刻的印象。
在不丹时,我访问了一所学校。这所学校正是教授关于唐卡的绘画技艺的。参观时,不仅是非常漂亮精致的唐卡图像给我留下深刻印象,学生们非常专注地描 绘唐卡的状态更是令我目瞪口呆。最令我感到震撼的是,他们竟然可以做到与他们的老师所做的一模一样。而他们的老师又和他们上一代的老师、画家做得一模一 样。也就是说,几千年过去了,他们描画的唐卡是完全一样的。
那么,教育对他们来讲,就是学习如何模仿过去,说得更具体一点,就是如何完全地模仿过去。从中延伸出的一个观点就是,最好的学生就是不偏离的学生;和过往的优秀画家所做的一模一样的,才是最好的学生。我看到这些作品时真是非常惊叹。我对由他们的作品和创作、传承的整个过程所折射出的巨大的精确感, 感到非常吃惊。他们所强调的,只是模仿,而不是你自己的思想,不是创造,不是原创,不是创新。
而在差不多的时间,我又遇到了另一个人。他叫吴恩达,现在是斯坦福大学的教授、一个计算机科学家。他在智能机器研究领域颇有成就。吴恩达和另一个合 作伙伴达芙妮·科勒一起开创了一家公司。这家公司表面上和人工智能没有什么关系,但由这家公司开发出的在线学习平台“Coursera”已经成为当下最具 代表性的在线学习平台之一,提供免费的网络公开课程。
这家公司的缘起就是由吴恩达讲授的“机器学习”课程被以免费的方式放到了网上。最后意外地发现,报名人数竟超过了10万人。而通常,吴教授平均每年 的听课人数是400人,必须连上250年课才能接触到10万名学生。换言之,通过这个在线教育平台,这门课程可以抵达的学生比吴恩达以往一生可能教到的学 生都多。而如今,他通过一个在线课程就教完了。正是因为这个经历,使得达芙妮·科勒和吴恩达后来一起合作,创建了Coursera(意为“课程的时代”) 这个在线学习平台。这个平台的理念是,它可以提供在线教育材料给全世界的人。
当然,现如今,经过数年的发展,随着在线教育得到越来越多人的关注,在线的课程越来越多,Coursera已经只是其中的冰山一角了。这一波在线课 程及其背后的在线学习体系被称为“大规模开放式在线课程”,即Mooc(massive open online courses)。人们都赞美它,认为它可以让全世界获得学习的机会。
但是,我想这种关于Mooc的观念是完全错误的。Mooc的意义不仅仅在于让全世界的人获得更多的学习机会,还在于,通过它,可以获得大量关于人们 如何学习的数据:人们怎样获得知识?怎样获得洞见?而通过理解并且进一步考察这些数据,我们可以更好地理解人类的学习行为,进而提高人们的学习效率和学习 质量。
在线教育最根本的未来在于它将改变我们如何学习。这关乎学习和教育的未来。正是基于这一点,我认为,正进入教育的方方面面的大数据,将对全世界的学习与教育活动产生极为深远的影响。
大数据如何重塑学习
大数据可以收集足够多的信息,且覆盖面广泛。我们在制作和利用大数据时,需要用个性化的方法把它们组织起来,将其运用于教育领域,进而帮助我们以前 所未有的视角判断什么可行、什么不可行;展示那些以前不可能观察到的学习层面,实现学生学业表现的提升;基于学生的需求而非统一的课程标准来定制个性化课 堂,促进理解并提高成绩。
现在让我们想几秒钟,人们到底是怎么学习的?
200多年以来,学习一直是学校体系的一部分。但其实在此之前,还没有现代意义上的学校或者大学,教育基本上是以个人形态存在的。一些富人家的孩子 会获得一个一对一的导师,但这样的教育只有少数人才可以享有。现在教育是由普通大众来获得,这无论如何都是一个好事,是前进的一大步。但是,目前的这种情 况还是不够的。
为什么这么说呢?因为,作为学生,其实我们每一个人都有自己独特的个性、需求和学习上的倾向。但是,目前我们这个教育系统还没有办法支持这个个性。 如何才可以改变、完善这个系统?就是要通过对数据的收集和利用。如今一些技术上的进展已经为有关数据的大规模收集和利用创造了条件。在我看来,大数据正是可以从这个意义上重塑学习的三个主要特征,即反馈、个性化和概率预测。
说到这里,我想举多邻国(Duolingo)的例子。它的主体是一个语言学习网站,同时提供网页版和手机应用版。多邻国也是由一位计算机科学系的教 授创建的,他叫路易斯·冯·安。多邻国是免费的。通过下载它提供的应用程序,你就可以在手机上学习国外的语言,非常有意思,使用起来也非常轻松。现在已经 有成千上万的人用这个应用程序来学习语言。
多邻国的贡献在于,它是一套数据导向式的教学方式。无论用户是花几分钟还是几个小时在手机上用这个应用程序学习,他们都可以通过后台程序来跟踪收集 大家学习语言的数据。通过学生在应用程序上回答一个个问题,系统和多邻国的团队会分析用户一般会纠结于哪些问题,会犯哪些错误。通过分析使用者的互动数 据,分析他们的学习方式,从而再反过来,用这些积累下来的数据去改进整个应用程序。路易斯·冯·安曾说,其实他们对于到底如何学习外语所知不多,但是他们 可以通过对数据的分析来了解学生更容易犯什么样的错误,从而帮助他们更好地学习。比如,他们发现母语为西班牙语的人在学习英语时,有些词其实应该晚一点再 学。这样他们在学英语的过程中就会更少碰到障碍,从而更易获得进步。
而在此之前,我们传统的教学是怎样获得反馈的呢?就是通过考试。考试之后你通常会获得一个分数,这就是你可以通 过一场考试得到的全部反馈了。但事实上,这个分数可以帮到你的不是很多,它并不能帮助你更好地改善你的学习。它既没有办法很好地分析你的学习过程,也不告 诉你究竟该如何来改善你的学习。而事实上,问题很可能并不在于你本身的努力程度,而在于你的学习方式不对、你用的教科书不对、或者你遇到的教学方式可能根 本不适合你。随着教育的发展,越来越多教育者开始注意到收集反馈的重要性,但凭借既有的方式,他们收集到的正确数据非常有限,或者在量上远远未能达到可以 改进教学的规模。
多邻国的例子可以启发我们:当通过大数据,收集信息和反馈具备了更好的基础、更多的可能性,我们不仅更容易收集到数据了,还可能收集到更多可以帮助我们改善学习方法的数据。如 果我们可以更多关注学习的过程,而不仅仅是像以往那样更多关注学习的成绩,我们的学习和教育现状一定会有所改变。它会找到更好的收集反馈的方式,还能使我 们的教学更适合于每一个个人。当一个学生对他的学习内容并不十分理解时,他可以用一种新的方法学习。他可以慢慢学,不必用同别人一样的方法来学习。
大数据在这个问题上的优势在于:它可以收集足够多的信息,且覆盖面广泛。我们在制作和利用大数据时,需要用个性化的方法把它们组织起来,将其运用于 教育领域,进而帮助我们以前所未有的视角判断什么可行、什么不可行;展示那些以前不可能观察到的学习层面,实现学生学业表现的提升; 基于学生的需求而非 统一的课程标准来定制个性化课堂,促进理解并提高成绩。当然,在这个指导思想下设计出来的课程单,除了根据学生的需求,也会考虑到他们的潜能。类似这样的 教学项目在现实中已经有所实践。既然我们可以截取、混合最爱的音乐并将之刻录到iPod播放器中,那么,为什么不能对我们的学习做出同样的操作呢?所以, 对于改善人类的教育而言,“个性化”是仅次于“反馈”的第二大要点。
大数据可以重塑学习的第三大要点在于“概率预测”。所谓概率预测,就是通过大数据,我们能够对人们的整体学习状况和个体的知识掌握情况产生独到的见解。然后,基于某种高度的可能性,对个体为提高其学业成绩需要实施的行为作出预测。比如,选择最有效的教材、教学风格和反馈机制。
在由孟加拉裔美国人萨尔曼·可汗创立的可汗学院中就曾遇到这样一个例子。后台数据显示,有一个七年级的女孩一直搞不定数学,然后她就反反复复地学这 几门课。但突然有一天,她学习了别的课,竟然就开窍了。她对所学内容的反应越来越快,在夏季结束时她成了最好的学生之一。可汗学院研究了一下她这个案例, 发现正是因为她在中途突然改变了学习的内容和方法,才带来了转变。
这个例子正揭示了“概率预测”的可用武之地。有时候,我们的学习之所以没有进展,正是因为课堂的配置出了问题。由此,可汗学院提出了“翻转课堂”的 理念。“翻转课堂”提倡的是,你先在课外阅读材料或者观看视频,这些内容通常由世界上最好的老师来讲授。然后,你再带着满脑子的问题去上课,和你所在学校 的老师进行探讨。通过这个方式,你可以找到最合适你的教材和更有针对性的、适合你的教学风格。而面对面的讨论,无疑是更好的反馈机制得以产生的基础。
未来的学习会怎样
现在的学校是一个学生接受信息的空间,但是在未来,学生们将在家里通过观看网上视频等形式接受信息,然后到学校去和老师、同学就自己学习的内容进行 讨论。学校将变成一个社会性的场所,是一个互相讨论、互相学习的所在。而与此相适应的是,老师在整个学习过程中的功能会发生改变。
有人肯定会说,这下问题来了:未来还需要像我们这样的学校吗?学校会成为私立的公司吗?谁会赢?这些问题没有标准答案。但我认为,能够从未来的学习竞争中获得胜利的,一定是那些能够驾驭大数据并且通过这种驾驭能力改善我们每一个人的学习的人。
就我个人的观点,未来的学校不会完全转移到线上,仍旧会有物理性的存在,但是,学校的功能将发生重大改变。现在的学校是一个学生接受信息的空间,但是在未来,学生们将在家里通过观看网上视频等形式接收信息,然后到学校去和老师、同学就自己学习的内容进行讨论。学校将变成一个社会性的场所,是一个互相讨论、互相学习的所在。而与此相适应的是,老师在整个学习过程中的功能会发生改变。以前照本宣科的传授、宣讲知识的技能,要让位于组织学生讨论的技能、让位于从数据中获取学生学习信息的技能、让位于根据数据对学生进行个别引导的技能。
在此过程中,大数据可以是老师的好帮手。以前,老师不知道哪些部分的内容是学生面临困难的、哪些学习材料是学生感兴趣的、接下来的教授重点有多少种 教案以外的新可能,大数据可以帮助他们提供这些信息,从而更深入地了解学生的学习兴趣和学习风格。这个过程一定会遇到一些困难,但如果老师们掌握了这些技 能,学校将比现在变得更美好。
随着数据处理技术获得极大的发展,老师会被替代掉吗?我的回答是:不会!有两个理由。一是数据可以筛选、排序、组合内容,但无法生成内容。即使是“翻转课堂”,视频中教授知识的也仍是老师。第二个原因,学习是一个社会性的过程,面对面的人际沟通与面对书本的学习是可以互补的,却不能相互替代。两者一起配合好,教学才能变得更好。
当然,大数据一方面有很多好处,但是如果这些数据被滥用到不恰当的地方上,也意味着巨大的风险和挑战。具体到教育领域来说,与大数据同行,会带来两大方面的风险。我把它们概括为“永久的过去”和“决定了的未来”。
所谓“永久的过去”,是指我们作为个人会不断地成长、发展、变化,而那些多年来收集的全面的教育数据却始终保持不变。想象一下,假使某个学生的活动 记录被存储下来,并在25年后他找工作的时候被提供给未来的雇主,这将会是怎样的情形?因此,全面教育数据带来的首个重大威胁,并不是信息的发布不当,而 是束缚我们的过去,否定我们进步、成长和改变的能力。目前能够抵御这一威胁的可靠措施大概只有法律。我认为,应该对大数据的使用立法,明确规定哪些数据可 以收集和使用,哪些数据不能收集和使用;哪些数据可以在哪些领域中加以使用,等等。
所谓“决定了的未来”是指,将以所有人为对象收集到的全面教育数据,用于对未来进行预测。比如,系统预测某个学生不太可能在一个学科领域(如生物信 息学)取得良好成绩,于是引导他转入护理之类的其他专业,我们应该如何看待这一决策?又如,大学可以很容易利用大数据选拔出学习能力最强的学生。但是,毕 竟教育最聪明的10个学生是相对容易的,而提高普通学生的成绩却难得多,也有意义得多。也就是说,大数据可能会导致部分学生成为量化评估的受害者而非受益 者,存在导致老师、学校只愿意接收天资聪颖的学生的可能,加剧教育的不平等。
而在我看来,大数据运用于教育的价值,正在于教育工作者能够借此帮助参差不齐的学生挖掘自己的潜能,而非淘汰那些被定义为“不聪明”的学生。大数据蕴含的巨大潜力应当被用于推进个性化学习、改善教材和教学、最终提高学生的成绩。它应该被用于促进教育改良的反馈,而不是作为对产品使用者进行简单评价的依据。
我们已经开始了一个新的大时代。如果做好了,那这个成果将是意义重大的,教育的性质将从根本上发生改变。很希望在座的学生有能力真正促成这样的改革。也希望我们能够通过对大数据的利用,用一个更好的教学方式,让所有人都能够得到一个更好的学习体验。谢谢大家!