创造「必要难度」来增强学习

Posted by Scott on February 12, 2023

2022 年这一年,我的软件设计能力有了很大的增长,但英文水平的提升却极其有限,这跟我时间精力投入肯定有关系,但更重要的是学习方法和策略很有问题。直到春节的时候读到这篇论文—-Making Things Hard on Yourself, But in a Good Way: Creating Desirable Difficulties to Enhance Learning 20111 ,读完后顿觉惊为天人,原来自己对学习和记忆,很多看法一直都是错的,同时也意识到这些反常识在中文网络鲜有人知(开智社群除外),于是春节花了不少时间针对必要难度(Desirable Difficulty)查阅资料,从而有了这篇学习笔记。

在进入正题之前,先介绍下两位「必要难度」理论的作者:

Robert A. Bjork 是加利福尼亚大学的心理学教授,在 2022 年已当选为美国国家科学院院士,他半个世纪都在研究人类学习与记忆。最主要的贡献就是定向遗忘范式(directed forgetting paradigm) 和必要难度理论,这启发了诸多研究学习和记忆的科学家,他的师友,同行和学生们为此还专门写了一本书纪念和回顾他的贡献。

Elizabeth Ligon Bjork是加州大学洛杉矶分校的心理学教授。她研究人类的记忆,并专注于抑制过程在创建一个适应性记忆系统中的作用。她的研究还探讨了如何应用学习原则来加强教学实践和自我指导学习,如利用必要难度来加强学习。


记忆会遗忘,犹如沙子中的脚印一般,随着时间的推移,越来越浅,直至消逝不见。这听起来似乎符合常识,但比约克可不这么看,在大量实证研究的基础上,他在 1992 年与 E.Bjork 提出了一种全新的失用(disuse)理论。

比约克在那篇论文2里,他首先回顾了记忆的三种特点:

人的记忆跟硬盘,内存等很不一样。硬盘这类工具,新内容直接存了便是,除了容量限制,并不会受到类别,已有内容等的影响;而人在记忆东西的时候,则需要跟过往的知识关联起来,好的方面来说,人的记忆似乎没有容量限制,而缺点也很明显,若无法关联过往知识,那你必然学的很慢。

另外,提取会修改记忆。我们通常通过线索来提取,之后会加强取得信息的记忆,同时也让同一线索下的其他竞争信息更难提取。

最后,记忆会倒退。对于同一类信息或技能,早期习得的与近期习得相比,随着时间的推移,若不再学习和应用,似乎早期习得的技能更占提取优势。比如说:你先学的左手驾驶,然后学了右手驾驶,然后几年之后(这几年都不开车),早期学的左手驾驶的技能会更容易提取。这种退步情形在各行各业都会发生。

存储强度与提取强度

正是人类的记忆如此不同,所以促使 Bjork 大胆的提出新的失用理论假设,这个假设中,对于记忆的强度,他首次区分了存储强度(storage strength)和提取强度(retrieval strength),简而言之,存储强度指的是一个东西你学的有多牢,而提取强度则是一个东西当下你有多容易提取。

  • 存储强度高,提取强度低。如:小时候语文老师让你背的古诗词和文言文,很多你已经记不清了,但你当时花了很大的功夫学习,所以只要给你一点线索,如提示你上句,你基本就能想起来下局,也很明白这句话/诗的含义。
  • 存储强度低,提取强度高。如:手机收到的取件码,在心中默念几遍,去快递箱的路程中,基本不需要再次看手机,但现在让你想想上一个取件码是什么,你肯定想不起来;住酒店的那几天的房间号,你并不需要反复拿门卡看也知道。
  • 存储强度高,提取强度高。如:你很熟悉的,且立马就能想起来的,如你母亲的名字,国家领导人的名字,比如对于程序员来说,编辑器的快键键—-我永远不会忘记用 hjkl 来移动(vim user)。
  • 存储强度低,提取强度低。如:你很不熟悉的陌生领域知识。

你并不需要完全记住这些分类,关键是你需要了解这两者是怎么相互作用的。

首先,提取强度很高时,对于存储强度的增长几乎没有贡献。当你在学习新知识,新事物时,最容易混淆的一点就是,误把「感觉你知道」当成「你真的知道」。「感觉你知道」这是一种典型的「易提取」,但很有可能只是对知识的浅显理解而已。

然后,学完新知识后,间隔一段时间,在提取强度低的时候做费力提取,如做练习题取代重新看书等,反而能让存储强度快速增长。

最后,存储强度很高时,可以极大的延缓提取强度的下降,刚刚我们提的古诗词的例子便能说明这点。

必要难度的应用

知道了存储强度和提取强度的区别,那么在我们生活中如何应用必要难度来增强学习效果呢?Bjork 在三个方向上给出了建议:间隔效应,测试效应和交错学习。

间隔效应

学习需要重复,这毋庸置疑,而且间隔学习比集中学习(反复阅读等)更有效。间隔效应(Spacing effect)最早是由赫尔曼·艾宾浩斯发现的,广为流传的艾宾浩斯复习计划表就是根据遗忘曲线制作的,但这毕竟是 19 世纪的发现,在 21 世纪,关于间隔,我其实最关心两个问题:一是间隔多久合适?二是有必要使用扩张间隔么?

间隔多久合适?

1979 年有一项关于间隔效应长期保持研究(Bahrick 1979),研究人员把参与者分为 3 组,分别使用 3 种不同的间隔学习方式,分别是间隔 0 天(一天内学完 6 个课程)、1 天(6 天内学会所有课程)或 30 天,在学习完课程的一个月后进行了最终测试,发现经历过30 天间隔的参与者的保持的最好。在后续的一项研究发现,那些用 30 天间隔学习的人在 8 年后优势仍然很明显。

Bahrick 的这个研究带出了一个重要问题:较长的间隔总是更好的么?Cepeda等人(2008)最近的 一项研究3揭示了关于最佳间隔的重要信息,他们发现最佳的间隔时间时间关键取决于测试延迟(最后一次学习到最终测试之间的时间,也叫知识保留时间[Retention interval]),更具体的说间隔的时间为测试延迟的 10-20% 的时候效果是最好的。

扩张间隔与同等间隔

间隔学习里面,有两种常见的间隔方式,扩张间隔法—-如学习完之后隔 1-5-9 天后测试,而同等间隔法则类似 5-5-5.

前者我们是比较熟知的,艾宾浩斯复习计划就是扩张间隔。你可能会本能的觉得扩张间隔的学习效果更好,因为越到后面忘的越多,但近期的一些研究4发现,扩张间隔带来的好处很有限,甚至同等间隔法能带来更好的长期保持5,起决定性作用的反而是测试之后的反馈(该研究有对比有反馈和无反馈的效果)。

测试效应

提到测试(Testing),谁都头疼,在我们的传统观念里,我们经常把测试等同于考试,而很多人误把一时的考试成绩当成最终的学习成果或智力评定等;另外,相对于反复看书的那种懂了的满足感,不看答案的回忆可太痛苦了。但是,这种痛苦是有回报的,在你费力提取记忆的过程中,大脑活化了相关的突触联结,也让不相关的联结沉浸的更深,换句话说就是增加了存储强度。

测试效应(Testing effect )经常与生成效应(Generating effect)一起出现,在一些研究6中甚至被当做同一基本效应的两个术语,因为测试需要生成,毕竟记忆就是生成或者建构的(建构主义的观点);而生成往往涉及对记忆的测试,生成材料的过程本来就是一种测试。

所以说在学习一个知识点后,用自己的话来复述是一种生成,就是一种测试;闭卷做题是我们再熟悉不过的测试,甚至当晚上回顾下白天看的材料都是一种测试。更重要的是,别只把测试当成一种评估,更应该看做一种学习机会。

在 Bjork 的早期研究中,强调在测试中应该减少反馈,这似乎很符合必要难度的定义,但学习若是没有反馈,那会让人很没有动力,也不清楚下一步的目标是什么,所以我对于这点是存疑的。后面发现目前有大量的研究支持反馈的好处(p263 of successful remembering),也有研究研究提到在运动学习中,如果延迟反馈可能更有效 ,不过这点目前还有争议,因为这种延迟反馈的好处也可能是由间隔效应造成的。另外,也有研究提到如果反馈对当前任务的完成造成了干扰(抢占了工作记忆),那么这种反馈反而不利于学习(Schooler and Anderson 1990)。

那么反馈在什么情况下极其有用

  • 鼓励犯错的环境下。犯错对于学习效果是几乎没有影响的(Kornell, N., & Metcalfe, J. 2014)。
  • 任务艰巨,缺乏领域知识的时候。这个时候若没有反馈,那就很难明确下一步的目标是什么?也不清楚努力和结果的关联。
  • 快要学会的技能,这一点是 proximal learning model 里提到的,当快要学会一项技能的时候,很容易发生元认知错配(metacognitive mismatch items,有些题你觉得肯定对了,但实际是错的,有些题你可能觉得做错了,但实际上是对的),这个时候只需要简单的纠正反馈,对于学习就有巨大的帮助。

    交错学习

交错学习(Interleaving Learning), 有的时候也被叫成混合练习(mixed practice)或变换学习(varied practice)。集中精力做一件事情做好,再做下一件,这似乎是个常识。但现在很多研究发现交错多种 pattern 比一个个顺序学习效果更好。比如下面这个例子:

體育課中,一組八歲孩童練習把豆袋投進桶裡,其中半數孩童投擲 的桶子距離三英尺遠,而另一半混和練習投擲兩英尺遠和四英尺遠的桶 子。經過十二週的練習之後,所有人都參加三英尺距離的擲桶測試。成績最棒的是那些練習了兩英尺和四英尺、但從未做過三英尺距離擲桶
練習的孩子。

还有一个关于辨识画家作品特性的研究,他们把学生分为两组,一组集中学习一个画家的作品,再学习下一个,而另外一组则是交错学习多个画家的作品。研究结果显示后者在匹配画作与画家的考试中成绩更好,哪怕画作他从未见过。

这两个例子似乎很不符合我们的预期,但是研究证明的确可以可以增强记忆的长期保留和迁移。

一种理论认为,交错必须解决所研究的不同事物之间的干扰,迫使学习者注意到它们之间的相似性和差异性,从而导致高阶表征的编码,进而促进保留和迁移。另一种解释是,交错迫使学习者重新加载记忆。例如,如果要求先做 A,再做 B,再做 C,然后再做A,那么关于如何做 A的记忆必须第二次重载,而先做 A 然后再做A则不需要同样的重载。

这对我们的学习很有启发,比如在英语单词的时候,我们完全可以生活,工作等多个主题的单词混在一起学习,而不是学完一个主题再继续下一个,在做算法题的时候,应该交错多种题型一起刷,而不应该只刷一种。

认知偏差

如 Bjork 的同行所言,他提出的理论仿佛充满悖论,但他总能以优雅的方式论证给你看。最初接触「必要难度」的时候我也觉得困惑,既然它那么重要,为什么却一直不受重视呢?直到在 Grasp7 这本书里看到心理学家提到人类的几个主要偏见才明白这个道理:

  • 马后炮偏见(hindsight bias):也叫事后诸葛偏见,当知识摆在你面前的时候,你以为你一直拥有这个知识——考试中经常发生的问题,因为你知道的知识都在教科书里,而不在你的记忆里。
  • 预知性偏见(foresight bias):当一个知识在有提示线索的时候很容易提取,你会以为没有线索也能容易提取。
  • 稳定性偏见(stablility bias):当一个知识当前不容易或容易提取的时候,你以为会一直这样,实际上并不一定。上课的时候你能提取,并不意味着下课也能提取。同样的,当前不理解或记不得一个知识点,并不意味着一直学不会。
  • 当一个知识很容易提取的时候,你以为它是正确的,实际上它很有可能是一个根深蒂固的错误知识。
  • 容易学的东西不见得容易提取。如:写的大的字不一定不小的字更容易记住。

小结

所以虽说自「必要难度」的第一篇论文发表后,距今已 31 年,但无论在课堂,还是自我学习亦或是学习工具,你似乎都很难看到三者结合很好的例子,我想认知偏差是教师和学生因此而忽略它的主要原因,这的确遗憾。不过也并非完全没有,类似 Brainscape这类闪卡工具近些年越来越多了,虽然在灵活性上还是有带提升,编程语言学习网站——executeprogram.com 也是极佳的例子,与传统的视频或文档教学不一样,它采用的就是典型的测试教学,而且一天学完有限的知识点后,隔天(或一段时间后)也会收到混合测试的通知邮件。

必要难度带给我最大的启发就是测试(提取练习)比想象的有效也重要的多,一定要想尽办法把测试注入到各种学习中,另外则是「你以为你知道」和「你真的知道」是两码事,永远不要过度自信。希望读完这篇文章对你也有所启发。

  1. Making things hard on yourself, but in a good way: Creating desirable difficulties to enhance learning https://www.researchgate.net/publication/284097727_Making_things_hard_on_yourself_but_in_a_good_way_Creating_desirable_difficulties_to_enhance_learning 

  2. A new theory of disuse and an old theory of stimulus fluctuation https://www.researchgate.net/publication/281322665_A_new_theory_of_disuse_and_an_old_theory_of_stimulus_fluctuation 

  3. Cepeda NJ, Vul E, Rohrer D, Wixted JT, Pashler H. Spacing Effects in Learning a Temporal Ridgeline of Optimal Retention.; 2008. http://laplab.ucsd.edu/articles/Cepeda%20et%20al%202008_psychsci.pdf 

  4. Nakata T. Effects of expanding and equal spacing on second language vocabulary learning: Does gradually increasing… ResearchGate. Published December 2015. Accessed February 11, 2023. https://www.researchgate.net/publication/277612362_Effects_of_expanding_and_equal_spacing_on_second_language_vocabulary_learning_Does_gradually_increasing_spacing_increase_vocabulary_learning 

  5. Expanding retrieval practice promotes short-term retention, but equally spaced retrieval enhances long-term retention. https://psycnet.apa.org/doiLanding?doi=10.1037%2F0278-7393.33.4.704 

  6. Dewinstanley PA. A generation effect can be found during naturalistic learning. Psychonomic Bulletin & Review. 1995;2(4):538-541. doi:https://doi.org/10.3758/bf03210990 

  7. Grasp: The Science Transforming How We Learn: 9780385541824: Sarma, Sanjay, Yoquinto, Luke https://www.amazon.com/Grasp-Science-Transforming-How-Learn/dp/0385541821