自适应学习产品的技术、商业分析
发布时间:2017-03-03 , 发布人:华恒智信分析员
去年 Alpha Go 在人机世纪大战获胜之后,人工智能在各个行业掀起了新高潮,包括教育领域。
人工智能发展范畴涵盖了所有尝试以电脑去模仿人脑处理信息的能力,例如:类神经网络 (Neural Network)、知识图谱 (Knowledge Graph)、以及自然语言处理技术 (Natural Language Processing, NLP) 等。模仿人类思考的强人工智能到目前为止,不算完全成功;倒是其中机器学习 (Machine Learning) 这项技术,因为近几年大数据 (Big Data) 的爆发成为它的"养分" -- 机器学习能获得充分的训练资料 (Training Data) ,加上电脑运算效能的长足进步做支撑而异军突起,尤其其中的深度学习 (Deep Learning) 更是在近期带来一些突破,例如 AlphaGo 战胜世界围棋冠军、无人驾驶汽车上路了。
机器学习大量使用统计的方法、进而建模与推论,建立预测能力,它的许多应用已经存在于我们生活中,例如: 人脸与图片辨识、手写输入辨识、自动过滤垃圾邮件、自动侦测信用卡盗刷。教育培训是否能借机器学习技术来提升成效?在教育与商业经营上各有何挑战呢?虽然机器学习在商业界是目前创投热钱追逐的标的之一,但应用在学习领域的产品与市场的契合点 (Product - Market Fit) 何在?
何谓自适应学习系统?
如果将这个领域中的产品做分类,自适应学习系统 (Adaptive Learning System, ALS, 或者Intelligent Tutoring System, ITS) 是最广泛的应用,所以我们此文先分析这一块。ITS 产品目前商业产值不高,但近两年明显有比较多资金投入,也看到更多内容业者加入了自适应技术与推荐技术,重新为内容加值,逐渐形成趋势。
许多读者只听过 Knewton,因为它是获得大量热钱支持的新公司,近几年在营销上投入大量资金; 其实美国的政府研究经费支持了更多这类发展,像美国某老牌的教科书公司 McGraw Hill ,二十几年前就开始研究开发这种技术;卡内基美隆大学于十几年前开始投入,并开放授权部分技术,或技转授权,现在已经开枝散叶,长出许多商业产品。
ITS 的核心是系统会随时收集学习者的行为与评测结果,自动动态地调整下一步,提供给学习者最适当的内容、反馈、提示、练习或测验题目,以提升学习成效、动机,节省时间,并保持学习者在最佳的挑战范围内 -- 也就是最近发展区 (Zone of Proximal Development, ZPD),对其理论有兴趣的可以参考此文介绍 。
>>自适应系统的三种不同形态
ITS 技术上分成三大类,实际产品也可能同时采用两种以上技术结合:
Adaptive Sequence: 这种系统的提供者都是工具平台类产品,通常与内容出版商合作,或者让教师、内容生产者自行建设和上传内容,系统会根据学习者的知识水平与对各知识点的精熟度不同而调整学习路径。
Adaptive Content: 设计互动内容,提供即时反馈或提示,需要将传统内容重新改制成颗粒度较小的设计,以提供阶段性支持与评测,可将测评题目嵌入学习内容中,以点测学习理解, 内容改制成本高,效果较佳,分析能比较入微 。颗粒化内容应对应现行的课程大纲和标准。单纯的这种产品其学习路径是不变的,只根据能力而加速或重复学习,但是有些产品也结合了 Aadaptivce Sequence。此类形态最适合学习内容出版业使用。
Adaptive Assessment: 目前被用在自我练习或考试评价中,当学习者回答测评题时,根据 答对/错或部分答对/错,下一个题目会动态调整,只提供适合使用者程度的题目。其目的 是有效率地测出学习者的能力定位,可依据不同标准化量尺来表示。对这类产品来说,题目的品质非常重要,题目与标准能力量尺的定位也最好有大量统计数据,可信度会更高。 此类形态最适合应用在题库型产品中。
>>技术基础与其他元素
除了演算法之外,这些技术共同需要的要素是:
知识地图 (Knowledge Map, Concept Map, Competency Network, Skill Graph);
内容 (学习资源与评量题目) 重新设计 -- 结构化、颗粒化、并对应知识点与加标签(Metadata),若无法结构化则需用不同技术处理;
对学习者进行建模与资料持续累积分析 (可能从外部汇入,并整合学生个人背景资料);
事先设计好的学习过程资料采集标准格式,以利于资料的即时整合。
无论是内容业者或工具业者都可能在系统内增加学习管理功能,例如社群互动、班级管理、支持 学习设计的功能等,以完善学习环境。许多自适应学习系统搭配延伸服务,包括取得延伸内容、 真人线上答疑、或线下辅导,以强化使用经验与成效。
设计面与技术面尚有许多细节需要考虑,暂不细述。虽然 ITS 产值还不高,但真的要完整举述业者也不少于 50 个,而且因为机器学习技术成熟,正快速增加中,以下仅列出代表例子。
>>个性化学习
根据 EdSurge 的调查,教师给出的反馈是,使用有效的 ITS 系统的确对落后学生帮助很大,也同时明显解决了学生的行为问题,因为通常行为问题是来自于学习问题 (上课时老师讲的太难、太简单、被动听讲太无聊...),另一方面对学习领先的学生也能够维持其兴趣与优势,让不同步调、风格与特长的学生都有适合的学习机会。
>>整合学习与评量
值得一提的是,卡内基美隆大学透过开放学习倡议 ( OLI,Open Learning Initiative) 所发展的线上学习系统证明了整合学习和评量活动的优点。
在 OLI 课程中,反馈机制被放入各式各样的学习活动内。当 OLI 结合线上学习与课堂学习的混合教 学模式下施行,教师可以使用学习系统所收集到学生线上学习的相关资料来找出学生最需要协助 的主题,以便在即将到来的课堂教学中可以专注在那些学生误解的概念上 (Brown et al.,2006)。 研究结果发现使用 OLI 的学生组只需对照组一半学习时间就能获得较好的学习成果 (Lovett、Meyer and Thille,2008年)。
把线上线下教学的学习和评量紧密配合,它还可能减少用来评估整个教育体系品质所需的外部查核次数,形成性评量 (Formative Assessment) 可以嵌入学习过程持续发生,降低对学习者的干扰与考试的压力。
>>服务教师
除了服务学生,其实教师也可以用上人工智能的服务。IBM 最近推出的服务 Watson Element for Educators 藉由提供教学管理需要的工具,并帮忙整合学生个人与学习过程资料,一举两得,服务到老师 -- 资料汇整与管理,系统也收到学习资料,以训练机器学习的演算法,来协助老师备课。例如根据设定的学习目标标准 (课纲) 来推荐内容供老师参考,减少老师搜寻适合资源的时间,也减轻老师的脑力负担。
商业运营服务的挑战与考量
然而导入新的教育科技产品从来就不是这么简单的事。目前美国学校里 ITS 的成功案例是经过漫长准备与计划才得到的正面结果。 教育科技产业的最大挑战通常不在科技,更少有新科技先从教育产业冒出,它的门槛在于牵涉因素特别复杂。以下就几个面向分析相关考量。
>>商业模式
既然谈商业运营,第一个问题当然是谁付费,消费产业只要让一个角色 -- 消费者 -- 买单付费就好(to-C),学习产业的付费者有以下可能。
进校 (to-G): 需要了解政府部门和学校的采购预算、招标、额度等规则 (甚至潜规则) ,有合法的名目可以编列,小额度可以从学校付费,不过额度真的小。人脉关系也是决定性因素 (指长期 配合服务周到所建立起来的信任)。此外,有强势英明的教育单位领导也很关键,负责建立大家的愿景共识,并确保资源 (参考 Future Ready 教育主管指导手册) 。
家长 (to-C): 使用者是中小学学生的付费者,不是政府就是家长 (to-C),家长部分还分成直接对家长,或是与学校或老师配合推荐给家长。前者比较单纯,後者牵涉到学校决策者、教师、家长、 学生,每个都要满意,是最複杂的情况。
学习者自己 (to-C): 成人学习的付费者是自己,而且学习目的通常是求职或工作进步需要,付费过程因素单纯又是刚性需求,是最容易处理的情形。型式即使只是单向的录影教学,内容只要有用都可以卖,不像面对中小学生要绞尽脑汁吸引学生。
如果对象是是企业组织,一定要与合规培训要求 (法律规定或公司规定必要的训练指标) 或与事业指标强挂钩,例如销售绩效、工厂良率、客服满意度与效率、提案数、员工满意度,又如医护人员的急救处理时间。
最后一种商模也是 to-B,而这个 B 是教育工具或内容业者,你提供资料分析与机器学习技术给他们,帮助他们升级。人工智能的应用情境经常不是单独存在的产品,而是基於现有服务与用户数据提供增值服务,教育科技诸多商业模式含有免费服务以聚众,这层运用人工智能而建立的个性 化服务是收费关键,但是规模小的业者不一定有能力自己开发智能技术。
>>信心度与效果实证
让付费者有信心想要付费使用,这是第一个挑战。以学校教学场景,教师要改变课堂上与课後教 学活动设计,以将此系统纳入实务中,他们需要对人工智能有充分了解,才会认为值得做此改变。演算法也有其前提假设与限制,需能适当地运用,配合教师专业的判断,以免被误导。
要家长付费(to-C),家长要听得懂这种技术更难了,直接看指标来建立信心度比较可行,考试成绩 还是主要指标,国外也是如此,症结不在於该不该以考试主导教育,而在于没有更好的方式。平时学校考试出题大权在老师手里,你的产品如果无法贴近老师出题风格,学生考试彰显不出成效 ,家长可能会信心动摇。
不要以为只有要家长付费才看考试成绩,学校也需要看到各项指标进步才能持续支持这种方案, 美国大多数教育专案在标榜成效时仍需看考试成绩提分效果,另外前面提到的行为问题减少亦是指标之一。
要让企业组织建立信心进而采购,订定实际的指标是关键,别忘了有些组织与人性因素是你无法改变的。
如果新系统可以成功建立新的行为模式与价值主张就能建立新指标。我们常说的软实力或 21C 能 力要如何量化? 如何评测高阶思考能力? 这些都很重要,但包装这类新诉求的市场接受度需要进行在地尝试,先打概念牌的诉求是一种方式,只要可以说服你的客户,而且,内容要重新设计开发。 在美国,的确有培养与评价正向学习态度 (Growth Mindset) 的产品,并拿到政府经费进行开发; 企业招募工具市场也看到了评量候选人的合作解决问题能力的新产品,背后运用机器学习进行演算。
>>技术与开发运营成本
机器学习需要海量资料当作燃料以训练机器模型,这增加了新进入者起步的障碍。所以开始若能与学校或机构合作提供定制服务,对双方来说是双赢,当然也要考虑之后此技术资产可以应用在其他客户或市场。
人工智能不是一帖万灵丹,如果内容品质拙劣,不会因为加上智能就改进内容与学习效果,它更不可能主动设计优质教学法。以知识转移为主的死记学习法,不会因为智能化而提升学生高阶应用能力。如果内容非结构颗粒化,测评题无法细部撷取学生答题过程,那么机器也无法精准诊断学生能力与做推荐。
产品功能越先进以及内容要重新设计都会增加成本,此文不对技术与设计考量细节做详述。大原则建议: 以 MVP (Minimum Viable Product) 开始,先聚焦解决高优序痛点,利用数据优化原产品与服务,从小做起最为实际 (例如只做视频观看或答题的数据分析)。建立 iteration 的策略,基于自身资产寻求与互补伙伴合作(需要程度对称),可以降低成本与风险。
>>服务设计
垂直整合服务的设计需要针对目标使用者及使用情境来设计使用经验,这与其他产品并无不同。 一般产业所用的 SWOT 分析,仍然适用,根据自身资产发展产品特性与伙伴互补策略;别犯了沃毕根湖症状 (Lake Wobegon Syndrome)。
如果学生可以自学独立使用,情况比较单纯,重点是学生要有学习动机,所以遊戏化学习、或嵌入小遊戏、社交元素,这些很常见。DreamBox Learning 曾经出版白皮书建议,设计要素必须掌握到优化的学习顺序、按需供给的补充资讯、具针对性的实时反馈、维持动机与注意力等等。
如果牵涉老师介入,那就需要让老师买单,这又让情况变复杂,老师这关过不了也会失败,对老师要求越多,失败机率越大。老师教学实务与行为习惯需要改变,新系统需要设计整合融进现有的学习环境 (包括线上与线下的教学活动),说来几句话,做起来真难。从业者可能会发现,在服务学生之前,老师更需要服务,忽视人性因素就以失败为下场。
教育过程的改变 (Change Management) 需要时间与资源做准备,例如: 建立各科的最佳实践范例、教师培训、与家长沟通取得认同,从业者的教育设计 Know-How 与长期配合都重要;教学现场的老师已经疲于追赶新工具,他们需要完整有效的培训与支持。
>>可取代性
如果对象是中小学生,那广义范围不只需考虑街头林立的补习班,互联网模式的线上家教,还有各种才艺与社群活动瓜分中小学生原本紧凑的时间,连作业繁重都可能是影响因子,因为使用者的时间就那么多。
对教育者而言,ITS 是不是有其他替代方案? 有,古时候的教室没有分年级 (不像现在教室像工厂 生产线),混龄学习,常常是大的教小的,现在为了效率划分年级,但是同侪互相帮助仍是绝佳的 学习方法,教学相长,两方都有收获,也有社会性价值存在 -- 学习互助、同理心、沟通、合作。 分层教学也是一种方法。另外,让学生自己主导学习计划也是现在在美国看到的一种新的实践, 很大程度上依赖于教育信息化工具,但不需有人工智能介入。在大班教学环境中,要实现个性化学习是不是一定要借助人工智能,答案是不一定。
>>资料隐私与所有权
这是另一个大问题,连大咖比尔盖兹都在曾这里跌倒,他的基金会投资与强力支持的 inBloom 开张没多久就因为被家长反对而关门,这并不是无解题,只是要很谨慎处理。学习历程记录到底是谁的? 如果将此问题的政策面、执行面环节处理好,反而是个新服务的契机——给学生一个带得走的电子学习履历,以及可能衍生的延伸学习、升学、职涯建议服务。
>>其他影响因素
新创事业眼光对了,设计与技术到位,但行动太早了,环境与时机尚未成熟也仍是失败。教育信息化需要诸多基本因素配合,例如: 网络环境的品质或支援离线模式、使用者有没有硬件设备、使用者(学生与教师) 是否习惯用电子产品等等。
教育系统脚步缓慢,从业者要有对应的策略;企业组织的步调节奏可能差异很大,但是企业目标是赚钱机器,以利的角度切入建立不同部门的交集,很有机会;至于成人学习者的市场,掌握刚性需求,兑现营利可以最快。大家对于 XXX As A Service 应该不陌生,资料科学正在让此精神发挥更彻底,机器学习从大数据中建立模型,以提供用户个人化服务,过去卖内容包裹的模式,正在往Education As A Service 转变,但转变的速度会与本文所讨论到牵涉的各种因素有关,视产品而 定。
许多投入教育学习产业的伙伴开始于对教育的理想,然而在商言商,别单纯被教育热情驱动。创造价值不一定可以转变成利润,创新的机会可能不在人工智能技术,而是问题解决模式。
这个议题更核心的精神在于善用 Data 可以创造价值与解决问题,资料科学技术现在为各产业亟需而备受重视,无论你的产品为何,至少开始收集资料 -- Data is the new oil。 掌握以资料科学解决问题的原则,从小做起慢慢将机器学习导入原有产品中。
例如,大学使用学习分析来预测学生可能会退学而提早采取介入或辅导以提升毕业率,是最早也最为广泛运用的学习分析技术。美国亚特兰大的乔治亚州立大学 (Georgia State University)是一个相当成功的范例,他们分析了过去十年的两百五十万笔学生成绩资料,归纳出可用来预测那些学生可能失败的因子,并以此建立了一个预警系统,包含八百多种预警机制,让辅导人员据以对学生提供辅助与咨询,这系统能根据统计数据来建议学生的最适主修与选课,反而 ITS 仅做小范围实施。
最后,从事学习分析的学者都知道,数据采集与整理可能花费高达 80% 的总时间成本,目前不同系统之间的数据互通性仍是一大问题,资料品质也良莠不齐,然而教育产品数量的大爆发,使信息孤岛 (Data Silos) 问题恶化。如果各系统可以遵循国际学习标准 (最新标准 Experience API, xAPI ),采用一致的资料格式配方,运用应用程序接口 (Application Program Interface, API) 作整合,不但解决此问题,这独立资料层本身并可直接衍生大数据交易,因为第三方可以很有效率地重复利用它开发新应用。
来源:芥末堆