雷锋网按:11月15日-16日,“全球AI+智适应教育峰会”在北京嘉里中心大酒店盛大开幕,峰会由雷锋网联合乂学教育松鼠AI,以及IEEE(美国电气电子工程师学会)教育工程和自适应教育标准工作组共同举办,汇聚国内外顶尖阵容。
AI智适应学习是目前产学研三界关注度最高的话题之一。此次峰会,主办方邀请了美国三院院士、机器学习泰斗Michael Jordan,全球公认机器学习之父Tom Mitchell,斯坦福国际研究院(SRI)副总裁Robert Pearlstein、美国大学入学考试机构ACT学习方案组高级研究科学家Michael Yudelson等顶尖学者。除了高密度的大咖演讲之外,还有多场观点激荡的圆桌论坛。
11月16日下午,美国福布斯市场内容部总经理Will Thompson和物灵科技CEO、前微软研究院研究员顾嘉唯以及印尼最大教育公司Ruangguru联合创始人Iman Usman进行了深入对话,探讨了创办教育公司面临的挑战、教育如何与科技相结合、如何针对不同年龄的学生制定教学策略、如何获取数据等问题。
以下为圆桌对话实录,雷锋网进行了不改变愿意的编辑整理:
Will Thompson:非常感谢大家来到这个对话环节,首先我想问一下Iman Usman,你的公司是作为印度尼西亚最大的教育科技公司,我觉得你会面临非常多的问题,你是如何创办你的公司,以及你们如何成为印度尼西亚最大的教育科技公司?
Iman Usman:4年前,我还在学校攻读研究生时就创立了这个项目,所以这是我们一生的一个事业。教育行业有很多案例、模式,但是对于我个人来说,却是一个非常全新的挑战,因为我现在是在创业。第一个挑战,就是要去了解教育的市场,要去了解用户他们的问题是什么,以及如何去解决这些问题。另外一个是内容的探索和内容的实验,比如说在我们读书的时候,在印度尼西亚,我们没有太多这方面的公司。但是比如说在中国,我们有很多内容提供的公司,就可以拿他们来做一个案例。当时,教育行业在印度尼西亚是一个蓝海市场,所以我也不知道我是不是在做正确的事情。但是最后是超出我预期的,公司从起初的两个人发展到了现在有一千多名员工。
我觉得不同阶段我们都会有不同的问题,比如说在早期阶段,我们是要去找到市场份额,要去找到第一批消费者、客户以及付费的客户。如果你要进行规模化,你在用户数达到第一个100万、500万、1000万时都会面临不同的问题。
Will Thompson:我觉得对于所有的企业家来说,这些都是共同的挑战,但我觉得你做的非常好。顾嘉唯先生,您的物灵科技专注于机器人,您能不能跟我们分享一下机器人用于教育的经验?
顾嘉唯:我们在做的一个尝试是用机器人来做教育。这跟通常意义上知道的那种屏幕上的对话式机器人有所区别。由于此前电影、电视中对于机器人的过度想象,想到机器人用于教育,也会有所恐惧。但是目前,机器人技术越来越成熟,逐渐循环成可用的阶段。
我们为什么要尝试在这个时点从一个只是在屏幕上的助理或者对话机器人跳到实体的产品上面?是因为我们的受众,我们是想解决K6这个年龄段小孩在教育内容上的获取。因为大家其实知道现在的很多教育是线上和线下,因为一部分是说从线上去获得直播课程、录播课程,或者说有一部分智能、AI的双师的课程。
对于小孩来说一直是对着屏幕其实是有问题的,因为无论是对于视力还是对于内容的控制,对于我们信息传递过早地被那些多媒体侵占的状态是会有一些负面影响的。我们能不能利用好现在实体的这种东西,能够让小孩学习到、接触到很多新的东西。比如说书本,我们能不能通过今天的计算机视觉去学习所有市面上的课本、绘本,能够让它跟小孩直接产生交互。因为其实这里面我们有一个很有意思的现象是说今天如果我们能通过一个机器人,一个AI的机器人,能够打通实体的物质,也就是实体交互的教材、内容和虚拟的数字内容,这其实是一个很有意思的桥接的机会。
刚刚其实有一张照片,就是我抱着那个大的机器人的照片,那个机器人是我最早做的一个项目,我们最早做这个机器人的时候其实是想打家庭当中一个陪伴式的全能机器人。但实际上它的问题在于短期内用户预期非常高,你很难把一个语音交互的全能型的连接各种家居、连接各种教育内容的机器人做好。所以我们开始逐渐细分人群、场景,把一个场景给打通。
所以我们公司的名字——物灵,就代表了一个中国人当中对于这种生命感、有灵性的一个描述,万物有灵,我们想打造有灵性的机器人,能够帮助小孩在教育过程中去互动实体的产品,而不简单是语音交互。因为语音交互有一个现在的现实情况,大家可能家里面都用过智能音箱,其实你真实的预期和你每天在用的语音音箱的场景中间是有Gap的,你会觉得什么都可以聊,你会觉得什么都可以互动,用它很方便。但实际用一下之后,你会发现很多东西会出现错误,因为自然语言交互技术在一个开放式的问题上面其实很难解决好,所以这是通用意义上的智能音箱的问题。
我们换一种解决方法,如果我们限定在K6的场景中,帮助小孩在翻读各种教材、课本和绘本的过程中,能互动内容,用计算机视觉的技术来辅助小孩理解场景,同时用一些简单基于这个场景下面的知识树自然语言交互的方式去解决垂直领域中的对话问题,这就很有意思了。
另外这会对教育带来一个新的机会,因为大家现在在直播课APP类的教育软件产品都中有一个特点,是在于你必须把平板电脑和手机给到小孩,这也是为什么很多纯APP类产品黏性、活跃度和时长会产生问题的地方。如果是他自己的终端,他可能去玩别的东西了,不可控,他可能去玩游戏、打王者了。如果是家长给他在固定的时间去使用,他有一个缺点是复购和拉回。如果是一个机器人在边上,除了刚才这种可以直接互动之外,他还可以静默式的在旁边互动,他可以把你再拉回来,他有那种能力。他可以通过这种主动性、察言观色,主动把用户再拉回来,把教育内容再推出去。这是他具有从屏幕交互拉到实体交互的一个新的机会。
我们物灵最近推出了一款针对细分人群场景的产品,针对幼儿园小孩2—6岁、2—8岁的人群,他们在每天高度地看各种各样的绘本,因为大家知道绘本是一个舶来品,来自于欧洲市场、北美市场、日韩还有台湾。中国在过去5年时间绘本的增量非常快,整个出版行业,绘本是最最头部,增长最快的一个行业,就是童书绘本。我们尝试用计算机视觉、用深度学习的算法去识别所有市面上的书和绘本,放到他面前翻到任何一页就可以讲故事,翻到任何一页就可以基于绘本内容跟他问答互动。这个产品叫Luka,它是一个小的猫头鹰一样的机器人,能够跟小孩更好地互动,把教育内容一点点传递给小孩。
Will Thompson:请问Iman Usman,你们在教育科技方面做了很多的事情,那你们是怎么开始的?或者你们做的第一个事情是什么?你们是一开始就包含很多方面,还是一开始专注于一点?
Iman Usman:这是一个非常好的问题,当然我们并不是说一开始就所有的方面都涉及。我们一开始也是会分析一些市场,当时我们也发现有很多的模型,他们有这种智能的辅导,这样的一些交互课程。但是我们想做的一开始非常简单,就是要连接学生让他们找到非常好的老师,他可以在线上也可以在线下。当时我们做这一点,就是因为我们认为当时的市场还没有准备好进行这种1对1的课程,而且还有一些其他的基本问题,所以我们当时就想解决这些问题,我们想要找到其中一个问题,然后这个问题就是如何来找到这些质量很高的老师或者是辅导老师。
那回到我们刚才所说的这个问题,对于这些高质量的老师的数量也是不够的。而且尤其是你到二级三级城市来讲,这样的老师就更少了。所以我们就会来录制这样的一些视频,在这个视频中会有非常高质量的老师来进行讲课,可以把这样的视频来以比较物美价廉的方式提供给这些其他城市的同学。我们也会有订阅的服务,在这方面也会给我们带来了很多的回报。我们当时会想还挺好的,但是它可能不是一个可持续发展的过程。那我们怎么样能够更好地教育家长?因为教育家长也是非常重要的。因为我们当时不是想要只从这些公司或者企业上来获得效益,我们是想让整个市场都更熟悉我们这样一个概念,让家长也能够更加熟悉我们的概念,因为这样他们才能够更好地让他们的孩子学我们这样的课程。
所以当时我们会和很多的企业合作,会让更多的家长来尝试我们的产品,会说如果说我们可以从线上学习,那我们的孩子肯定也能从线上学习。之后是从政府这里得到了很多的关注,他们就会和我们有很多的合作,这样慢慢推广我们的产品。所以我认为我们一开始需要找到一个焦点、一个重点,来想一下其他和这个重点有关的东西,再进行扩展。
Will Thompson:顾先生我也问您同样一个问题,刚才您也说过大家可能也是对机器人有恐惧的心理,首先是为什么是机器人?你是怎么样先找到这些对于机器人不害怕的受众群体?
顾嘉唯:我们原来最早这个团队的核心人员是来自于微软研究院、百度研究院。我们其实在原来的大公司、大平台里面做过各种各样尝试所谓的机器人,因为我们认为机器人这个词在中国的理解当中解读有一点偏向于一定要是两个脚的,跟人互动的这种惊悚型的。其实机器人的泛义很广,它是自动完成任务的一个执行装置。所以我们最早做过无人车、穿戴式设备的机器人,我们做过在路上跑的机器人,我们做过在家庭当中陪伴的像智能音箱这样的机器人
为什么我们后来聚焦在阅读这个场景?这里面有一个很有意思的逻辑,刚才我其实也简单提到过一下,我们发现真正用户预期的场景和技术边界可以去解决的问题之间是需要一点点迭代过去的。因为我们最早在做机器人的时候,我们发现一个最大的现象,在于每个细分场景当中你做好都不容易。这就是为什么说今天我们在弱人工智能时代,在弱人工智能时代走到强人工智能时代的过程中,其实先要解决垂直问题。我们知道在过去的自然语言交互问题,对于百度的推荐,或者谷歌这种带知识网络、网状模型去做检索式模型的都非常好用。
在计算机视觉领域,以前我们发现很多模式识别的判断其实对于很多东西都不可用,但在过去的5年时间深度学习上来之后,把人脸识别、人行检测、车道线、车行检测做好了之后,我们可以应用在更宽泛的领域,我们开始做人脸识别,包括像安防、金融验证、券商等。
回过头来,我们现在又发现一个新的领域,是说如果我们能够把一个多模态的交互技术,融合计算机视觉和自然语言的交互,能解决教育问题的话,这是一个非常细分的领域。我们当时做Jibo的时候,就尝试过在其中放入VIPKID、英语对话的场景,我们发现用户用的非常高频,他们很乐意于用这样机器人的场景去练英语、去互动、去学习这种对话式的场景。我们在想如果能够增加一个视觉的能力,让这个对于全局的理解更全面,他的对话逻辑会越来越好。
所以我们会从视觉出发,因为在过去一段时间技术真正迭代深度学习这个里面,它影响的视觉带来算法的提升是高于自然语言的。因为大家知道其实在过去一段时间深度学习对于自然语言理解的提升并没有那么地颠覆性,现在基本上都还是在用传统方法解决垂直问题。但是对于计算机视觉这个领域当中,深度学习带来的变革是巨大的,只有一个很大跨越式的技术变革,才能产生一个大的技术创新。我们就在想怎么通过计算机视觉这个垂直类目,加上如果我们需要一个的硬件载体的创新机会。因为大家知道其实对于成年人来说,手机基本上吃掉了你的绝大多数时间,因为手机是最最成功的一个智能产品。所以很多过去一段时间投资全聚焦在了无人车,最近Waymo的创始人也跟大家说无人车还有很长一段路径。
我们就在想机器人到底什么样的载体是最合适的?我们既然以前试过无人车、穿戴设备的机器人、家庭的机器人,我们聚焦在教育这个领域,就是我们的一个回答。我们觉得视觉来辅助实体的,包括你在上面去玩英文拼单词的卡片,你在上面去进行自然语言对话一些简单的英文对话,你在上面去翻读各种各样的教材。在这种交互空间内你可以玩出很多多模态的交互,它能够带给小孩一个手机之外陪伴、学习和娱乐的终端,这是一个非常大的机会。我们希望能够造出像当年在中国出过非常多很好的产品,像快译通、学习机、点读机这样的产品,我们今天正在用计算机视觉的AI算法加自然语言的交互创造新的一波教育的产品,它能够通过一个普遍的RGB摄象头,去检测小孩的手指。因为我们把深度学习学的这个年龄段小孩手指的行为轨迹,你可以不像原来需要一个点读笔,你直接用普通的手指点在书本上、课本上就能互动。
Will Thompson:我还有另外一个问题问两位,我们刚刚提到了有很多的在儿童教育当中的不同点,不仅仅是K12的不同点。所以我想问大家,我们如何用教育技术公司或者说你们两家公司如何用不同的思维去看待年纪比较小和年纪比较大的儿童的教育?
Iman Usman:我觉得非常不一样,因为孩子们年纪比较小,他的能力还比较有限。但如果这个学生年纪比较大,他的能力会稍微强一些,我们要考虑到他们不同的能力。还有就是要从中取到一个平衡,年纪比较大的学生他们会比较自律一些,会自己去学习。但是年纪比较小的孩子,他们周边会有很多的因素,可能会吸引他们的注意力。比如说家长就非常重要,尤其是在亚洲,很多的家长他们对孩子的期望非常高,比如说他们想要让孩子去做很多的阅读,但是他们自己在家里又不阅读,家长自己本身又不阅读,所以我觉得这是一个比较大的问题。
所以在儿童时代的教育,我觉得不仅仅是教育本身我们需要注意,我们要让教育成为整个家庭当中的主题,这样的话不仅仅是有儿童的参与,也有家长的参与。
另外一个,大家也要注意到教育的内容非常地重要。我们的内容要非常地有吸引力,因为孩子们年纪比较小,他们容易分散注意力。所以他们很难将注意力长期保持集中的状态,所以我们的内容就必须要非常有意义、非常吸引人。
Will Thompson:我觉得你的点非常好,我的母亲总是告诉我说,她会告诉学生一定要在家庭教育过程中,要让家长有参与。所以顾先生,我也有一个问题要问您,您是在机器人行业的,您觉得机器人是不是一定会比电脑的屏幕在教育孩子方面会做的更好?因为至少说不会让他们玩很多游戏吧?您觉得比如说K6的学生或者是年纪更大一点的学生,交易方面有什么不一样?
顾嘉唯:K6的小孩绝大多数是没有自己的支配权的,再往上长的时候,小孩的自主决策、自主选择的判断力和他的决策权会越来越大。所以这里面最大的区别是谁来做决策,其实往更小的小孩来说,很多决策是在学校之外的,因为有很多家长的时间可以去做决策。因为它会涉及到环境的变化,因为他那时候所有的教育内容和获课方式都是以家庭为主的。再往上长的时候,很大一部分时间多了一个场所是去学校,怎么能够平衡好这两个的关系是很关键的。对于K6的产品,最关键的是你能不能掌握主家长的痛点、家长的需求,和寓教于乐的一个点能够让小孩持续使用,这是最关键的。在K12或者在网上,最关键的是你能解决学校里面的痛点,老师的痛点和家长和老师之间联系当中可以找的机会,这是两个不一样的逻辑。
对于我们在做的K6,我说说K6这块我们的打法和策略,我觉得K6我们更多是把它当做一个完全面向To C的产品,那你就需要非常深挖用户场景当中的痛点和需求是什么?而且决策购买人和使用人是分离的,他是两拨人。那我们就要去找到今天家长对于一个教小孩,他到底有哪些诉求、哪些痛点还没有解决?
我们说了刚才我们有一款产品叫Luka,它的主打就是今天家长有几个痛点,几乎所有家里面一柜子一柜子的绘本,他没时间、精力,甚至有的时候没有能力去读英语,能不能帮到他?你把一本绘本能够讲的绘声绘色这个能力是很难的,市面上不是所有人都能做好。就像得道给了大家很多听书消化完更好的结果,今天绘本能不能创造这样的机会?你能不能让一本绘本讲的绘声绘色,有声有色的,让小孩爱上它,比看动画片还有乐趣,这是一个机会,这是我们打的第一个点。
第二个点是英语,其实中国家庭学英语K6现在是一个非常常见的场景,甚至是K3,越来越往前。希望小孩能够更早地接触这种英语,因为英语是刚需,它很容易、很快速地可以校验闭环,他跟机器人互动两下,你拿一个苹果在他面前,他转身说Is an apple,他就可以去告诉家长,他有这样的直观反应,就很容易校验这个闭环。所以我们在机器人上加入了非常多怎么通过视觉的方式去辅助地练习和理解英语单词,和英语的句式。我们还做了双麦克风的阵列,可以去口语评测英语。他跟读的过程当中可以去评测和打分他的英语是不是好?
我们需要围绕着绘本这种交互方式,和获得的多媒体的这种传递,能够让小孩更好地跟数字内容结合物理世界的这种玩法结合在一起。这样的好处在于K6的小孩要通过游戏的设计,把他能够高密度、高频地跟这种内容相交织。K6当中六年级关键还有一个东西是什么?你会发现他3点半下课了,不知道去干什么?这就是新的一个机会,你不可能给他一个IPAD,让他去玩王者。这就会有一个时间窗口的机会,这也是我们在主要抓的机会。
另外一个当回到家庭当中,陪他做作业,又是一个刚需。中国的家庭有一个特别大的痛点在于家长晚上忙的半死了已经,回到家里面还得要去教小孩、做作业,这是一个非常常规的痛点。除了陪好小孩之外,还要教他做作业。我们通过计算机视觉可以识别手写体,可以识别书面上的空格和内容,当小孩在填的时候它就可以把它评测出来。同时不像你要给到一个手机去照着作业出来答案,我们希望辅助式的帮助小孩看到课本里面的内容之后,辅助往前走一步。所以这就是新的一个辅导型作业回到家里面的一个新的机会
Will Thompson:那在每一个成功的商业背后,尤其是涉及到一些算法的商业,都有一个非常成功的数据战略。所以 Iman Usman你是如何用数据来拓展你的业务的?
Iman Usman:我简单说一下,第一个,产品本身我们如何使用数据来打造产品?我们每个孩子都有一个个性化的学习,让他们走上正确的道路,让他们会有非常好的内容去实现他们的目标。
第二个,我们要去研发不同的内容,比如说我们有一个仪表盘可以通知我们说有什么样的内容是不太好的,有哪些内容是不够的,比如说一般孩子只读了一半,或者说他们在回答问题之前只读了一半的内容。所以我们可以看一下这个内容的消费方式,以及我们如何做一些改善,以及如何对这个内容进行重新设计。
第三,我们会用数据来进行销售战略的制定,比如说我们会有不同的产品销售的渠道,比如说我们有学习管理系统,它关注于学校当中任务的处理,我们也会用数据来帮助学生学习,帮助学生去做出决策。这个数据也会告诉我们,我们要有什么样的销售战略,比如说我们要传递什么样的信息给学生?
第四,因为我们跟政府有很多的合作,所以我们会用数据来去帮助政府的决策过程,我们跟当地政府有很多的合作。我想要提到的一点是我们跟政府合作的时候,可能政府不知道如何去使用数据,所以有时候会比较难需要花很多时间,政府有时间但是他们不知道如何去解读这个数据,所以他们不知道如何从数据当中获得价值。所以我们会帮助他们去走这样一个流程,我们希望在提供数据之后政府有一个更好的决策过程,能够进一步地去改善当地的教育,能够惠及到更多的孩子。
Will Thompson:我们还有一点点时间,顾先生您就简单说一下吧?
顾嘉唯:这是一个所有公司都会面临现在的一个选择,不光是我们做AI的,所有公司都会面临,需要转型到这个上面去。对于教育这个领域,我们的看法是说今天这个大话题也是智适应,其实因材施教是最大的一个机会点。我们能不能通过前期的冷启动深入细分的垂直领域中是很重要的,因为BAT其实最缺的是几个垂直领域的数据,教育是一个非常典型的数据源,他们互联网缺失的,这就是一个机会。当你冷启动的时候,在一个细分领域当中找到数据的机会,它能够像雪球一样快速滚起来。
自然语言很难和BAT比,因为它原来的数据量和图谱性已经非常非常充实,但是视觉领域是一个很强的机会,因为任何一家互联网公司以前不具有这个垂直领域的视觉算法,甚至是连数据都没有,所以这是极大的一个颠覆性的机会。我们的策略就是把用户在交互的过程中所有数据记录下来,你的语音对话、图像翻读、行为轨迹数据,甚至是用户的表情,他的情感化计算这块的数据。记录下来之后,我下一步能够让未来的幼升小产生一些评测。
再往下其实我们打通家长端对于小孩以前不了解的信息,老师端和学校端对小孩不了解的信息,让他成为一个把这些信息串在一起的平台和机会。因为未来我们也在进入到学校里面,让每一个课桌多一个这样可以视觉理解场景的东西,让它除了能够用语音去做一些辅助之外,让视觉成为一个好的辅助,能够把这些数据在这个正循环当中不断地数据化。因为原来这些用户行为是没有被数据化的,这是一波新的,用教育的垂直场景,数据化再造的一个过程。
Will Thompson:我们掌声给到两位专家,感谢你们!
人工智能风雨60年,与其说技术升级促成了今天的浪潮,不如说当前的人工智能,终于站在离商业最近的位置。
去年,首届「AI 最佳掘金案例年度评选」活动一经推出,便受到了AI方案输出方和AI技术需求方的极大关注。评选从商业维度出发,寻找用户/客户问题解决能力强的产品和解决方案。
现在,我们再次站在AI浪潮之巅,正式启动第二届「AI最佳掘金案例评选」。
在AI+教育领域我们一共设置了6个奖项,欢迎踊跃报名,报名地址://m.drvow.com/special/custom/AITopTen2018.html
相关文章: