开云kaiyun-互动式外语教学的创制格式
2024-05-07
[摘要]  本申请涉及互换才力,如研习外邦说话和文明、研习面临面 互换起到主要用意的其它才力(搜罗执法的施行和临床践诺)、管制工 厂安然查验和供给客户效劳等。闭连技能阐发教学外语的要领和产物己为人们所知。一种这类产物被称为 RosettaStone。它显示出图像、口头外达和书面短语,并让用户指出哪 个图像与哪个口头外达或短语相结婚。它通过显示研习者的声谱图, 具有对研习者的语音发生反应的本事,然后研习者必

  本申请涉及互换才力,如研习外邦说话和文明、研习面临面 互换起到主要用意的其它才力(搜罗执法的施行和临床践诺)、管制工 厂安然查验和供给客户效劳等。闭连技能阐发教学外语的要领和产物己为人们所知。一种这类产物被称为 RosettaStone。它显示出图像、口头外达和书面短语,并让用户指出哪 个图像与哪个口头外达或短语相结婚。它通过显示研习者的声谱图, 具有对研习者的语音发生反应的本事,然后研习者必需对所显示出的

  声谱图举行领会并与本土谈话者的声谱图相比照。用来教学外语的另一种产物是TeLL me More产物系列。它包 括显示说话资料的课程页面。它搜罗少许组织化的会话学习,此中学 》J者听到外达(utterance)并看到其书面花样,同时看到一组不妨的回 答(平常2到4个),并拔取一个所显示的解答。这些拔取可能不随学 习者的熟练水准而变更。这不妨与确实的对话分别,由于正在确实的对 话中,并不会向谈话者供给每轮对话中要说实质的预设选项,而是可 以由他们我方断定说什么和奈何说。 Virtual Conversations供给一种对话互动花样。该产物播放个 人谈话的视频剪辑,然后显示一小段书面解答。用户可能对着麦克风 读出一个所显示的解答,假设该编制识别用户的语音,编制会基于这 一解答播放另一段视频剪辑。

  MILT原型说话研习编制也援手对话互动花样。MILT正在房间 屮或其它处境中显示出屏幕人物。用户可能讲出一系列敕令让该编制 来推行,如向前走、捡起物体等敕令。行动反响所述人物可能推行该 敕令或回答指出它不了然该敕令。形似HerrKommissar1.5的互动式逛戏通过文从来仿真与计 算机人物的会话。该逛戏搜罗少许说话指令,可是假设研习者正在所学 说话方云尔有少许本事。所搜罗的说话指令会断绝该逛戏的流程,这 与正在自然的对话互动中分别。可是,它不行有用地操练处于分别熟练 水准的研习者,也不行供给一种装备来衡量研习收效的见效。其它编制,如MRE、 SASO和VECTOR也可仿真对话。MRE 和SASO援手正在详细的职分周围内的非组织化对话互动。VECTOR可 能不援手对话互动,可是可能操纵户正在会话的每个阶段从一组所显示 的解答中作出拔取。 Cocinella模仿了用外语举行的对话,此中正在每个阶段研习者 可能朗读一段所显示的不妨解答,或者从影象中回思出预期的解答。 互动式课程不妨限于学习逛戏会话中操纵的特定短语的时机。这些编制不妨亏折以操练操纵者的外语。它们不妨不会坚持 操纵者的提神力,使操纵者可以很容易地将他或她的操练变动到确实 处境中,很好地适合处于分别熟练水准的研习者,助助研习者订正他 或她的发音,和/或诱导研习者统统参加到研习历程中。

  可能供给说话研习编制和要领,可能供给互动式课程模块。该互动式课程模块可能被摆设成 供给互动式说话课程,其正在可控的难度程度上提示用户来复述、翻译 或界说单词或短语,或供给对应于图像的单词。它也可能被摆设成基 于用户正在互动式说话课程中的互动发生课程进度申报,其指示用户语 言研习的见效。可能供给互动式社交模仿模块。所述互动式社交模仿模块可 以被摆设成供给互动处境,其正在可控的难度程度上央浼用户操纵所学 说话与虚拟人物举行互换以到达目的。它也可能被摆设成基于用户正在

  4互动处境屮的互动发生模仿进度申报,其指示用户说话研习的见效。可能供给研习者模子模块。所述研习者模子可能被摆设成接 收所述课程进度申报和模仿进度申报。它也可能被摆设成基于课程进 度申报和模仿进度申报来限制互动式说话课程和互动式社交模仿的难 度程度。现正在通过回来下面临示例性施行例的周详阐发、附图及权力 央浼,这些及其它组件、次序、特性、目的、好处和气处会变得了解 起来。

  图1示出了开荒和达成说话教学编制和要领不妨涉及的组件。图2是显示节目中的某一阶段的屏幕,该节目教学阿拉伯语 和针对伊拉克的说话和文明并针对正在邦内事情和维和运动中的军事人 员的需求。图3示出了组件和数据存储器的数据流程图,其可能被用于 开荒和运用说话教学编制和要领,以及可能与之互动的用户类型。

  图5图示阐发了与说话教学编制和要领的另一个施行例进 行互动的用户。图6是数据流程图,其图示阐发了互动式社交模仿模块中所 用的管束组件和数据存储器,以及正在二者之间换取的新闻和数据。图7是数据流程图,其图示阐发了输入管制器模块中所用的 管束组件,其位于互动式社交模仿模块中,以及正在模块的组件之间交 换的数据。图8是数据流程图,其图示阐发了杜交模仿引擎中所用的处 理组件,其位于互动式社交模仿模块中,以及正在模块的组件之间换取 的数据。图9是显示了虚拟助手(社交模仿模块中的组件)的屏幕,

  其提议研习者推行何种作为。图10和图11是屏幕,其显示正在社交模仿中参与交通行动的

  5人物。图12是显示研习者进度申报的屏幕,其针对非言语的互换 才力。图13是数据流程图,其图示阐发了社交人偶(puppet)模 块屮所川的新闻和数据存储的流程,社交人偶模块可能是社交模仿模 块的构成局限。图14是数据流程图,其图示阐发了互动式课程中的模块, 以及行动输入和输出的数据存储器和举行互动的用户。图15是数据流程图,其图示阐发了语音识别模块的输入和 输出。图16是数据流程图,其图示阐发了教导代劳模块可能操纵 的输入和输出,教导代劳模块可能是互动式课程的组件。图17是图示i^领略互动式课程和社交互动的组件,以及技 能模子的组件的图,所述才力模子的组件可能界说正在研习者模子中教 导和追踪的才力。图19是屏幕,其显示了研习者正在局部测试中的成效。图20是数据界说图,其示出了用来结构和体现所得到才力 的才力模子的实体、相闭和属性。图21是辅助和参考资料的类型的图。图22是实质类型之间的内正在相干的图。图23是数据流程图,其指示出怎样对实质举行管束并将其 转化为数据集。

  详细施行例格式正如下面操纵施行例举行的进一步周详描摹,用户渐渐研习 到用亍和说外语或属于外邦文明的人举行互动的互换才力。互换才力 可能搜罗说外语的白话才力。它们也可能搜罗闭于非言语的互换格式 的学问,如手势和非言语发声等,以及礼貌和礼仪的社交楷模和规矩, 其正在种种装备中管制对话互动。可能供给外语教学设置和要领。可能教学任何外语,如西班

  6牙语、法语、阿拉伯语、汉语、英语和普什图语等。用户愿望研习的外语正在这里被称为目的说话。用户已掌 握的说话正在这里被称为本土说话。用户可能是研习目的说话的 人,或者指引、辅助或促进研习历程的讲师或培训员。这里所用的学 习者指的是行动说话研习者的用户,而这里所川的讲师指的是 指引或促进研习历程的用户。研习者可能是儿童或成人。研习者可能是低级说话研习者,可能没有任何预先的说话经 历。可替换地,具有先前说话操练的研习者,搜罗愿望通过急速研习 操练来维护和订正其互换才力的研习者,也可能操纵操练设置。研习者可能通过互动式课程、社交模仿和/或其它研习花样 举行研习。互动式课程可能搜罗单词、短语和其它详细互换才力的结 构化外达,以及针对这些才力的测试和学习。社交模仿可能涉及正在逛 戏或模仿处境中与互感人物举行模仿的对话。正在他们操纵操练编制时 研习者可能从该操练编制摄取到连绵的反应。教学设置可能不断追踪 研习者对一系列互换才力中的每个才力的操作,并可操纵这一新闻来 定制研习履历。可能教学特定职分和情况所需的才力。单词可能被限定正在具 体情况所需的周围内,而且可能通过一系列离间性递增的情况来渐渐 扩睁开来。要点可能放正在白话熟练水准上。研习者可能正在模仿农村中学习他们的互换才力,正在那里他们 不妨须要与外地住民发生友谊相闭,而外地住民反过来(interm)可能 助助他们完工战后重筑等职分。也可能模仿其它情况和处境,如饭馆、 堆栈宽待处或医疗室等。每个研习者可能由虚拟助手来随同,假设须要,虚拟助手可 以供给遵照研习者局部才力举行剪裁的助助和指引。行动智能领导系 统的一局限,该助手可能饰演虚拟助教的脚色,向研习者供给闭于其 成效的反应。研习者可能通过众形式界面举行互换,该众形式界面可 以愿意他们正在模仿中代外他们的人物谈话并拔取姿态。该编制可能被 摆设成答允研习者举行互换或说出适合于那一情况的众个话语中的一 句,而不是从固定的拔取组中举行拔取。假设须要可能对语法举行先容以便使研习者可以发生和分析很众种外达,从而应对新的情况。可能先容非言语姿态(答允和 禁止),以及礼仪和礼貌的文明楷模,以此助助研习者获胜完工社 交互动职分。可能搜罗创作(authoring)东西的齐集,其援手急速创筑新 型而向职分的说话研习处境,由此更易于援手比力不常教的说话。图1示出了开荒和达成说话教学编制和要领15不妨涉及的 组件。该设置可能操纵互动式课程1和互动式逛戏的组合,互动式逛 戏可能搜罗互动式社交模仿2,互动式社交模仿2可能教诲互换才力及 其正在特定情况、职分和/或作事处境中的运用。这些可能被摆设成以协 作格式来运作,从而使正在互动式课程中教诲的才力被运用于互动式逛 戏中。互动式社交模仿2可能供给详细的语境来运用这些互换才力, 这可能助助坚持并变动运用于确实宇宙中。比方,模仿历程中可能将 研习者成立正在咖啡店外,正在这里研习者可能哀求跟顾客叙话并问道。 与某个顾客叙话并视察他或她的回应的详细语境可能使得该履历万分 难忘,而且使正在确实宇宙中运用所学实质变得特别容易。可能操纵才力模子3来结构教学实质。才力模子3可能是要 研习的才力的分级分类法。说话才力、文明才力和职分才力可能被归 类到才力模子3中。遵从它们操练的才力可能对互动式课程实质和互 动式逛戏实质作出证明。这可能助助维护互动式课程1和互动式社交 模仿2之间的谐和,以确保正在互动式社交模仿2顶用到的才力正在互动 式课程1中教诲过。可能基于所涵盖的才力来缔造教诲实质4。互动式课程l和 互动式社交模仿2可能被摆设成涵盖才力齐集的目的。当创作教学内 容4时,可能对其举行证明以指示出它涵盖了什么才力。该编制可能被摆设成正在研习者与基于谋划机的软件互动时 不断管束研习者的输入,从而使它可能供给连绵反应5。该反应5不妨 合用于研习布景,比方,正在互动社交模仿2中的反应5可能分别于正在 互动课程1中的反应。可是正在任何情形下,反应5城市予以研习者即 时的指示,指示他们操纵互换才力的水准。图2是显示节目中的某一片断(stage)的屏幕,该节目教学

  8的军事职员的需求。它示出了社交模仿,其顶用户的人物6必需与某 个地域确当地教导者举行接触以打算重筑运动。用户的人物6可能正在 图片的核心地位。该场景中的其它人物7、 8、 9和10可能对用户的语 音和姿态作出回应。正在该逛戏中获得获胜不妨依赖于外地说话和文明 的学问。图3示出了组件和数据存储器的数据流程图以及可能与之 互动的用户类型,组件和数据存储器可能被用于开荒和运用说话教学 编制和要领。用户13可能是研习者和/或讲师并可能与由基于谋划机的 编制达成的研习编制14举行互动。研习编制14可能搜罗互动式课程 1,它可能搜罗被摆设成开荒详细的互换才力的互动式外达资料和练 习。这些可能由谋划机编制来传送。研习编制14可能搜罗互动式社交 模仿2,它可能是模仿社会互动的互动式逛戏,且不妨须要操作一系列 互换才力。这些也可能由谋划机编制来图像。这些模仿可能被用来开 发互换才力以及评估研习者对这些才力的操作。研习编制14可能搜罗 其它互动式逛戏17,其被摆设成予以研习者操纵互换才力举行学习的 时机。每个逛戏可能探访并更新研习者模子18,它可能搜罗相闭研习 者熟练水准的基于谋划机的纪录,它可能依照才力的种别被追踪。这 可能供给对研习者成效的不间断评估。研习编制14可能搜罗辅助研习 资料19,当研习者没有运转基于谋划机的主研习编制时可能操纵这些 资料。它们可能通过印刷版、电子版或其它任何花样被操纵。

  〖056]研习编制14中的完全资料可能从一套实质阐发(content specification) 20的阐发发生。实质阐发20可能通过用户友谊的格式说 明互动式模仿的组织、特色和行动,从而可以创作、编辑和领会这些 模仿而不须要闭于编程说话或步骤代码的学问。实质阐发20也可能被 用于创作、编辑和领会该编制的其它方面,如互动式课程1的资料和 辅助研习资料19等,以鞭策二者之间的一概性。实质阐发20可能援用才力模子3,如上面闭于图l的会商。 通过援用才力模子3,作家22可能操纵协作创作东西23来天生并维护 实质阐发20。对才力模子的援用可能有助于确保教学实质的构成局限 之间的兼容性和一概性,比方,确保正在互动式社交模仿中须要用到的 才力被涵盖于互动式课程中,且正在互动式课程中辅导的才力可能正在互

  9动式社交模仿中举行学习。图4图示阐发了与说话教学编制和要领举行互动的用户24。 兀动式社交模仿2、互动式课程I、研习者模子18、其它互动式逛戏 17和辅助研习资料19中的一齐或少许可能被装置并运转正在膝上型计 算机25上。膝上型谋划机25可能装备含有耳机27和麦克风28的头 戴式受话器(headset) 26。头戴式受线听到语 音和山步骤发生的其它音响而不搅扰正在统一房间29中的其他研习者。 头戴式受线也可能使得膝上型谋划机25可以摄取用户24发出的 语音而不彰着障碍不妨正在统一房间29中的其他人。用户24可能操纵 键盘30和鼠标31来助助导航步骤并限制互动。该机算机可能搜罗显 示器32,其向用户显示出进入虚拟逛戏宇宙(正在社交模仿的情形下) 或教室处境(正在互动课程的情形下)的视图。图5图示阐发了与说话教学编制和要领的另一个施行例进 行互动的用户。用户33、 34、 35和36可能作事于谋划机作事站37、 38、 39和40上,这些作事站可能通过局域网(未图示)连绵。研习者 模子可能被蓄积正在大家效劳器(未图示)上,并被下载到用户谋划机 中。这可能使得用户可以坐正在收集上任何一台谋划机前并摄取适合于 其研习者概略(profile)和史册的操练履历。可能正在任何简单的或组合的谋划机和收集化摆设中操纵这 一技能。也可能正在其它类型的谋划设置,如逛戏限制台上操纵这一技 术。图6是数据流程图,其图示阐发了互动式社交模仿模块中所 用的管束组件和数据存储器,以及正在二者之间换取的新闻和数据。正在 社交模仿中,用户可能饰演屏上人物的脚色,通过模仿转移他/她的人 物,代外他的人物谈话,并为其人物拔取姿态。然后正在模仿历程顶用 户的人物随用户的引导做出运动。寓目屏幕上的一个我方的人物可能 答允用户看到操纵的所选姿态,以及正在与其它人物谈话时拔取适度的 人与人之间的隔绝举行学习。这些文明成分会随分别的文明而产生变 化。研习者41可能通过言语行动43、非言语行动44和/或其它 限制作为45 (比方,引导研习者的人物正在逛戏宇宙中沿特定宗旨转移)供给输入至互动社交模仿2。并不须要平素供给完全类型的输入。比方, 可能渺视非言语行动。也可能操纵口头输入来庖代操纵键盘或鼠标的 限制作为。言语行动43可能发扬为语音花样。研习者41可能用日标外 语对着麦克风讲线可能将输入的语音信号转化为 文本花样的外达假设(utterance hypothesis) 49。可替换地,言语输入 可能通过文本打字输入或通过菜单从浩瀚选项中举行拔取。正在同暂时间或分别时期内,研习者41可认为其人物拔取非 言语行动44,如手势。可能供给拍照机和图像管束本事以答允研习者 41外上演所需姿态。可替换地,研习者41可能从菜单当选出适合的姿 势。谋划机鼠标31 (如图4所示)可能具有滚轮,其可能被用于正在一 组可用的姿态当选择。该界面可能答允研习者41正在谈话之前先拔取姿 势。正在这种情形下,研习者的屏上人物可能正在研习者41谈话的同时外 上演该姿态。社交模仿可能搜罗虚拟逛戏宇宙47。这可能搜罗处境的3D 模仿,其顶用户的人物与其它人物举行互动。这可能操纵逛戏引擎(例 如,虚幻引擎(UnrealEngine)或转矩引擎(Torqueengine))来达成。 比方,战略伊拉克(Tactical Iraqi)的一个版本可能操纵虚幻联赛 2003 (UnrealTournament2003)逛戏,而另一个版本可能操纵虚幻引 擎2.5 (Unreal Engine 2.5)。也愿意操纵2D模仿,或静态图像序列。 它们可能供给正在此中运用互换才力的语境。其它如电话之类的设置可 以供给唯有音响的互动。逛戏引擎可能供给限制作为,如转移、转弯等。它可能通过 研习者41输入限制作为45。比方,战略伊拉克(Tactical Iraqi)的 如今达成(implemtation)将箭头键交融到逛戏引擎中,并操纵它们使 玩家人物转移和转弯。职责引擎模块48可能限制逛戏宇宙中的人物,并确定它们 对研习者41的作为和其它人物的回应。输入管制器50可能证明研习 者41的外达假设49和非言语行动44,并发生参数化寒暄行为51,其 可能描摹外达49的实质和非言语行动44的寓意。寒暄行为可能形似 平常用说话学或玄学的说话举行界说的语音行为,可是可能答允交畅达过非言语格式以及通过语音来产生。然后社交模仿引擎52可能确定 逛戏中的每局部物应当怎样回应研习者的作为。社交模仿引擎52可能供给对逛戏屮的人物和完全作为的髙 级限制。比方,可能操纵它将互动限制或管制成为互动式教导脚本。 参睹Marsella, S., Johnson, W.L.,  LaBore, C. (2003). An interactive pedagogical drama for health interventions. In U. Hoppe and F. Verdejo (Eds.), Artificial Intelligence in Education: Shaping the Future of Learning through Intelligent Technologies, pp. 341-348. Amsterdam: IOS Press 。所 有这些出书物的实质并入此处行动参考。比方,它可能被用于天生互 动式社交模仿来向保健专业职员(如临床情绪学家)教诲临床才力。 一局部物可能饰演病人或照顾职员的脚色,然后用户可能饰演临床心 理学家的脚色,拔取向虚拟病人或照顾职员说的少许话语,以便可能 助助她处理题目。Marsella等人(2003)所描摹的互动式矫健干与,卡 门的好主睹(Carmens Bright IDEAS)供给了一种模子,正在此中虚拟 照顾职员卡门与虚拟参谋吉娜(Gina)举行对话。杜交模仿引擎可能 答允情绪学家受训者饰演吉娜的脚色,悉力让卡门反应她的题目并给 出用于处理这些题目的选项。形似卡门的好主睹之类的项目仍旧 确认并编写出情绪学家正在这种商量中所用的许众常睹短语,其可能被 团结到社交模仿的会话中。社交才力,如成长和维护友谊相闭和证明 非言语提示和身体说话等,可能与这些运用闭连,并可能被团结到技 能模子3和研习者模子18中,正如它们可能被团结到说话操练运用中 一律(比方,参睹图12)。社交模仿引擎52可能具有剧情逻辑53和代劳(agent) 54。 剧情逻辑53可能反响其它事变或宇宙形态来界说正在虚拟宇宙中会产生 什么事变。代劳54可能确定逛戏中非玩家人物推行什么作为。可能援手众个非玩家人物。这可能答允研习者41学习参加 庞杂的众向对话。具有格外的人物可能使研习者41看到正在该处境中其 它人物怎样对如今对话作出反响;那些人物以至可能插入到对话当中, 假设它们阻难研习者41或其它人物所说的话。这会导致社交模仿具有 高度确实实性。为了作出这些断定,社交模仿引擎52可能摄取闭于虚拟宇宙确当前形态和以前作为(不管它们是否完工)55的境况的闭照。基 于这一新闻,它可能拔取行动指令56来让每局部物去推行。作为改变 步骤57可能将这些作为施行为动画序列来让逛戏人物去推行。逛戏引 擎47可能利川视频剪辑,正在这种情形下作为改变步骤57可能拔取捅 放与行动指令亲近结婚的视频剪辑。逛戏介质可能只操纵音频,正在这 种情形下,作为改变步骤58可能拔取或创作满意行动指令56的音响 序列。作为改变步骤57也可能监控逛戏宇宙的形态和举行中作为的状 态,并将这一新闻传达给社交模仿引擎52。当研习者41与社交模仿引擎52互动时,它可能将数据存在 到事变日记59中。事变日记59可能纪录研习者41的作为,以及人物 和/或逛戏宇宙的对象作出的回应。该编制也可能正在研习者与逛戏互动 时存在他/她的语音或说话的灌音60。可能操纵灌音60来评估研习者 的成效,以及操练语音识别器46来订正识别精度。图7是数据流程图,其图示阐发了输入管制器模块中所用的 管束组件,其和正在模块的组件之间换取的数据一块位于互动式社交模 拟模块中。输入管制器可能改日自研习者41的言语43和非言语输入 44转换为社交模仿引擎可能分析的花样。然后社交模仿引擎可能向其 限制的一个或更众局部物发生适合的回应。当研习者与屏幕上人物举行互换时,他们可能供给音频输 入,可是他们也可能通过拔取姿态或他们我方的屏幕上人物的形态(例 如,戴着太阳镜)来供给非言语的新闻。音频输入可能被传达通过语 音识别器46,其可能输出文本花样的外达假设49。外达映照函数65 可能将外达假设49映照到参数化寒暄行为66中。参数化寒暄行为66 可能识别互换的语义分类,比方是否是问候、对问候的解答、扣问、 供给新闻等。正在历程中的这一阶段,寒暄行为阐发不缉捕统一语音行 为的变体之间的完全分歧一比方,非正式水准的分歧(如Howdoyo do (你好)与Heythere (嗨!))或语境的分歧(如Goodmoming (早上好)与Goodevening (夜间好))。可能轻视不明显变革外达 的互换贪图的说话的变更,比方What is your name (你叫什么名字) 与Tell me your name.(告诉我你的名字)。也可能不缉捕与戴太阳镜 (其割断眼神接触,于是正在少许文明中被以为是粗野的)之类的非言语新闻和非言语姿态(鞠躬、将手放正在心脏部位及其它标记性的姿态)

  闭连的寓意。于是可能推行对参数化寒暄行为66的进一步管束以扩大 可能缉捕外达的其它少许方面寓意的参数。于是外达假设49和非言语行动44可能被传达通过荟萃模块 67,它可能返回语境参数68,其基于正在给定的非言语的和杜交的语境 中对外达的外观花样的证明一恰是正在此处可能缉捕语音行为的替换性 外观花样之间的分歧。可能将这些参数增加到研习者寒暄行为阐发51 中。外达可能包蕴少许摆脱适合语境就毫偶然旨的援用(比方, 当使斤]代名词时),这些援用须要被确定。正在与语境参数相连接之前, 参数化寒暄行为66可能被传达进入叙线,其可能坚持重心仓库 71和会线。重心仓库(focus stack) 71可能坚持正在对话历程中 所涉及到的对象和话题的列外。这些援用不妨已通过言语或非言语进 行。比方,假设研习者63指向虚拟宇宙中的一个对象,则该目的对象 会被增加到重心仓库71中。会线可能包蕴正在如今对话中完全 较早语音行为的列外。线可能以这些数据组织为语境来确定 如今寒暄行为中的任何援用并更新它们以盘算管束今后的寒暄行为。 比方,假设研习者说他正在哪儿?线 以确定近来评论到了哪个男人。然后可能最终将具有已确定的援用73 和语境参数68的寒暄行为连接起来以获得统统的研习者寒暄行为阐发 51,其可能体现传送给社交模仿引擎72的了解的互换贪图。可能将输入管制器用于种种不妨受益于众模态输入的种种 互动式逛戏和模仿中。比方,无尽的职分(Everquest)等脚色饰演 逛戏答允用户限制一个动画人物并与其它人物举行互换。输入管制器 可能愿意这些运用输入姿态组合,并以一概的格式对其举行证明。它 可能答允运用步骤的开荒者扩大用户可能输入的非言语交通行动的指 令集(比方,挥手,鞠躬,握手等)并将它们证明为更平常的寒暄举 止品种的实例(问候、感激等)。它也可能答允该运用步骤以一概的方

  式识别并证明用户外达中属于社交互动和友谊相闭的那些方面,如礼 貌的神态和减轻面部要挟(参睹P. Brown  S. C. Levinson (1987). Politeness: Some Universals in Language Usage. New York: CambridgeUniversity Press。该出书物的实质被并入此处行动参考)。这反过来可 以加强社交模仿本事以便正在众种运用周围内模仿用户和谋划机人物之 问的社交互动。图8是数据流程图,其图示阐发了杜交模仿引擎中所用的处 理组件,其与正在模块的组件之间换取的数据一块位于互动式社交模仿 模块中。可能通过研习者本事76确当前途度概要和如今的才力/职责 77来对社交模仿引擎举行初始化。可能从研习者模子18中检索研习能 力新闻76,且可能从社交互动实质阐发126屮检索才力/职责新闻77, 该社交互动实质阐发126可能描摹社交模仿中人物的构成局限及其行 为。研习者本事76可能搜罗研习者局部才力的操作程度,以及确定玩 逛戏疾苦水准的逛戏参数,如研习者是初学者依然有体验的玩家,以 及是否应向玩家供给诸如对白字幕之类的助助。才力/职责77阐发可能 搜罗对场景初始形态的阐发、正在该场景要完工的职分目的89和/或完工 职责目的所需的才力。可能通过剧情逻辑53来管束研习者本事76和才力/职责77, 该剧情逻辑53可能饰演导演的脚色来成立和管制场景。这一剧情逻辑 53可能初始化场景中每局部物(也被称为代劳)的形态。这可能搜罗 初始化每局部物的情绪形态,比方,该人物对研习者的初始信托水准。 剧情逻辑53也可认为每局部物拔取天性特性,其可能确定该人物会如 何回应研习者和其它人物的作为。这些参数可能依赖于研习者的本事 程度。万分地,可能调节人物使其相对地容忍初学者所犯的缺点,但 相对地阻挠忍髙级玩家所犯的缺点。形似地,可能调节人物以答允学 习者有大概量的回合时间,或者当正在必定时期内研习者不回合时作出 反响,万分是看待口头对话。正在推行社交模仿的历程中,体现研习者语音和姿态的参数化 寒暄行为51可能通过会线而获得管束。会线可能 将这些行为发送给代劳计划模块4,代劳计划模块4可能断定附近的代 理怎样回应。简单计划模块可能针对完全的附近代劳作出计划,或可 替换地针对每个代劳可能有散开的计划模块实例。为了确定哪个代劳可能作出回应,剧情逻辑53可能正在创筑 时将代劳置于对话组中。然后研习者可能拔取对一个代劳讲线通过走向前并面临特定的代劳。逛戏引擎可能操纵诸如箭头或卓绝显

  示等格外指示符来指示哪个代劳己被选中。举一个例子,正在图2屮学 习者41已拔取了对右侧的人物10谈话,这通过悬浮正在他头顶上的箭 头11来指示。研习者可能通过转向分别的宗旨,或通过摆脱一个代劳 而走近另--个代劳来拔取对分别的代劳谈话。现代理摆脱一个对话组 而走近另一个对话组吋,对话组的成员也可能变革。当研习者41拔取对一个代劳谈话时,属于统一对话组的所 有代劳都可能有时机回应。当会线 返回的回合时,它可能依照与研习者原始输入的闭连性对回应举行排 序(比方,对研习者的题目的直接解答具有比发端新话题更高的品级) 并可能以这一序列将寒暄行为从代劳80处传达给社交人偶管制器81。会线也可能将闭于己更新代劳形态的新闻传达给 逛戏引擎47,正在这里该新闻可能被显示正在界面元件中,如与代劳相应 的人偶12下面的图形信托条(trust bar)。纵然正在一个施行例核心理 商量模仿(PsychSim)众代劳编制(参睹S. Marsella, D.V. Pynadath,  S. Read (2004). Agent-based modeling of social interactions and influence. In Proceedings of the International Conference on Cognitive Modeling, pp, 243-249.该出书物的实质并入此处行动参考。)己被用作计划模块79, 但也可能遵照所需推论的深度插入其它的技能达成。比方,可能正在另 一个施行例中操纵定制的有限形态机。可能将社交模仿结构出席景或情况的齐集中。比方,正在一个 场景中一组代劳不妨坐正在咖啡馆里的桌子旁;正在另一个情况中饰演警 察脚色的代劳不妨站正在交通警亭中;正在另一个场景中饰演酋长脚色的 代劳不妨与他的家人坐正在他的起居室中。正在每个场景或情况中每个代 理可能具有可用的、适合于所处的场景的寒暄行为指令集。 少许寒暄

  行为是通用的且可运用于大周围的代劳和情况中。这可能搜罗问候, 如Hello (哈罗)或How are you (你好)或My name is (我 叫) 代劳的姓名等(假设英语是目的说话)。其它寒暄行为可能仅 合用于特定的情况,如I understand you are a member of a big tribe.(我 分明你是一个大部落的成员〉或Is this Jassim il-Wardis house (这 是J咖imil-Wardi的家吗?)等。现代理不分析另一个代劳或用户的寒暄行为时可能添加操纵通用短语,如Okay(好的)或What did you say (你说什么?)或Sony, I dont speak English.(对不起开云kaiyun-,我不会 说英语。)等。每个代劳也有盘算好要回应的寒暄行为指令集,搜罗 通川的行为,如What is your name (你叫什么名字?)或Who is the leader in this district (谁是这个地域的教导人?)。场景的策画者可认为每个代劳供给它可能推行的寒暄行为 指令集和它可能回应的寒暄行为指令集,其适合于所处的场景或情况。 平常来说参数化寒暄行为的类型数目要远小于详细外达花样的数目。 比方,Hello!(哈罗)和Hey there!(嗨!)都可能被视为问候语音 行为的实例。ImMike(我是迈克)和MynameisMike(我叫迈克) 均为文书语音行为的实例,此中该文书行为的对象是代劳的姓名。代 理可能以形似的格式回应形似的语音行为,低落针对每个代劳的会话 管制的庞杂性。也可能开荒操纵这些形似性以减小语音识别器46 (图7)必 须识另外外达的周围。比方,对语音识别器46来说对Im Mike (我 是迈克)和My name is Mike (我叫迈克)举行区别不妨不是很重 要,由于代劳对二者的回应不妨类似。裁减必需识另外外达的数目可 以简化代劳的构架和推行,同时确保从用户的概念看来代劳的会话仍 显得矫捷且可托。可能开荒操纵场景的其它特性和研习实质的其它特性以降 低代劳的庞杂性,同时保存矫捷会话的印象。假设估计用户是初始语 言研习者,正在假设研习者只分明怎样说有限周围的外达下,可能限定 代劳盘算好要回应的寒暄行为周围。看待少许次要的人物,指令集可 能万分小,比方饰演效劳员脚色的代劳不妨很少说除了 Please take a seat, I will be with you shortly.(请坐,我从速过来)以外的其它话。 限定寒暄行为的周围可能使许众的纯粹代劳聚居于逛戏宇宙中变得容 易。看待具有更主要用意的代劳,计划模块79可能拔取适合的 寒暄行为来反响大周围的输入外达。可能将会话结构为外达-回应对的 齐集,或称节奏。然后计划模块可能通过确定正在会话中的给定轮次 哪一个节奏是适合的来结构会话。 少许外达-回应对平常可能正在对话历程中的任何时分是适合的。比方,假设输入外达为Whats your name (你叫什么?),则不管用户正在何吋扣问这一题目,代劳的回应都可 以是My name is Mike (我叫迈克)。少许外达-回应对不妨只正在某些 亊件已产生后,或坚持某些形态时合用。比方,假设用户扣问Where is the leader of this district (这个地域的教导人正在哪儿?),唯有现代 理对用户的信托水准足够高时,代劳才不妨会解答知名字。于是计划 模块79可能追踪形态和语境的变更86以便确定正在如今情况中哪种回 答是适合的。然后可能通过有限形态机来对适合的解答举行拔取,有 限形态机的转换以形态或语境为前提。也可能操纵以如今形态为前提 的发生正派来拔取它们。可能操纵其它会话模仿要领,如限制可观测 的马克夫(Markov)计划历程。图9是显示虚拟助手(社交模仿模块的组件)的屏幕,其筑 议研习者推行何种作为。社交模仿逛戏可能搜罗专用代劳虚拟助手 91,其可能正在经历该逛戏时向研习者41 (图7)供给助助和协助。虚 拟助手91可能行动伴侣或队员随同研习者的人物92。虚拟助手91可 以向研习者41供给闭于做什么的提议,如图9中所示,此中虚拟助手 91提议研习者41向一个市民先容他我方,其反应为以研习者41的本 土说话外达的陈述93 向这局部先容你我方。假设研习者41难以理 解逛戏人物正正在说什么时,助手91也可认为研习者41举行翻译。助 手91还可能反响研习者41的其它人物94或95的作为正在逛戏中饰演 脚色。助手91的行动可能通过两个代劳模子来限制, 一个正在逛戏 中体现助手的本身脚色, 一个正在逛戏中体现研习者的脚色。基于逛戏 中助手本身正在逛戏中的脚色的模子,计划模块79 (图8)可能拔取让 助手91来推行的作为,其与逛戏中的助手脚色相一概。基于逛戏顶用 户脚色的模子,计划模块可能向用户41供给正在逛戏中要采用的作为选 项。计划模块79可能拔取保举的单个作为,它可能是计划模块79能 够自行拔取的作为,假设它限制用户的人物的话。可替换地,计划模 块79可能向用户显示指令聚会正在如今的对话形态可答允的完全寒暄举 止的列外。如图8所示,社交人偶管制器81可能认真遵照行动正派的

  器81中每个代劳54 (图6)可能具有一个相应的社交人偶82。社交人 偶管制器81可能拔取让毎个代劳人物来推行的互换性能83,然后社交 人偶82可能确定耍推行什么样的交通行动84米达成互换性能83。然 后可能将这些交通行动84传达给作为调动步骤57来推行,这循序会 促使人物的动画实体同步推行实体运动组合。互换性能可能操纵其它 显示技能被信号化(signaled),如显示一局部物闭切另一局部物的讯息 并对其作出反响(一个脸部特写镜头)。图10和图11是显示正在社交模仿中参与交通行动的人物的 屏幕。正在图10中,人物96发出参加对话的互换性能的信号。他通过 推行站立起来并面向玩家人物97的交通行动来达成这一 目标。正在图11 中,人物98推行获取对话轮次的互换性能,而人物99和100推行聆 听讲线的互换性能。获取对话轮次的互换性能是通过谈话并协同 诸如手势的姿态来达成的。凝听谈话者的互换性能是通过面临并凝望 谈话者来达成的。许众交通行动可能由处于一系列不怜悯形的人物来推行,但 是可能予以他们互换性能的是会话语境。比方,人物可能由于种种不 同的起因站立起来,且可能面临并凝望种种分别的对象。社交人偶82 可能操纵人物实体的行动指令集来推行作为,用户会将这些作为证明 为实质上是互换性的。返回图8,当会线 愿望讲线可能将代劳的人偶安顿正在对话场地内 的部队中,央浼该人偶推行轮次哀求的互换性能,人偶可能将其 映照到非言语行动。当没有人谈话时,正在场上部队最前面的人偶可能 推行获取轮次的互换性能,然后陈述所必需说的实质。岂论何时 当新的代劳(搜罗研习者)谈话时,可能告诉该小组中的完全人偶来 推行他们的凝听谈话者的互换性能。当谈话者完工谈话时,遵照 来自愿作改变步骤57的作为境况事变的指示,场上部队中的下一个讲 话者,或者假设该部队为空则近来的下一个谈话者(平常是正在如今讲 话者之前谈话的代劳)可能获得该小组中完全人偶的提神。以这种样 式,社交人偶管制器可能谐和几个分别的人偶的行动,假使它们中只

  19有一个施行由计划模块79所指示的回应。社交人偶82除了对叙话发生非言语的反响,也可能对事变产 生非言语的反响。假设直接将与种种作为的形态和逛戏宇宙85的形态 闭连的新闻发送给社交人偶管制器81,则这是不妨的。社交人偶管制 器81可能査看这些事变是否具有任何互换性能,假设有的线依照其社交正派作出反响。比方,假设研习者贴近一组人 偶,它们须要发现出反响,该反响显示少许闭于它们互动愿望的东西。 该贴近事变触发发生可睹行动的反响正派,同时探求到剧情逻辑53己 供给的语境。正在发生代劳行动的任何阶段,剧情逻辑53可能插入并推行 逛戏宇宙中为详细场景剪裁的人偶行动或变更。剧情逻辑53可能直接 影响逛戏宇宙,或者它可能通过变革其正在运转时期内的语境参数(如 影响代劳的信托度)来影响代劳或人偶。正在逛戏历程中,目的追踪器性能87 (图8)可能监控研习者 的进度90。当一个讯息穿过编制指示到达特定逛戏目的的事变产生时, 剧情逻辑53可能提神到这一点。目的追踪器87提神到这一点,并可 以向研习者显示迄今为止已达成了哪些目的。当研习者参加社交模仿时,目的追踪器87可能提神到研习 者何时操纵特定才力,并操纵这一新闻来更新88研习者模子18,同时 更新它对这些才力已被操作的揣度。然后社交模仿可能使才力图74变 得可以为研习者所用,该才力图74总结了获胜玩该逛戏场景所需的技 能,以及研习者如今对这些才力的操作水准。这可能操纵形似于正在互 动式课程中所用的那些研习者模子更新道理以及才力模子,不才面会 对二者进一步周详地阐发。图12图示阐发了怎样可以使研习者模子反应出研习者正在社 交模仿中已操纵的才力。该图显示了正在操纵本发现的阿拉伯说话和文 化操练中由研习者模子所发生的进度申报,其周详显示了被称为互换 才力61的一类才力。该互换品种中的子类可能搜罗种种涉及到面临面 互换的社交才力,比方外征该文明的姿态、操纵适合的体现拥戴的姿 势以及正在目的文明中眼神接触的主要性。正在该示例中,对眼神接触的 分析62最髙不妨为IO级,且将其评定为10级。这可能反应出这一究竟,即研习者老是引导其正在模仿中的人物正在向阿拉伯人物做毛遂自荐 之前摘下他的太阳镜。假设已达成完全的逛戏目的,则剧情逻辑53会通过提交成 功职分申报来终止该职责,而假设它检测到退步的情况,则会通过提 交火败职分申报来终止该职责。同时可能供给研习者正在该场景中的成 绩的进一 步总结。图13是数据流程图,其图示阐发了社交人偶模块中所用的 新闻和数据存储的流程,社交人偶模块可能是社交模仿模块中的构成 局限。可能操纵可扩展的标示说话(Markup Language (XML))花样 来指定估计互换性能101 。与此闭连的更众新闻可能参睹R Williamson (2001), XML: The Complete Reference, Osborne Press ,其一齐实质并入 本文行动参考。图8所示的互换性能83阐发可能确定与互换事变(比方,动 作、人物、对象和事变)闭连的基础语义单位。它可能答允通过进一 步描摹该互换性能的特色来诠释这些单位,如发扬性能、感情性能、 推论性能、认知性能或实效性能等。该阐发可认为参加互换事变的代 理定名并识别它们正在互换中的脚色,其可能搜罗谈话者、受信者、聆 听者和偷听者。该阐发可能描摹每个谈话轮次怎样适合于全部会话 代劳怎样蓄志识地以致谈话轮次发端(比方,通过哀求轮次发端)以

  及一朝完工互换代劳怎样蓄志识地放弃该轮次(发生针对每局部的轮 次,将其予以受信者或实践上假设该代劳愿望延续谈话就坚持它不

  21102。交通行动阐发102可能指定一组个别运动和作为,其可能搜罗 (l)头部运动,(2)躯干运动,(3)面部神态或面部肌肉的其它运动, (4)凝望作为,其涉及到眼晴、脖子和头部宗旨的谐和运动,其指示 人物往哪看,(5)腿和脚的运动,(6)姿态,其涉及到胳臂和手的协 调运动,(7)语音,其可能搜罗言语的和仿言语的行动,和域(8)嘴 唇运动。可能用行动性标示说话(BXL)来指定这些交通行动的阐发 102,或者可能操纵其它少许详细的对话代劳行动描摹说话来达成,如 MURML或ASL。参睹S. Kopp, B. Krenn, S. Marsella, A. Marshall, C. Pelachaud, H. Pirker, K. Th6risson, H. Wlhjalmsson (2006). Towards a common framework for multimodal generation in EC As: The Behavior Markup Language. In 2006 Conference on Intelligent Virtual Agents, in press。这些文献的一齐实质并入本文行动参考。从互换性能101到交通行动102的转化可能依赖代劳的语 境。人偶语境103可能纪录逛戏宇宙中特定的特色齐集和与拔取妥贴 的行动闭连的代劳形态。人偶语境103可能搜罗与代劳的立场(比方, 顺心、中立、厌烦)、代劳的身体构形(比方,坐下、站立、蹲伏)和 /或如今举动(比方,对话、用膳、阅读、退换轮胎等)闭连的新闻。 可能很容易地扩展这些语境特色以获取语境的其它闭连方面。人偶也 可能摄取事变和形态变更86的闭照,这些事变和形态变更产生于边际 处境中且可能影响对交通行动的拔取。假设给定所需的互换性能,社交人偶82可能拔取或修建适 合于如今语境的行动阐发。这可能操纵FML到BML的映照正派104 或少许其它正派或步骤齐集来达成。比方,假设代劳的立场是拥戴的, 则FML到BML的映照正派可能拔取如将手放正在心脏部位之类的充满 拥戴的姿态来陪同对问候的回应。可是,假设代劳的立场是猜忌的, 则FML到BML的映照正派可能拔取如双臂交叠之类的冷漠姿态。以下是少许正派示例,其可能被用来拔取不怜悯形下的互换 行动。玩家人物可能走向非玩家人物。当玩家达到距非玩家人物某一 隔绝处时,这会以信号示知形态或语境变更86,指示玩家已足够贴近 以发端对线可能将互换贪图亦即发端对话的 贪图归因于玩家。然后引导非玩家人物来推行互换贪图以体现承认。

  女人不与生疏人互动。然后分别的非玩家人物可能运用分别的FML到 BML的映照正派,由此导致万分分别的体现承认的行动。假设非玩家 人物是小孩,该小孩会跑向玩家并显示出发扬兴奋和感兴致的身体动 画。假设非玩家人物是女人,该人物会跑开并变动其视线完工发生行动的作为并使其和它们的语义 单位结盟,人偶82可能将它们组合到要推行的作为进度外中。然后可 以将这些传达给作为改变步骤57。作为改变步骤57可能一个行动接一 个行动地发端推行每个构成局限。假设通过BML或少许其它组织化体现法来轨则作为进度 外,作为改变步骤57可能将该阐发编译到定向非轮回图中,该定向非 轮回图的节点为原始行动构成局限,而其弧线为这些构成局限之间的 短暂依赖相闭。然后通过渐渐使构成局限从定向非轮回图中出列并将 它们发送给逛戏引擎来推行,作为改变步骤57可能推行该阐发。假设 该构成局限不行获胜地推行,可能激活退步作为或中止扫数行动;否 则假设该构成局限完工,则检査未决的作为,而且假设另一个作为依 赖于己完工的作为且没有恭候其它构成局限来完工,则可能将其激活。 该历程可能延续下去直到完全组件构成局限已完工或已被管束,正在这 —时期点上可能闭照图8所示的剧情逻辑53行动的推行仍旧完工。互换性能和交通行动之间的散开,以及操纵映照正派来界说 互换性能的达成,可能使作家目次包蕴众种学科的团队。漫画家可能 创作出基础动画元素的指令集,然后文明专家或其它实质专家可能利 用创作东西来对行动举行拔取,以达成特定语境中的特定互换性能, 比方,为阿富汗的女性人物拔取讨厌审视的行动以达成体现承认的交 流贪图。可能不须要步骤员的作事来天生具有可托的互动交通行动的 动画人物。图14是数据流程图,其图示阐发了互动式课程中的模块, 以及行动输入和输出的数据存储器和举行互动的用户。可能操纵研习 编制的才力构制器1来传送互动式课程。和社交模仿逛戏一块,研习 者可能操纵语音和点击鼠标之类的其它输入的组合来与编制举行互 动。可能通过语音识别器46来管束语音,正在这种情形下语音识别器46

  23可能发生假设的外达,况且,假设特定的课程页面须要的话,也可能 发生对该假设的可托性的评估以及其它输出。可能将这些连同其它输

  入传达给输入管制器105。输入管制器105可能像正在社交模仿中一律聚 集这些输入,且可能将它们传达给才力构制管制器106。才力构制管制 器106可能谐和课程资料的显示、对研习者回应的领会和递送反应。才力构制管制器106可能从才力构制器文献107当选择课程 页而阐发,其可能对每节课程的实质和课程页面举行编码。才力构制 器文献107可能是正在创作历程中天生的课程实质阐发文献。可替换地, 可能将课程实质编译为二进制花样并加载到教学设置中,或者行动同 一步骤的一局限,或者行动散开的数据库。可替换地,课程实质可能 保存正在散开的效劳器中,并遵照须要通过收集下载。课程实质可能由一组课程页面构成,每个课程页面可能是课 程页面模板的一个实例。这组课程页面模板可能是可扩展的。页面模 板可能搜罗

  示例会话页面。正在这里研习者可能看到人物参加会话的动画或视 频。跟着人物参加会话,打印文稿可能显示人物正在说些什么以及相应 翻译。可能供给界面小部件,其答允研习者暂停或重放会话。可能出 现示例性会话,其显示阐发要研习的新实质,且平常位于每节课程的 发轫或课程中各局限的发轫。

  词汇页面。它可能先容新的短语、词汇和语法花样。这些页面可能 搜罗本土谈话者朗读新词汇的灌音材料、以研习者的本土说话举行的 翻译、以圭臬外音法显示的音译和/或书写花样、诠释和阐发以及界面 小部件,其答允研习者朗读短语并摄取针对其发音的即时的谋划机生 成的反应。可能拔取性地禁能对片面短语,万分是短小短语的反应, 此时语音识别精度亏折以供给牢靠的反应。这些页面上所供给的反应 类型可能是可成立的编制参数,其依赖于语音识别器对目的说话的识 别精度和/或研习者的熟练水准。庞杂短语可能由单个单词和子短语

  (subphrase)渐渐扶植起来,以进一步阐明语法组织。以目的说话呈 现的短语和翻译可能是彩色编码的,以便研习者可能急速看到它们之 间的对应相闭。

  24以显示所学短语的翻译以及界面小部件,该界面小部件答允研习者朗 读短语并摄取针对其发音的即时的谋划机天生的反应。单个短语可能 从之前的词汇页面中抽取,但可能是随机漫衍的,从而使研习者不单 仅纪念短语正在之前词汇页面中浮现的序次。可能通过运转于课程实质

  阐发127上的自愿化天生性能151来自愿天生这些影象页面,以减轻 课程作家轨则这些页面的仔肩。

  外达格式变成页面。正在这里可能向研习者供给提示,该提示包蕴以 目的说话显示的白话短语、以研习者的本土说话显示的陈述和/或图片, 研习者可能用目的说话构成白话回应。示例性提示如下Ali has just said hello to you in Iraqi. Say hello back to him.(阿里刚才用伊拉克语向 你问好,向他答复问好。)每个外达变成页面可能搜罗一组不妨的正 确回应和一组不妨的不精确回应,以及遵照每个精确和不精确回应所 给出的反应。研习者的外达不妨和预期的外达不符,才力构制器可能 依照研习者的回应是否精确来给出反应。外达变成页面可能露出为练 习,此中研习者可能通过点击按钮来自正在寓目优选谜底,或者露出为

  尝试项目,此中拒绝给出优选谜底,直到研习者做出某些次数的考试 以供给精确回应之后才给出。

  新闻页面。这些页面可能向研习者显示新闻和诠释,且可能操纵文 本和图像的组合。可能操纵新闻页面来先容每个新的课程中央,以及 供给闭连文明布景资料。

  众选学习页面。正在这些页面中可能操纵文本、音响纪录和/或图像 向研习者显示题目和域提示。可能向研习者显示一列不妨的回应,学

  习者必需拔取妥贴的回应。正在少许页面中可能答允有众个回应,受训 者可能拔取一个或更众个精确回应。

  搭配学习页面。正在这里可能以随机的序次向研习者显示一列项目和 一列翻译。研习者可能拔取一个使这些项目处于妥贴对应的排序。

  主动会话页面。这些页面是互动式社交模仿2 (如图6所示)的简 化实例,其入到互动式课程1中,以便发端向研习者供给学习。 它们与示例性会话页面形似,分别之处正在于研习者可能正在会话历程中 代外人人物中的一局部物谈话。当正在会话中轮到研习者时,可能通过 线索向研习者提示正在这暂时机说什么比力适合。假设研习者还不确定要说什么,也可能提出预期的目的说话短语。于是主动会话步武了自 然会话,可是比浮现于社交模仿中的会话有更众的管束。也便是说, 正在主动会话中可能向研习者提示闭于正在会话中的每个机遇要说什么的 实质,而正在社交模仿屮可能答允研习者说出适合于这一情况的更大范 围的农达。每节课程可能以主动会话来结朿,该主动会话央浼研习者 运用正在该课程中所学到的才力。

  发音页面。这一页面可能搜罗以目的说话的音响示例。研习者可能 正在课程中的任何吋候查阅该页面,以便回来和学习不熟练音响的发音。

  进度页面。这一页面可能显示研习者如今对所学的每个才力的操作 水准。这可能很容易地通过才力构制器来获得,也可能很容易地通过 互动式逛戏等其它语境来获得。课程显示模块108可能显示课程页面。它也可能显示研习者 正在操作课程资料所掩盖的才力方面的进度。可能操纵格外的模块来推行特定类型的课程页面。假设操纵 所纪录的视频来显示会话,则示例性会话页面和主动会线,而假设操纵动画来显示会话,则须要动画播放器。才力 构制器1可能操纵与社交模仿中所用的类似的作为改变步骤57和逛戏 引擎47。可能操纵教导代劳110来评估研习者正在课程页面万分是词汇 页面的成效并发生反应。当被启用时,它可能基于每个研习者对词汇 页面的语音输入来被挪用。它可能评估研习者语音的质料,可能识别 最彰着的缺点,并可能发生反应来闭照研习者该缺点的性子且旨正在进 行妥贴的饱吹和饱励。可替换地,才力构制管制器106可能管束少许 用户回应并自行发生反应。才力构制器1可能基于研习者正在课程中的成效来存取并更 新研习者模子18。研习者模子更新模块111可能基于研习者正在每个页 面的成效来不断更新闭于研习者对每个才力的操作确当前评估。然后 它可能周期性地存在对研习者模子18的更新。研习者模子更新模块111可能操纵贝叶斯(Bayesian)学问 跟踪算法来统计性地谋划对操作水准的评估,该算法与Beck和Sison 的学问跟踪要领形似。参睹Beck, J. and Sison, J. (2004). Usingknowledge tracing to measure student reading proficiencies. In Proceedings of ITS 2004. /w jProcee必gj o/决e 2004 Co—/*ece o rtorfg 办stews, 624-634 (Berlin: Springer-Veriag)。该出书物的一齐实质并入配 方行动参考。每个精确的研习者语音输入可能被视为研习者已操作与 该项(3闭连的才力的不确定的证据,不精确的研习者语音输入可能被 视为研习者未能操作那些才力的不确定的证据。Beck和Sison的要领 不妨不凿凿地合用,由于Beck和Sison的要领合用于阅读才力,万分 是字形到音素的翻译,而研习者模子更新(Learner Model Update)模 块则可能一般地合用于互换才力,并合用于外语才力。况且,它可能 操纵大周围的研习者输入,而不单是语音输入。 一朝与妥贴的先验概 率适合地校准,研习者模子更新模块111可能供给对研习者熟练水准 的精准且实时的评估,该评估对初始说话研习者很合用。当研习者41与才力构制器1举行互动时,可能将研习者的 作为纪录到事变日记59中,而将研习者的语音样本存在正在灌音60的 数据库中。这些可能被用来评估编制的本能和研习者的收效。究竟上, 正在操纵才力构制器1的一个不妨要领中,可能禁用语音识别器46,且 可能操纵才力构制器1来纪录研习者语音的样本,然后可能操纵这些 样品来操练语音识别器。这不妨合用于说话操练编制的早期成长阶段, 此时针对目的说话的受训语音识别器尚未被开荒。可能操纵与社交模仿所用的统一逛戏引擎来达成才力构制 器1。这使得研习者可以急迅且便当地正在互动式课程和社交模仿之间转 换。这然后可能饱吹研习者将正在才力构制器1中所得到的才力运用到 社交模仿中,并査阅闭连的才力构制课程来助助他们正在社交模仿逛戏 中获得先进。图15是数据流程图,其图示阐发了语音识别模块的输入和 输出。语音识别历程可能通过任何语音识别解码器来推行(比方,HTK, (参睹Recent advances in large-vocabulary speech recognition: An HTK perspective. Tutorial presented at ICASSP 2006. IEEE Computer Society Press), Sonic (Bryan Pellom, SONIC: The University of Colorado Continuous Speech Recognizer, University of Colorado, tech report 弁TR國CSLR國2001-01 , Boulder, Colorado, March, 2001 ), Julius (A. Lee, T.

  27Kawahara and K. Shikano. Julius画an open source real-time large vocabulary recognition engine. In Proc. European Conference on Speech Communication and Technology(EUROSPEECH), pp. 1691-1694, 2001 ), 或Sphinx (Placeway, P Chen, S., Eskenazi, M Jain, U., Parikh, V Raj, B., Ravishankar, M., Rosenfeld, R., Seymore, K., Siegler, M., Stern, R., Thayer, E 1997, The 1996 HUB画4 Sphinx曙3 System, Proc, DARPA Speech Recognition Workshop, Chantilly, Virginia, Morgan Kaufmann Publishers),完全这些出书物的一齐实质并入本文行动参考),这种语 音识别解码器运转于语音的湮没式马克夫(Markov)声咅模子中,它 援手基于语法的说话模子且援手说话模子和/或音响模子的动态转换。语音识别器46可能将启动/罢手信号112行动输入,其正在启 动识别时和罢手识别时发送信号。可能通过点击图形用户界面上的按 钮天生启动/罢手信号112,或者可能通过其它少许发信号的设置来产 生启动/罢手信号112。正在启动信号和罢手信号之间,语音识别器46处 理来自用户的麦克风的语音信号43。它可能正在用户发出语音时管束该 语音信号,或者它可能先将用户的语音纪录为音响文献,然后管束该 音响文献。不管哪种要领,都可能创筑灌音113,其可能被存储于用户 谋划机或长途效劳器上的灌音文献60中。语音识别器46可能操纵非本土音响模子114来运转,即目 标说话的音响模子,其被定制以识别非本土谈话者操纵目的说话发出 的语音。这种定制可能通过操练基于本土和非本土的语音组合的音响 模子而达成。可替换地,可能操纵非本土语音的特色来偏移或调节己 经基于本土语音举行操练的音响模子。正在互动式课程和社交模仿中, 以至正在二者的分别局限中,可能操纵分别的音响模子,以便最大化识 另外矫捷性(robustness)。比方,社交模仿中所用的音响模子可能基于 发音较差的非本土语音举行操练,以确保发音较差的研习者也可能玩 该逛戏。相反,用于高级课程的音响模子可能基于发音很好的非本土 语音和本土语音举行操练,以此低落对研习者的缺点的容忍度且可能 区别应付研习者的缺点。可能操纵识别形式指示器16来指示要用哪种 音响模子。语音识别器可能操纵说话模子115来确定要识别哪些短语。可能操纵无语境的识别语法;可替换地,可能操纵n-gram说话模子。 可能对说话模子举行剪裁以合适将要操纵识另外特定语境。比方,正在 社交模仿中可能修建一组说话模子,对每个模子举行剪裁以识别预期 正在每个场景屮浮现的寒暄行为的特定指令集。正在互动式课程中可能从 浮现正在众组课程页面屮的众个单词和短语的齐集发生识别语法。单词 和短语组的巨细可能依赖于对研习者的缺点的希望容忍度,由于增大 语法周围的巨细平常会低落对发音缺点的容忍度。也可能操纵包蕴具 体说话缺点品种的语法,以便助助检测这些缺点品种。这一技能可能 被用于检测发音缺点以及其它类型的缺点,如语法缺点等。比方,对 于阿拉伯语中的咽部摩擦子音/H/的常睹发音缺点可能通过以下历程来 检测采用包蕴该子音的单词,比方,/marHaba/ (—种说你好的 非正式要领),并天生识别语法,该识别语法搜罗精确发音的单词以及 常睹发音缺点,如/marhaba/和/markhaba/。然后假设研习者以这些格式 之一读错单词的发音,则语音识别器不妨可以将其检测出来。针对每个语音输入,语音识别器可能以文本花样输出最左近 的外达假设49。语音识别器也可能输入该识另外置信程度117。图14 所示的才力构制管制器106可能操纵二者来确定给研习者的适合反应。图16是数据流程图,其图示阐发了教导代劳模块可能操纵 的输入和输出,教导代劳模块可能是互动式课程的组件。可能向教导 代劳模块IIO供给一组输入,此中少许可能由图14中的才力构制管制 器106来供给。这些中的一个可能是对如今研习者输入118的阐发。 这可能搜罗由语音识别器所发生的外达假设和置信程度。另一个可能 是对预期输入119的阐发。这些输入可能搜罗对如今课程项目标不妨 精确回应以及估计研习者也许会发生的不妨缺点回应。看待少许课程项目,如词汇页面项目和影象页面项目,不妨 仅有一个预期的精确谜底;比方,假设一个项目是先容阿拉伯语单词 /marHaba/的词汇项目,则仅有一个预期的精确回应。看待少许项目, 如外达变成页面项目,可能有众个不妨精确的回应。比方,探求战 术伊拉克(Tacticallraqi)中的外达变成页面,此中提示如下Hamid just introduced himself to you. Respond to him by saying that you are honored to meet him.(哈梅德刚刚向你做了毛遂自荐。回应他说你很荣

  tsherrafiia、 tsherrafhaseyyidHamiid或tsherrafnayaseyyid。正在 这些情形下,预期输入119中可能包蕴一组不妨的精确回应。看待一 些课程项目,大周围的精确回应是不妨的,正在这种情形下可能供给刻 画不妨精确的回应齐集的形式或阐发,或以至供给步骤,该步骤用于 天生不妨精确的回应或用于测试局部回应以确定它们是否精确。同吋, 正在创作吋间可能操纵说话模子120,其包蕴目的说话组织和/或说话学 习者所犯的常睹缺点的学问,来天生不妨精确的替换性回应121。形似地,预期输入119可能搜罗不妨不精确的回应、预期不 精确回应的形式或阐发或用于天生不精确回应的步骤。也可能操纵语 言模子120来天生不妨缺点的回应。别的教导代劳110可能以为任何 未鲜明显示精确或不精确的输入可能被假定为是不精确的。可能将研习者输入118和预期输入119传送给缺点领会器模 块122。缺点领会器模块122可能评估研习者的输入以识别研习者所犯 的详细缺点,且正在发生反应时可能拔取闭切一个或众个缺点。这一评 估可能涉及到对研习者的缺点举行分类且使其与已知的研习者缺点类 别相结婚。举例来说,假设提示研习者说/marHaba/ (含有无声的咽部 摩擦音/H/)而不是说/marhaba/ (含有无声的声门变调/h/)。这是说英语 的研习者用阿拉伯语时所犯的常睹发音缺点品种的实例:用/h/庖代/H/。 于是对这一情形下的缺点举行分类可能将该缺点行动/H/—/h/音素替 换的实例举行领会。可能通过缺点数据库123来辅助这一分类历程, 列出说话研习者每每犯的紧张说话缺点及其浮现的频率。这一数据库 又可能通过领会研习者的语音样从来发生。假设这一历程发生缺点品种的一个齐集,则缺点领会器可能 拔取应行动教学要点的一个或众个缺点品种。这可能探求到语音识别 器所供给的置信品级;假设闭于实践仍旧检测到的缺点的置信度低, 则针对特定研习者缺点的详细反应是不行取的。假设研习者模子18显 示研习者具有犯这一特定缺点的史册,则可能进步置信度。假设一种

  外达发现轶群个缺点,则缺点领会器122会基于其紧张水准拔取闭切 某一缺点。本土听众占定少许说话缺点比其它缺点特别紧张比方往 往以为会导致词语之间搅浑的缺点最为紧张。假设缺点数据库123包

  30括闭丁缺点相对紧张性的新闻,则可能操纵这一新闻来辨别各个缺点 之间的优先序次。当检测到缺点时,或者当研习者显示出可以天生不带缺点的 回合时,可能操纵这一新闻来更新研习者模子。可能将缺点实例增加 到研习者发扬的史册屮。况且,每个精确或不精确发扬的实例可能作 为占定是否操作或贫乏特定说话才力的概率证据(probabilistic evidence)。可能进一步操纵语音识别器所供给的置信程度来调节实践 上观测到精确或不精确说话发扬的实例的概率。可能将这一证据 (evidence)和置信度用于才力的贝叶斯收集或其它概率模子中,此中 闭于个别回应是否精确的概率通过收集散播回来以发生闭于是否操作 隐含的才力的概率。 —旦检测到或拔取了缺点,或没有涌现缺点,即时反应模子 124可能确定予以研习者什么样的回应。它可能从反应数据库125当选 择反应新闻。反应数据库125可能搜罗说话领导西宾通常采用的领导 战略蚁集,和/或课程作家保举的用于反响特定缺点的详细反应战略。 即时反应模子124也可能探求到研习者犯特定缺点的史册,比方提神 到研习者正在众次退步的考试后何时精确地读出单词。即时反应模子124 还可能探求到研习者的特性,万分是研习者正在说话研习方面的梗概技 能和自傲。可能拔取反应音问并举行讲话调节以减轻直接指斥的水准。 参睹W丄.Johnson, S. Wu,  Y. Nouhi (2004). Socially intelligent pronunciation feedback for second language learning, / iVoceWgs o/f/ie 恥/foAo/ ow 5oc/fl/ awe 五motio朋/ /wfe/〃gewce zw丄earmwg五Wrowwewte 决e 2004 /wtemarioAK / Co^/fewce rtog参睹

  http:〃。该出书物的一齐实质并 入本文行动参考。 —旦即时反应模子124选定予以研习者的反应新闻,可能将 其输出。这一输出可能通过众种花样中的任何一种来达成,搜罗文本、 音响纪录、合成音响、视频纪录、连接文本的动画或连接音响的动画。图17是一个图,其图示阐发互动式课程和社交互动的组件, 以及可能界说正在研习者模子中辅导和跟踪才力的才力模子的组件。技 能筑模的思法是研习者/用户的每个行动都可能通过几个方面举行分

  作为/职分=问候可能操纵才力来诠释该编制完全局限(互动式课程l、互动 式社交模仿2、其它互动式逛戏17等)的实质。如此,分别的实质组 成局限被鲜明链接到它们所辅导或学习的完全才力。更详细地

  社交互动阐发126,即对用于学习才力的互动式社交模仿2的实质 和行动的界说可能链接到才力模子3中详细的项目上。这些链接指示 出正在这一社交互动中学习了什么样的才力。比方,可能将会话链接到 诸如拥戴地问候(职分才力)或颜色名称(词汇才力)或手 掌放正在心脏上的姿态(文明才力)的才力上。可能有零个或众个到任 何类型才力的链接。

  互动式课程阐发127,即对互动式课程1的实质的阐发,可能被链 接到才力模子3中的详细项目上。这些链接指示正在这一课程实质中教 导了什么样的才力。比方,可能将才力构制器1中详细的页面链接到 上述指定的任何才力或其它任何才力上。同样地,可能有零个或众个 到任何类型才力的链接。假设社交互动阐发或互动式课程阐发的花样为XML,则可

  说话类型的才力浮现正在完全的外达中。模仿该新闻的一个可替换方 法是通过说话才力来诠释外达。另一个可替换要领是操纵说话模子, 其通过对比与语法、语形、词法、词汇等闭连的新闻领会外达实质来自愿发生这一映照相闭。

  可能蓄志地修建互动式课程1中的页面(或局限页面)来辅导某些 说话才力(比方说,使动词花样产生变更)。这些页面会由它们辅导的 说话才力(可为众个)标识。编制可能操纵这一新闻来助助用户达到 研习这一才力的地方。编制可能操纵这一新闻来动态发生课程,该课 程将闭于详细说话才力的完全页面编译正在一块。可能将这一战略引进 到课程创作历程中以保障这种实质存正在。

  课程的语境可能比场景的语境更广泛(且前者遵照后者总结)。例 如,它可能包蕴与场景中所用单词类型类似的其它单词。然后研习者 可能对学问举行总结,而不单仅是正在与他们已研习的类似场景中操纵 这些单词。课程的作家不妨愿望记住这一总结历程。

  示例性会话可能助助作家探求这一总结历程。示例性会话可能不是 对社交模仿会话的逐字复制。天生课程的要领可能如下发端天生示 例性会话,然后操纵它们来界说正在该课程中要静心于哪些说话才力。

  互动式社交模仿2的会话包蕴职分/作为和说话才力。 一朝写出了 逛戏会话,作家可以确认正在此中须要针对该场景/会话来辅导的职分技 能和症结说话才力。作家可能遵照这一历程的结果来更新才力模子。

  一个要领是正在写出互动式社交模仿逛戏2的会话之前发端正在才力 模子中开荒职分才力。可能开荒出一种分类法,其从目的(职责)技 能(不妨被用于互动式社交模仿逛戏)发端,然后是职分才力,再然 后是语音行为才力。该历程可能是几次的,由于正在写出社交模仿逛戏

  说话才力和作为/职分才力之间的相闭可能是变更的。发音才力可 以统统不依赖于职分才力。语法才力和词汇才力可能局限依赖于职分 才力。正在才力模子中界说这些相干为龙l^是不不妨的。可能正在才力模 型中界说格外的链接类型来体现分别类型才力(比方,说话才力和任 务才力)之间的相闭。

  可能操纵示例性会话来卓绝正在课程中辅导的闭键才力。正在编写示例 性会话的同时,作家可能通过操纵扣问这里夸大哪些才力?和这 些才力正在哪儿辅导?的要领来勾勒出课程实质。图18是显示研习者正在操作特定才力128方面的进度的屏幕。图19是显示研习者正在局部测试129中的成效的屏幕。一朝用才力对内 容举行诠释,可能操纵该实质来助助跟踪用户的成效。图18显示了战 术伊拉克(TacticalIraqi)编制中的示例性进度申报,其通过才力显示 出研习者的成缋程度。图19显示了另一个进度申报,其遵照正在编制中 实行的测试屮他/她的分数来显示出研习者的成效程度。两个显示都基 于正在战略伊拉克(Tactical Iraqi)第1课终止的测试中具有最高评分。 才力观测更具有指示意旨,由于它告诉研习者迄今为止他/她仍旧 充实学习了哪些才力,以及还须要研习什么样的其它闭连才力(正在其 它课程中)。可能操纵才力模子3来基于研习者的才力定制课程。比方, 可能正在运转时期内动态安装补习课程来夸大研习者正在互动式社交模仿 2中发扬山有题目的才力。这可能通过操纵浏览(walks though)互动 式课程阐发127而且提取对详细才力举行诠释的页面的纯粹算法来完 成。这也可能通过更庞杂的算法完工,该算法探求首要才力的成效并 且也针对研习者发扬不是很好的那些首要才力搜集须要的资料。可能基于研习者的目的操纵才力来定制课程。比方,本发现 的一个给定施行例可能具相闭于许众分别职业的实质。编制可能扣问 研习者他/她对研习什么样的专业有兴致,并相应地通过拔取含有针对 这些专业闭连才力的资料来剪裁课程。这使得才力可能行动实质模块 化机制来作事。图20是数据界说图,其示出了被用于结构和发扬所得到技 能的才力模子的实体、相闭和属性。才力模子3可能由才力130构成, 这些才力隐含连绵到答允具有众重父代的树组织中。才力130可能具有标识符(ID) 131和/或名称132。详细用 法可能拔取操纵与名称和ID类似的字符串,或拔取操纵名称行动特殊 的标识。才力130可能具有零个或更众个父代才力133,通过它们的 ID或可选地通过它们的名称来指定。一 个才力可能具有众重父代才力。 为了便于以庄重的分类法或树形花样显示,到父代才力的链接也可能 鲜明指定该详细的父代才力可被以为是(仅有的)闭键父代134 (与所 有其它才力比拟,它是次要父代)。[144]才力可能具有类型135。可能限制一个才力唯有一利类型。 下而是该编制中迄今为止所用的类型;其它类型也是不妨的。类型以 层级花样举行显示,但正在才力阐发中行动单个名称被援用。

  网姿态社会楷模才力之间的其它链接可能搜罗一个或更众个可选的首要技 能136,即正在指定才力之前保举研习的才力。每个才力的细节可能通过以下参数阐发 》天准137,其指定针对该才力要到达的成效程度。美邦队伍操纵0 到5之间逐级增大0.5的数字来体现。咱们操纵0到5之间的整数。也 可能操纵其它标度。

  条斧138,其指定才力被测试时所处的语境(比方,布置正在外邦的 士兵)。该前提有时也可指示怎样测试才力。前提可能搜罗对以下各项 的阐发1)学生正在碰到这些前提时所答允具有的援助量,2)到达目 标的时限,或3)研习者达成目的所需的任何东西或装备。前提可能专

  指社交模仿逛戏的故事务节。比方,可能如下所述指定前提iir定沐/^正在虛裕凝鍵4/-/A^! 0逛虛欲乂激,行动箱生乂正在雳天激场浙邀,学

  —生&7力^玩耍家乂激逸存iE據逛姿夷傳正在浙遴^逛5 ^^说故适^ /冷好嫁语C卿r/fo6a 入不逛A励手,垔滞教^W银小。

  可拔取的羞^耍丝139字段,其可能被用于指定才力模子中该才力 的重耍性。这一字段的值的齐集可能是{高、中、低},数字或其它形 式。

  可拔取的; g^氷平140,其可能被用于指定针对均匀或目的研习者 来说研习该才力有众难。这一区域的值的齐集可能是{髙、中、低}, 数字或其它花样。圭臬和前提是从使能研习目的(Enabling Learning Objectives)的组织中借用的,其被美邦队伍中和其它地方的教学策画 者所用。参睹R.F. Mager (1984).尸re/ a.g /ra/n/cfto/wj:/ Wecrivas. Belmont, CA: Pitman Management and Training。该出书物的一齐实质并 入本文行动参考。难度和主要性是相对观念,由于它们依赖于详细的研习者 (对某些人来说容易的东西对其他人来说比力难,不妨对医师来说重 要的才力对制造者来说则不主要)。看待隐性或显性界说的受众来说这 些属性可能用作缺省值或均匀值。基于研习者模子可能对这些 属性的值举行调节,这些研习者模子可辨别了了分别组另外研习者的 起始(比方,与只说英语的人相。