目前,人机交流的发展在很大程度上由消费者驱动
会话商务基本上是人和机器间的语言交流。目前,消费者已经在使用这样的产品,例如亚马逊的 Alexa Voice Service,它可以通过 Echo 扬声器回答向其提出的问题。您可以让 Alexa 播放音乐,询问它关于新闻、体育比赛结果或天气预报的信息。
2018 年 1 月于拉斯维加斯举行的消费电子展 CES 上,您可以看到数百款 用智能联网扬声器。2017 年第三季度,亚马逊智能扬声器的出货量同比增长了 498%。2017 年共售出 500 万台。目前该 域的发展在很大程度上由消费者驱动,同时会话商务和手势识别也开始应用在汽车行业中。
系统 会话商务达到什么水平?
从广义上讲,会话商务就是我们如何使系统适应人的行为和做事方式。通常,它基于机器学习,机器学习从识别声音、运动和形状开始。通过机器学习,用户界面向支持自然的人类行为的方向发展;在未来,我们不会像现在这样频繁地使用手机和平板电脑。此外,由设备构成的实体和它们的管理系统日益智能,同时它们的使用也日益简单和直观。
值得注意的 点是,该系统必须能够区分声音和语音。通过语音识别,机器能知道正在发生什么,例如在 中,它能否根据声音判断冰箱门被打开、水管损坏或出现了窃贼。原则是:“让耳朵听到眼睛看不见的东西。”上述应用程序不需对话,但是机器必须能够建立合理的因果关系。
理解互动和创建理性对话是挑战
会话的建模也是 个重要因素。当人与会话应用程序交谈时,实际上是与它背后的系统交谈,他对会话的推进有 定的 入为主观念。这要求 UI 设计者构建 个对话框,让人能感觉到这个对话框有意义并且符合他的期望。在某些交流情况下,言语交流的可能非常有限:如果我们要求打开外门,我们不期望系统用许多词语回答我们。
理解并告诉用户系统在对话中的角色,这 点至关重要。同样重要的是让系统明白,用户需要从系统中得到什么。如果没有这种相互理解和背景知识,对话就无法成功。
背景噪音也在传递信息
通常,不仅仅是用户和系统之间的信息交换。系统还可以根据对话背景中的噪音来理解是否应该让对话继续进行下去,或者通过聊天机器人进行。对话地点不必苛求,可以是满载乘客的公共汽车或火车;影响同行者的游客对话情境,或危及公司信息安全的对话情境。
目前,我们正处于规划人机对话的早期阶段,成功的解决方案需要合理的对话规划。同样重要的是,要明白这是补充的渠道,而不是用来替代的渠道。但在不久的将来,人与系统的对话将在消费环境和商业 中开辟出引人关注的新天地。
会话商务需要设计和人工智能
如前所述,成功的会话商务需要以用户为中心的同理心情境设计,以便检测会话背后的行为、意图、语调和目的。人类觉得顺理成章的东西对计算机系统来说并不那么容易。成功的会话商务解决方案还需要丰富的全栈技术,以实现语音到文本的转换、会话设计、音调和音频分析,以及复杂的企业信息汇总编排。这就是 Symbio 使用 IBM 会话服务并与 IBM 合作的原因。IBM 会话服务可以让 Symbio 专注于 终用户和会话。