最专业的代练平台开发!

资讯热点
智能产品设计建议以语音交互为核心功能

发布时间:2024-4-2 分类: 行业动态

如何设计智能产品,实现“人与人之间自然交流”的感觉,我们将从六个维度给出设计建议,即人物设置,外观,声音,动作,界面和灯光效果。

我们最终会以自然的方式与机器沟通

在2012年圣丹斯独立电影节上,电影《机器人与弗兰克》获得了机器人机器人照顾弗兰克与阿尔茨海默病的故事特别奖,在电影中选择了两张照片,一张是人与人之间的交流。另一个是人与机器之间的沟通。在2017年的人工智能年,人们可以像电影中的弗兰克那样以人对人的方式与机器进行交流,这在人机交互学科中被定义为“ld”;人机自然互动”

什么是自然互动?简而言之,它是在日常交流中与计算机进行交互。什么是日常沟通方式?它意味着人们通过语音,身体,手势,眼睛和表达进行互动和互动。

人机交互迈出了新的一步

人机交互(HCI)的发展是从人类适应计算机到计算机适应人类的过程。它分为四个阶段:代码指令交互,图形用户界面交互,人机自然交互和人机情感交互。 [引自《人机情感交互》】

每个阶段的发展都基于技术,它带来了更多的人机交互,更接近人与人之间的自然互动。同时,它将拓宽更多的使用场景并覆盖所有年龄段。大家。如下图所示,命令–专业技术人员操作早期计算机;鼠标和键盘–受过教育的普通人使用PC学习;触摸屏–更多人使用智能手机进行社交,信息,娱乐等活动;自然互动–每个人都会以自然的方式与智能产品互动。

随着人工智能技术的发展,智能产品在感性层面的能力越来越强。它可以感知人的声音,肢体语言,手势,表情等,并实现人与机器之间自然交互的可能性。这种情况正在发生。事情。

未来智能产品的趋势是拥有情感计算,通过识别人类语音信息,面部表情,身体动作等,调整自己的反馈,以适应当下人们的需求,互动将成为它变得越来越容易,它会更好地了解你。

智能产品可以感知人们的自然运动并阅读人们的情感,所有这些都属于信息输入层面。在信息输出层面,如何设计智能产品可以达到“人与人之间自然交流”的感觉。为此,我们将从六个维度给出设计建议,即角色设置,外观建模,语音,动作,界面。和光效。正如对方的气质,外表,声音特征,肢体语言,表情和眼睛相互沟通一样。

以语音交互为核心功能的智能产品设计建议

1.角色设定的设计建议1人是为用户服务;

这个人是一个高级化身设计,不是由设计师的个人喜好绘制的。有必要充分考虑产品服务的目标用户。例如,患者想要看专科医生。乘客希望获得乘务员的甜蜜服务。 Bin的商店很好客,这些图像在我们的脑海中生动。例如,Amazon Echo是成熟职业女性的形象(类似于Google Home,天猫精灵,京东等),而Olly给人一种设计感,他们为目标受众设定了形象。可以通过抽象方法传达2个人,不一定是比喻;

例如,小米的智能音箱定义“小爱同学”是一个二维图像。今年11月底,手工制作限量版,图像落入具体物体。在这方面,仁者看到智者,看到智慧,有人说她不在“小爱”的心中,所以在人们的形象传播中,我们建议通过艺术来达到目的,例如使用音乐,绘画,文学,电影艺术和其他艺术被抽象成一组视觉传达,达到“空山不被看见,但人类的声音被听到”的境界。 3人应与产品结合使用;

以语音交互为核心功能的智能产品,其“声音”将允许用户自动关联相应的图像,还需要考虑与外观匹配以满足用户期望。一些智能产品有动作输出。例如,一个人被定义为一个愚蠢的jibo,它的动作必须是有趣和可爱的。如果你不考虑它,它将导致认知失调的差距。例如,当一条鱼在家时,当用户询问它有多大时,它会以成熟女人的声音回答。 “我今年两岁了”,而亚马逊Echo答案是“我根据人类的年龄两岁”,后者更容易接受和理解,即使是一个微不足道的文字也可能让用户“玩”因此人们应该考虑整个产品的信息输出水平。

2.外观设计的设计建议

1充分考虑目标用户的审美和偏好;

根据目标群体创造自己喜欢的外观,例如,孩子们会比Jcho更喜欢jibo,追求新潮流的人更喜欢raven R,因为他们可以和他们一起唱歌和跳舞。与基于屏幕的智能手机不同,用户无法更改主题皮肤以找到自己的首选项,而Google Home只能通过“换裤子”来满足用户偏好和家居风格。

2考虑基于使用场景的建模;

有必要考虑用户将使用哪种真实环境。目前,市场上的大多数智能语音产品都放在桌面上,必须认真考虑尺寸。例如,如果点更大或更重,则在任何地方自由移动都是不方便的。 Put,如果定义为多个使用场景,那么便携式可以做到这一点。例如,在乌鸦H的顶部,点阵触摸屏“rdquo;覆盖时,用户可以轻松移除语音和手指的交互,因此不受固定位置的限制。

3避免陷入恐怖之谷;

避免与人类特征过度相似。建议使用抽象方法提取拟人元素进行设计表达,有助于产品向用户传达情感信息,从而有效提升用户的善意。例如,Weilai ES8携带的人工智能,以及百度的秘密,就是通过这种设计方法创造一种智能的情感互动,并将工业产品升级为生活和情感的新伙伴。

然而,如果它与人类的特征太相似,那么现阶段的技术能力就像人类一样不可能是现实和现实的,而且声音,表情和动作都无法达到完美的匹配。因此,这种不起眼的设计会给用户带来不好的影响。心灵体验,如Blue Frog Robotics的Buddy,让用户很容易陷入“恐怖谷”。

“恐怖谷理论”由日本机器人专家森长虹提出。他认为人形玩具或机器人的模拟越高,人们感觉越好,但当达到临界点时,商誉的程度会突然降低。更多人感到恐惧,直到山谷的底部,称为恐怖之谷。如图所示,山谷底部的活跃僵尸比静止的尸体更可怕,即使尸体是可怕的。

3.语音设计建议

1自然感;

避免单调,表现得像一个人,说话积极,有意识的感觉,每个音素都清晰可辨和自然。人类语音信息包含语音声学特征和文本语义。语音声学特征主要是韵律特征(指音素被组合成句子的方式),包括音调,重音,暂停,速度等。中文是一种音调语言,音调携带非常重要的情感信息。语音是一种自然的交互,它需要达到“自然”的感觉,以使用户感觉可用。

如何让Siri听起来像个人一样自然?

iOS11版本的Siri升级目标是“让Siri听起来像人类一样自然”。实现它的方法是通过深度学习,每个表达都有略微不同的声波,每个句子包含几十个或几个数百个音素,Siri发现每个发声的完美声音组合。这些音素由Apple选择的候选人收集。情感语料库的获得是苹果匿名听,然后用它进行深度学习。训练。

2一旦确定,“个人之声”不应随意改变;

一旦该人设置的语音植根于用户耳中,则不建议随意更改。如果将移动电话界面改变为背景图像,则其就像是更换新衣服的人,并且将具有语音交互作为核心功能的智能产品替换为“声音”。就像重新认识一个陌生人一样,古老的谚语说:“如果你闻到它,如果你看到某人,”人们自然会将声音与某人联系起来。如果新的声音是,它将重新运行。人物造型”

3对话就像人和人一样;

首先是对话是顺利和及时的反馈。如果有暂停,则不应该太长。这些词语简短而有效。不要积极停止对话,尽可能促进持续沟通。当然,您不能让用户以命令的形式完成某项任务。这不是一个恰当的对话。它可能就像上级和下级之间的关系。用户带来怨恨和抵抗。

4在感知用户后尝试发起对话;

在几天之内,Amazon Echo可能能够根据说话者的语音情感进行识别计算。通过韵律特征(天赋,响度,节奏,语音质量等),用户可以像电影一样理解句子的当前心理状态。《Her》中的一行“你今天听起来有点不高兴”,它可以感知到你并尝试发起对话。

4.设计行动建议

1在考虑当地风俗习惯的同时,使用国际认可的认知运动进行交流;

例如,手势是普遍的,它意味着“我爱你”,而“中指”并不认为它只是在国内使用,而是普遍的“侮辱”。在保加利亚,点头和降低意味着“消极”,摇头肯定,这是一个智能产品,使用交互式反馈进行操作,并且需要考虑用户所在的国家,如果不考虑,希腊用户Don'当你对智能产品竖起大拇指时,感到高兴,这意味着愤怒。

2平滑运动,以避免僵硬;

这将给用户一种更自然的感觉,就像一个人中的jibo曲折,或者如果乌鸦R与音乐共舞,它可以补充声音的输出。查看10秒短视频>

3,以防止意外伤害人;

例如,可以移动和移动的Buddy可以达到70cm/s的最大速度,并且其自身重量为5kg。当它以这种速度撞击人时,会造成伤害,因此有必要考虑采取保护措施。当输出动作时,建议保持温和,以防止速度太快而且力太大,这容易对人造成伤害,并且设计应避免剧烈运动。

4触摸动作反馈;

例如,Mayfield Robotics的Kuri头部有一个触摸传感器。当你触摸它的头部时,它会抬起头来平稳地抬头看着你。这是与触摸相对应的动作反馈,并让用户感知它。这与人们沟通一样自然。

5.界面的设计建议

1个重输出,光输入;

与触摸屏手机不同,以语音交互为核心功能的智能产品界面主要用于信息输出显示,而不是输入操作,不引导用户依赖界面进行交互,最小化或削弱此类场景,并尽可能引导用户。通过语音互动。关于显示器是否应该在智能产品的结构内,各方的意见是不同的。亚马逊秀几乎与触摸屏界面一致。 jibo显示器不仅是一体式头部形状,而且还是一个像眼睛的图形。它也可以转换成触摸屏界面。 Raven R与众不同。它的头部就像一个显示界面,但它是由光点排列,以简化图形通信。它不是传统的触摸屏界面,但可以触摸它。相互作用。在界面输入三者之间的比较中,亚马逊秀比jibo和raven R更重要,体验将很容易引导用户查看屏幕,用户下意识地有触摸互动的冲动。

2信息输出应精简有效;

首先,在设计元素上使用全局设计隐喻,它简单明了。不建议使用复杂的线条,并且元素之间的建议边界清晰。在有限的显示界面中,一次只传送一个关键信息,并且核心被突出显示,从而可以容易地看到中距离和长距离,并且可以看到一目了然。在文本输出中,您必须精炼,没有段落式文本,您可以从Apple Watch拨号界面的设计中学习。

3界面动力学应该简短且可重复;

与基于GUI的产品的不同之处在于用户并不总是盯着屏幕,所以他们决定添加界面效果。建议快速完整地完成整个表达,并且为了避免用户丢失,关键效果可能是重复循环无法保持重播,因此您不会感到无聊,如此流畅,有趣和可重放的重放应该一起考虑。

6.关于灯光效果的设计建议

1与交互式反馈相匹配,每个州都清楚地传达了信息;

就像人与人之间的对话过程一样,灯光效果也可以是自然反馈。有四种反馈状态值得考虑:唤醒,输入,理解和行动。例如,为了唤醒当下的光效,就像打电话给另一方的名字一样,会有反应;当用户输入语音时,必须具有收听状态的光效;当它处理用户的语音信息时,有必要让人感觉它被理解,就像人们在思考时转动的眼睛一样;最后一个是当它是声音输出时,灯光效果与更令人印象深刻的感觉相结合。

2不要挑战国际公认的通用颜色;

例如,建议使用国际通用颜色的提示灯,红色不可用,黄色可疑,绿色正常。还需要考虑品牌色彩的传播,以及色彩心理学的问题。当Amazon Echo关闭语音功能时,光环带是红色的,当它正在运行时,蓝色被用作主色,而蓝色是大多数人认为是技术的颜色。

3光的动态自然反应;

例如,当Amazon Dot被唤醒时,其环形灯将像流一样照亮,并且可以识别声音的方向,并且照亮声音源处的光,而lynx的动态较弱,仅有光光源变暗,无物理位置变化,自然流量反馈较少。

4亮度和环境光匹配;

这非常类似于智能手机的光敏元件。它可以根据环境光线自动调节屏幕亮度,保护眼睛舒适。因此,在灯关闭后的卧室中,智能产品的灯需要变暗。实质上,只给出了人机交互反馈。照明系统冲突。

结论与思考

以语音交互为核心功能的智能产品设计建议我们从六个维度探索,重点是智能产品的输出水平,如何设计实现更自然的互动反馈,更好地传达情感。文章中提到的大多数产品已在市场上发布。随着人工智能的发展,将出现更多的“新物种”,它们的发展趋势将更容易互动,没有任何例外。基于新的技术能力,对需求的反馈更加体贴,新的设计方案将诞生。

对于用户,我希望与智能产品建立友好的信任。我使用它越多,我就越好用它。我们也将触动iPhone时代的心灵,欢迎AI时代的核心-----认识我,我在心里生活了很长时间。

这篇原创文章仅供学习之用。如果您有其他用途,请与我们联系以获取原始文本。请注明:本文来自百度地图服务生态UE团队

« 刘强东:今年年底,它将每天开设1000家便利店 | Linxee领导LX0801闪耀香港全球电子展,专注于中国之枣 »