智能产品设计建议以语音交互为核心功能

最专业的代练平台开发！

资讯热点

当前位置：首页 > 行业动态 > 智能产品设计建议以语音交互为核心功能

智能产品设计建议以语音交互为核心功能

发布时间：2024-4-2 分类：行业动态

如何设计智能产品，实现“人与人之间自然交流”的感觉，我们将从六个维度给出设计建议，即人物设置，外观，声音，动作，界面和灯光效果。

我们最终会以自然的方式与机器沟通

在2012年圣丹斯独立电影节上，电影《机器人与弗兰克》获得了机器人机器人照顾弗兰克与阿尔茨海默病的故事特别奖，在电影中选择了两张照片，一张是人与人之间的交流。另一个是人与机器之间的沟通。在2017年的人工智能年，人们可以像电影中的弗兰克那样以人对人的方式与机器进行交流，这在人机交互学科中被定义为“ld”;人机自然互动”

什么是自然互动？简而言之，它是在日常交流中与计算机进行交互。什么是日常沟通方式？它意味着人们通过语音，身体，手势，眼睛和表达进行互动和互动。

人机交互迈出了新的一步

人机交互（HCI）的发展是从人类适应计算机到计算机适应人类的过程。它分为四个阶段：代码指令交互，图形用户界面交互，人机自然交互和人机情感交互。 [引自《人机情感交互》】

每个阶段的发展都基于技术，它带来了更多的人机交互，更接近人与人之间的自然互动。同时，它将拓宽更多的使用场景并覆盖所有年龄段。大家。如下图所示，命令–专业技术人员操作早期计算机;鼠标和键盘–受过教育的普通人使用PC学习;触摸屏–更多人使用智能手机进行社交，信息，娱乐等活动;自然互动–每个人都会以自然的方式与智能产品互动。

随着人工智能技术的发展，智能产品在感性层面的能力越来越强。它可以感知人的声音，肢体语言，手势，表情等，并实现人与机器之间自然交互的可能性。这种情况正在发生。事情。

未来智能产品的趋势是拥有情感计算，通过识别人类语音信息，面部表情，身体动作等，调整自己的反馈，以适应当下人们的需求，互动将成为它变得越来越容易，它会更好地了解你。

智能产品可以感知人们的自然运动并阅读人们的情感，所有这些都属于信息输入层面。在信息输出层面，如何设计智能产品可以达到“人与人之间自然交流”的感觉。为此，我们将从六个维度给出设计建议，即角色设置，外观建模，语音，动作，界面。和光效。正如对方的气质，外表，声音特征，肢体语言，表情和眼睛相互沟通一样。

以语音交互为核心功能的智能产品设计建议

1.角色设定的设计建议1人是为用户服务;

这个人是一个高级化身设计，不是由设计师的个人喜好绘制的。有必要充分考虑产品服务的目标用户。例如，患者想要看专科医生。乘客希望获得乘务员的甜蜜服务。 Bin的商店很好客，这些图像在我们的脑海中生动。例如，Amazon Echo是成熟职业女性的形象（类似于Google Home，天猫精灵，京东等），而Olly给人一种设计感，他们为目标受众设定了形象。可以通过抽象方法传达2个人，不一定是比喻;

例如，小米的智能音箱定义“小爱同学”是一个二维图像。今年11月底，手工制作限量版，图像落入具体物体。在这方面，仁者看到智者，看到智慧，有人说她不在“小爱”的心中，所以在人们的形象传播中，我们建议通过艺术来达到目的，例如使用音乐，绘画，文学，电影艺术和其他艺术被抽象成一组视觉传达，达到“空山不被看见，但人类的声音被听到”的境界。 3人应与产品结合使用;

以语音交互为核心功能的智能产品，其“声音”将允许用户自动关联相应的图像，还需要考虑与外观匹配以满足用户期望。一些智能产品有动作输出。例如，一个人被定义为一个愚蠢的jibo，它的动作必须是有趣和可爱的。如果你不考虑它，它将导致认知失调的差距。例如，当一条鱼在家时，当用户询问它有多大时，它会以成熟女人的声音回答。 “我今年两岁了”，而亚马逊Echo答案是“我根据人类的年龄两岁”，后者更容易接受和理解，即使是一个微不足道的文字也可能让用户“玩”因此人们应该考虑整个产品的信息输出水平。

2.外观设计的设计建议

1充分考虑目标用户的审美和偏好;

根据目标群体创造自己喜欢的外观，例如，孩子们会比Jcho更喜欢jibo，追求新潮流的人更喜欢raven R，因为他们可以和他们一起唱歌和跳舞。与基于屏幕的智能手机不同，用户无法更改主题皮肤以找到自己的首选项，而Google Home只能通过“换裤子”来满足用户偏好和家居风格。

2考虑基于使用场景的建模;

有必要考虑用户将使用哪种真实环境。目前，市场上的大多数智能语音产品都放在桌面上，必须认真考虑尺寸。例如，如果点更大或更重，则在任何地方自由移动都是不方便的。 Put，如果定义为多个使用场景，那么便携式可以做到这一点。例如，在乌鸦H的顶部，点阵触摸屏“rdquo;覆盖时，用户可以轻松移除语音和手指的交互，因此不受固定位置的限制。

3避免陷入恐怖之谷;

避免与人类特征过度相似。建议使用抽象方法提取拟人元素进行设计表达，有助于产品向用户传达情感信息，从而有效提升用户的善意。例如，Weilai ES8携带的人工智能，以及百度的秘密，就是通过这种设计方法创造一种智能的情感互动，并将工业产品升级为生活和情感的新伙伴。

然而，如果它与人类的特征太相似，那么现阶段的技术能力就像人类一样不可能是现实和现实的，而且声音，表情和动作都无法达到完美的匹配。因此，这种不起眼的设计会给用户带来不好的影响。心灵体验，如Blue Frog Robotics的Buddy，让用户很容易陷入“恐怖谷”。

“恐怖谷理论”由日本机器人专家森长虹提出。他认为人形玩具或机器人的模拟越高，人们感觉越好，但当达到临界点时，商誉的程度会突然降低。更多人感到恐惧，直到山谷的底部，称为恐怖之谷。如图所示，山谷底部的活跃僵尸比静止的尸体更可怕，即使尸体是可怕的。

3.语音设计建议

1自然感;

避免单调，表现得像一个人，说话积极，有意识的感觉，每个音素都清晰可辨和自然。人类语音信息包含语音声学特征和文本语义。语音声学特征主要是韵律特征（指音素被组合成句子的方式），包括音调，重音，暂停，速度等。中文是一种音调语言，音调携带非常重要的情感信息。语音是一种自然的交互，它需要达到“自然”的感觉，以使用户感觉可用。

如何让Siri听起来像个人一样自然？

iOS11版本的Siri升级目标是“让Siri听起来像人类一样自然”。实现它的方法是通过深度学习，每个表达都有略微不同的声波，每个句子包含几十个或几个数百个音素，Siri发现每个发声的完美声音组合。这些音素由Apple选择的候选人收集。情感语料库的获得是苹果匿名听，然后用它进行深度学习。训练。

2一旦确定，“个人之声”不应随意改变;

一旦该人设置的语音植根于用户耳中，则不建议随意更改。如果将移动电话界面改变为背景图像，则其就像是更换新衣服的人，并且将具有语音交互作为核心功能的智能产品替换为“声音”。就像重新认识一个陌生人一样，古老的谚语说：“如果你闻到它，如果你看到某人，”人们自然会将声音与某人联系起来。如果新的声音是，它将重新运行。人物造型”

3对话就像人和人一样;

首先是对话是顺利和及时的反馈。如果有暂停，则不应该太长。这些词语简短而有效。不要积极停止对话，尽可能促进持续沟通。当然，您不能让用户以命令的形式完成某项任务。这不是一个恰当的对话。它可能就像上级和下级之间的关系。用户带来怨恨和抵抗。

4在感知用户后尝试发起对话;

在几天之内，Amazon Echo可能能够根据说话者的语音情感进行识别计算。通过韵律特征（天赋，响度，节奏，语音质量等），用户可以像电影一样理解句子的当前心理状态。《Her》中的一行“你今天听起来有点不高兴”，它可以感知到你并尝试发起对话。

4.设计行动建议

1在考虑当地风俗习惯的同时，使用国际认可的认知运动进行交流;

例如，手势是普遍的，它意味着“我爱你”，而“中指”并不认为它只是在国内使用，而是普遍的“侮辱”。在保加利亚，点头和降低意味着“消极”，摇头肯定，这是一个智能产品，使用交互式反馈进行操作，并且需要考虑用户所在的国家，如果不考虑，希腊用户Don'当你对智能产品竖起大拇指时，感到高兴，这意味着愤怒。

2平滑运动，以避免僵硬;

这将给用户一种更自然的感觉，就像一个人中的jibo曲折，或者如果乌鸦R与音乐共舞，它可以补充声音的输出。查看10秒短视频>

3，以防止意外伤害人;

例如，可以移动和移动的Buddy可以达到70cm/s的最大速度，并且其自身重量为5kg。当它以这种速度撞击人时，会造成伤害，因此有必要考虑采取保护措施。当输出动作时，建议保持温和，以防止速度太快而且力太大，这容易对人造成伤害，并且设计应避免剧烈运动。

4触摸动作反馈;

例如，Mayfield Robotics的Kuri头部有一个触摸传感器。当你触摸它的头部时，它会抬起头来平稳地抬头看着你。这是与触摸相对应的动作反馈，并让用户感知它。这与人们沟通一样自然。

5.界面的设计建议

1个重输出，光输入;

与触摸屏手机不同，以语音交互为核心功能的智能产品界面主要用于信息输出显示，而不是输入操作，不引导用户依赖界面进行交互，最小化或削弱此类场景，并尽可能引导用户。通过语音互动。关于显示器是否应该在智能产品的结构内，各方的意见是不同的。亚马逊秀几乎与触摸屏界面一致。 jibo显示器不仅是一体式头部形状，而且还是一个像眼睛的图形。它也可以转换成触摸屏界面。 Raven R与众不同。它的头部就像一个显示界面，但它是由光点排列，以简化图形通信。它不是传统的触摸屏界面，但可以触摸它。相互作用。在界面输入三者之间的比较中，亚马逊秀比jibo和raven R更重要，体验将很容易引导用户查看屏幕，用户下意识地有触摸互动的冲动。

2信息输出应精简有效;

首先，在设计元素上使用全局设计隐喻，它简单明了。不建议使用复杂的线条，并且元素之间的建议边界清晰。在有限的显示界面中，一次只传送一个关键信息，并且核心被突出显示，从而可以容易地看到中距离和长距离，并且可以看到一目了然。在文本输出中，您必须精炼，没有段落式文本，您可以从Apple Watch拨号界面的设计中学习。

3界面动力学应该简短且可重复;

与基于GUI的产品的不同之处在于用户并不总是盯着屏幕，所以他们决定添加界面效果。建议快速完整地完成整个表达，并且为了避免用户丢失，关键效果可能是重复循环无法保持重播，因此您不会感到无聊，如此流畅，有趣和可重放的重放应该一起考虑。

6.关于灯光效果的设计建议

1与交互式反馈相匹配，每个州都清楚地传达了信息;

就像人与人之间的对话过程一样，灯光效果也可以是自然反馈。有四种反馈状态值得考虑：唤醒，输入，理解和行动。例如，为了唤醒当下的光效，就像打电话给另一方的名字一样，会有反应;当用户输入语音时，必须具有收听状态的光效;当它处理用户的语音信息时，有必要让人感觉它被理解，就像人们在思考时转动的眼睛一样;最后一个是当它是声音输出时，灯光效果与更令人印象深刻的感觉相结合。

2不要挑战国际公认的通用颜色;

例如，建议使用国际通用颜色的提示灯，红色不可用，黄色可疑，绿色正常。还需要考虑品牌色彩的传播，以及色彩心理学的问题。当Amazon Echo关闭语音功能时，光环带是红色的，当它正在运行时，蓝色被用作主色，而蓝色是大多数人认为是技术的颜色。

3光的动态自然反应;

例如，当Amazon Dot被唤醒时，其环形灯将像流一样照亮，并且可以识别声音的方向，并且照亮声音源处的光，而lynx的动态较弱，仅有光光源变暗，无物理位置变化，自然流量反馈较少。

4亮度和环境光匹配;

这非常类似于智能手机的光敏元件。它可以根据环境光线自动调节屏幕亮度，保护眼睛舒适。因此，在灯关闭后的卧室中，智能产品的灯需要变暗。实质上，只给出了人机交互反馈。照明系统冲突。

结论与思考

以语音交互为核心功能的智能产品设计建议我们从六个维度探索，重点是智能产品的输出水平，如何设计实现更自然的互动反馈，更好地传达情感。文章中提到的大多数产品已在市场上发布。随着人工智能的发展，将出现更多的“新物种”，它们的发展趋势将更容易互动，没有任何例外。基于新的技术能力，对需求的反馈更加体贴，新的设计方案将诞生。

对于用户，我希望与智能产品建立友好的信任。我使用它越多，我就越好用它。我们也将触动iPhone时代的心灵，欢迎AI时代的核心-----认识我，我在心里生活了很长时间。

这篇原创文章仅供学习之用。如果您有其他用途，请与我们联系以获取原始文本。请注明：本文来自百度地图服务生态UE团队

« 刘强东：今年年底，它将每天开设1000家便利店 | Linxee领导LX0801闪耀香港全球电子展，专注于中国之枣 »

: 周一周五 8:30 - 18:00

鲁ICP备14007395号-30

百度统计

客服QQ