华琪软通国内电话信息领域中的领跑者
设为首页 | 加入收藏 | 联系我们
你所在的位置: 首页 > 公司新闻
华琪软通HaKey SoftComm

公司新闻

 对于语音技术行业中所有关于生成式人工智能和大型语言模型的讨论,目前围绕联络中心的热议,无论是虚拟的还是其他的,都是呼叫的实时转录。

  事后或滞后的呼叫转录已经存在了近二十年,在联络中心,可靠的用例推动了这一需求。大约10年前,CallMiner、Cogito、Observe.ai等公司开始认真进行实时监控和指导。

  但由于各种原因,越来越多的组织想要实时转录结果。一家大型卫生组织希望实时分析所有电话中的话题和情绪,并将结果提供给仪表板。另一个例子是,一家业务流程外包公司希望使用呼叫者的确切措辞,立即为其通话后文档捕获呼叫者对话,从而消除座席潜在的解释差异。

  许多组织都对电话字幕感兴趣,就像电视上的隐藏字幕一样,以帮助有听力障碍的员工。这也可以帮助所有座席,他们有时可能会失去注意力;带有桌面字幕的实时转录将使座席能够快速查看所说的内容并跟上对话。

  实时翻译变得如此准确,以至于一些组织正在考虑使用实时转录来促进翻译。这将允许不会说来电者语言的座席阅读她在谈话中的观点,然后使用文本对语音的方式用适当的语言键入回复。

  那么,将实时转录与其较慢的表亲区分开来的关键是什么呢?这不是一个技巧问题--是的,速度当然是一个主要要求。翻译或音频字幕等用例对延迟具有零容忍度。在这个云微服务的时代,提供从语音到文本的几乎即时转录的区别在于最新的语音识别器和良好的老式计算能力。一个汽车类比是一个更光滑的设计,阻力系数更低,发动机更强大。是的,没有更强大的发动机,汽车也可以跑得很快,但加上额外的动力和更低的阻力,你就有了速度!

  快速回顾2008年前的15年,可以发现,呼叫后语音分析的呼叫后转录计算能力相当于许多服务器、许多故障点、操作系统的大量维护和馈送、安全更新和硬件开销以及网络成本,所有这些都适用于1000至2000个并发座席的呼叫中心。而对于冗余,则加倍。如今,这种能力在跨地区始终可用的结构中运行的微服务中实现了虚拟化。现在,扩大和缩小规模的速度非常快,而且还带来了基于使用量而非峰值容量的许可成本的额外好处。云方法为50000多名座席的呼叫中心提供实时转录,这在15年前是不可能的。

  有用的实时转录的另一个关键组成部分是准确性。一个现实生活中的例子:如果你在事后阅读电话会议的录音,你不可避免地会发现从演讲到文本的奇怪翻译。但通常情况下,它们很少出现,在上下文中你可以理解所说的内容。

  在电视直播活动中播放字幕表明,缺乏准确性会使打开的字幕贬值。不可避免的是,当你需要字幕来提供你听不清的信息时,字幕会非常不准确,或者会消失。

  CCaas平台供应商在实时转录方面被要求达到更高的准确性标准,因此转向性能更高的语音到文本引擎对他们的成功至关重要。随着对实时转录的需求不断增加,提高速度和准确性的更高成本现在成为具有竞争力的"门票"的一部分。CCaaS供应商是否会将成本直接转嫁给客户,或者使用额外的功能来推动组织从内部部署转移到云,还有待观察。