在去年的Google I / O上,Google推出了Live Caption,这是一种可访问性功能,可以转录在设备上播放的音频。Live Caption使用Android的AudioPlaybackCaptureConfiguration API捕获来自设备的音频,并通过三个设备上的机器学习模型运行该音频,以从识别出的任何英语语音中生成字幕。最早支持Live Caption的设备是Pixel 4和Pixel 4 XL,但Google后来扩展了对Pixel 2和2 XL,Pixel 3和3a系列,三星Galaxy S20系列,OnePlus 7T系列,OnePlus 8系列,在万普拉斯诺德,现在是新的Pixel 4a。不过,随着Google Pixel 4a的发布,Live Caption进行了首次功能升级:能够通过电话检测和转录语音。
我们在4月份负责实时字幕的应用程序Device Personalization Services拆除时首次发现了有关此新功能的提示。这些字符串表明用户将可以在电话通话中选择录入音频,如果他们选择这样做,则将在通话中向其他人宣布其功能的使用。启用该功能后,通话中的其他各方将听到以下内容:“嗨,您要与之通话的人已打开通话字幕。他们会看到您所说的内容的标题,以帮助他们继续聆听。” 这将适用于语音和视频通话,并支持Telegram,Facebook Messenger,WhatsApp等应用程序。
除了引入电话录音功能外,Google还没有宣布对Live Caption进行任何其他改进。它仍然仅适用于英语语音,并且不适用于各种媒体。但是,Google可能会继续添加新功能,并且将来Google可能会继续扩展对其他设备的支持。Google表示,转录电话将首先可用于具有Live Caption的其他Pixel设备(特别是Pixel 2,Pixel 3,Pixel 3a和Pixel 4),但很可能会推广到上述具有功能,但我们没有确切的可用性或时间表确认。但是,一旦发现,我们将更新本文。