中国智能手机制造商OPPO在2020年计算机视觉和模式识别(CVPR)大会上展示了其一些潜在的新相机技术,该技术在该活动中获得了该公司的两个第一名和第二个三等奖。获奖的技术包括感知超高分辨率技术,视觉定位和视频中的人类活动识别。
感知极致超分辨率
在活动期间,OPPO的研究团队面临挑战,要求以16倍的放大倍数解决单个图像的感知极端超分辨率问题。挑战的目的是开发一种能够产生具有最佳感知质量并且与地面真实情况相似的高分辨率结果的AI模型。对于挑战,OPPO的团队展示了其RFB-ERSGAN神经网络的有效性,该神经网络产生了以下结果:
OPPO的神经网络帮助该公司击败了280个其他参与者,并在挑战中获得了第一名。根据有关此事的新闻稿,神经网络将被应用于包括智能手机在内的多种场景,它将能够帮助将智能手机拍摄的低分辨率照片更改为具有更多细节的高分辨率图像。其他潜在的应用包括恢复旧照片或损坏的照片,完善重要的医学图像或对卫星图像进行详细分析。
手持设备的视觉本地化
在手持设备的视觉本地化挑战中,OPPO创建了单眼视觉本地化管道,该管道利用语义和深度提示来找到任何给定图像的精确位置。OPPO的解决方案帮助公司确保了室外视觉本地化的第一名和室内视觉本地化的第三名。
这项技术的潜在用例包括增强现实应用程序,智能机器人技术或精确导航。该公司声称,配备有摄像头的AI助手将能够利用该技术分析图像并实现准确的定位,使其能够向正确的方向引导用户。
扩展视频中的活动检测
OPPO还获得了“扩展视频中的活动检测”挑战赛的第三名,该挑战要求公司设计自动活动检测算法。OPPO的解决方案旨在有效地识别和重组每个帧中的角色,并识别复杂动态视频中的数十种人类活动。
预计该技术将在未来的人机交互和体育视频分析领域中发挥重要作用。此外,这项技术还将在未来的智能手机中找到,它将使它们能够自动识别移动的物体并相应地调整相机对焦。