微软今天宣布,将把其开源深度学习软件“CNTK”的代码库从微软的CodePlex源代码库托管网站迁移到GitHub,这是一个托管开源项目的热门网站。
除了迁移项目,微软还放弃了自2015年4月在CodePlex上发布以来一直存在的微软研究许可证——,该许可证将软件限制为非商业用途——,并使用了更宽松的麻省理工学院许可证。
微软首席语音科学家黄在接受VentureBeat采访时表示,“我们这样做的原因是,我们希望为用户提供进行更改的灵活性。”“这加强了我们的生态系统和工具。”
深度学习是一种日益流行的人工智能。这种方法包括在一组大数据上训练人工神经网络——,例如,一个人的语音记录——,然后让他们对新数据做出推断。百度、脸书、谷歌、微软都在这个领域建立了人才库和技术,过去都发布过开源代码。
黄说,微软的Cortana个人数字助理是Windows 10的一个突出特点,它使用CNTK进行语音识别。然而,该软件也可以用于其他任务,如图像识别,甚至自然语言处理。黄说,例如,微软呼吁CNTK对在线搜索结果进行排名,并预测人们会点击的广告。
CNTK是许多通用深度学习框架之一,任何人都可以在开源的许可下使用。
但黄指出,这是唯一可以超越单个服务器扩展的处理器,它不仅仅是一个图形处理单元(GPU)。然而,即使在使用单个服务器时,CNTK在微软自己的基准测试中的表现也要优于茶诺和谷歌的TensorFlow (PDF)等替代服务器。
CNTK框架用c语言编写,与Nvidia cuDNN 4库集成,具有图像、语音和文本呈现。“我们还不支持Python,”黄说。“我们非常渴望获得社区的反馈,并改进这个平台。”
CNTK并不是第一个从CodePlex切换到GitHub的微软软件项目。完成这一旅程的其他人包括罗斯林和打字稿。