六条规则让你的ML模型部署的更快

字幕组双语原文:六点规则让你的ML模型部署的更快

翻译:雷锋字幕组(yhfwww)

在我们的组织中,我们需要尽快从我们的分析投资中获得回报。我们需要更快地将机器学习模型应用到生产中。最重要的是,我们不想让伟大的想法停留在纸面上,只能等着被使用。

5.构建一个支持模型整个生命周期的平台。

容器提供了一种很好的隔离和模型版本管理的方法。如果您的组织使用标准服务器负载,您可能会发现很难在该标准服务器上安装依赖项和构件。容器解决了这个问题。可能服务器管理员安装程序包的时间太长。容器也能解决这个问题。您可能需要托管同一模型的新版本和旧版本一段时间,每个版本都需要一组不同的依赖关系。容器也有助于版本控制策略。

3.数据科学家需要关心代码质量。

这可能意味着你的模型构建团队必须提升他们的软件工程水平。了解一点Python语法并调用API并不能使您成为一名优秀的软件工程师。当您构建组织将在生产系统中使用的软件时,软件质量至少与数据和模型质量同等重要。

一路上我们学到了什么

因此,我们建立了一条流水线来构建、测试和部署数据产品,我们称之为机器学习平台。有了它,我们现在可以在几分钟内将模型部署到生产环境中。我们不再需要等那么长时间才能享受分析投资的回报。

数据科学和机器学习几乎可以改善组织的任何方面,但前提是你的想法得到利用。在过去的一年中,我们学到了很多关于更快地构建和部署机器学习模型的知识,我们想分享一些我们在这里学到的东西。

如果,你也是位热爱分享的AI爱好者。欢迎与雷锋字幕组一起,学习新知,分享成长。

雷锋网雷锋网(公众号:雷锋网)

到目前为止,我主要关注构建、培训和部署,但这只是机器学习模型生命周期的第一部分。许多型号都会逐渐变差,随着时间的推移性能会下降。部署的模型需要监控和调整。每个部署的模型都应该记录所有的输入、输出和异常。模型部署平台需要提供日志存储和模型性能可视化。

软件工程师已经提出了很棒的方法和设计模式,我们可以用它们来构建可移植的和有弹性的应用程序。如果您的模型构建者知道这些方法,那么其中许多方法可以很容易地适应机器学习应用程序。利用外面的东西。

老实说G-Sync技术应该是最好的防撕裂技术,但是由于NV的授权费用加上需要专门的控制芯片,导致价格高昂,不是一般的消费者所能承受。Free-Sync虽然便宜但只能A卡使用。于是就有了Adaptive-Sync同步技术。

但是,这是值得的。过去有时需要12个月的时间,现在在我们公司只需要几分钟。更重要的是,我们不是在构建分析书架软件。

机器学习平台的非官方座右铭 -    noShelfWare

在我们的机器学习平台上,每个模型将每次执行记录为一个通用格式。每个托管模型应用程序都以一种通用的方式发出日志。我们路由和存储这些日志,使用它们监视模型性能并帮助识别模型漂移。最后,我们会自动创建模型仪表板,以提供关于每个模型如何执行的额外见解。

将这六条规则结合起来有助于我们更快地获得结果,我希望它们也能帮助贵公司。数据科学应该是创造有影响力的软件。白皮书、仪表盘、词云和饼图再也不能削减开支了,如果他们真的这样做的话。取得成果需要很困难的工作。

暗场平衡技术通过优化黑暗场景的算法,在明亮区域不过曝的情况下,提升暗部区域的明亮度和对比度,能够很清楚的看到隐藏在黑暗场景中的敌人。

在我们的机器学习平台存在之前,数据科学家创建的模型将交给IT部门,这样他们就可以为每个模型创建数据管道和模型部署环境。有些模型在部署之前甚至被重写成另一种语言。

如果没有暗场平衡技术,单纯提高显示器的亮度和对比度,会让原本明亮的地方由于过曝而损伤视力。

这不是一条容易的路。史蒂夫·乔布斯说:“伟大的创意和伟大的产品之间还有着大量的工程步骤。”要想快速进入市场,你可能需要戴上DevOps的帽子。这意味着你的团队可能需要提升他们的软件工程技能。

在很多FPS竞技游戏中,快速移动的情况下枪支的准星会放大很多倍,无法准确瞄准敌人。GF270I显示器提供了物理准星,即便是在快速移动的情况下,准星都始终不变。

传统上,我们将为每个数据产品构建为定制解决方案。每个定制解决方案之间几乎没有重用。我们需要的是一条生产数据产品的流水线。

团队成员有大数据专家、算法工程师、图像处理工程师、产品经理、产品运营、IT咨询人、在校师生;志愿者们来自IBM、AVL、Adobe、阿里、百度等知名企业,北大、清华、港大、中科院、南卡罗莱纳大学、早稻田大学等海内外高校研究所。

平台的速度和稳定性都依赖于模型部署平台和过程的自动化。如果你想更快,那就毫不妥协地采用自动化。在我们的机器学习平台上,我们已经自动化了整个模型生命周期。持续集成和持续交付推动了平台上的模型测试和模型部署。

我们还自动化了底层平台基础设施的配置和部署。在这样做的过程中,我们的团队学会了将这些自动化虚拟机视为一次性资源。没有人登录到服务器进行管理,所有管理任务都是自动化的。这意味着无论我们扩展多少,每个服务器都是一致配置的。我们没有升级服务器,而是用新的基础设施自动重新部署平台。

4.如果它不是自动化的,那它就还没完成。

在这个过程中,我们学习了一些关于如何安全、快速地构建、测试和部署机器学习模型的重要规则。这些规则改变了我们的工作方式,希望您会发现它们对您和您的组织有用。

攀升电脑GF270i显示器有3个专为游戏玩家而开发的技术。

密切关注模型性能是有效管理机器学习模型生命周期的关键。不能忽视模型监视作为模型整个生命周期的一部分。

雷锋字幕组是一个由 AI 爱好者组成的翻译团队,汇聚五百多位志愿者的力量,分享最新的海外AI资讯,交流关于人工智能技术领域的行业变革与技术创新的见解。

我们构建了机器学习平台,为模型构建者提供了通过内部模型管理流程自主部署模型的能力。自助服务是提高速度的关键。

在电竞游戏中,如果有玩家躲在暗处会很难被发现,这个时候GF270I显示器的“暗场平衡”技术就能发挥作用了。

2.使用容器从基础设施中提供抽象

Adaptive-Sync技术包含了FreeSync同时兼容G-Sync,也就是说同时能在A卡和N卡上开启画面防撕裂技术,但是成本与FreeSync一样。

让您的数据科学家能够自助服务地将模型部署到生产环境中,同时还要负责编写产品质量代码。

这可能意味着采用诸如测试驱动开发和代码评审之类的实践。这可能意味着尝试配对编程。在使用notebook时,您应该仔细考虑如何以及何时使用笔记本,以及对软件质量的影响。幸运的是,这些模式在软件工程界是众所周知的,并且非常适合大多数团队。

您的企业可能是全云的,有云的,或者没有云的,但是即使您当前没有使用云,您也可能在考虑它。容器非常轻便。如果您采用基于容器的方法,您可以在本地或云上的任何地方运行这些模型。

雷锋网版权文章,。详情见转载须知。

GF270I显示器的物理准星直接通过显示器的快捷键调出,支持3种准星模式,玩家可以选择适合自己的准星进行游戏。