别再让数据科学家管理Kubernetes

全文共字,预计学习时长7分钟来源:Pexels生产机器学习具有组织性问题。该问题是伴随其出现的副产品,因为生产机器学习出现时间相对较短。尽管更成熟的领域(如网络开发)经过数十年的探索已开发到极致,但生产机器学习还没有步入这一阶段。举个例子,假如你的任务是为初创企业建立一个产品工程团队,来负责开发某个网络应用程序。即使没有组建团队的经验,你也能找到很多有关如何建立和发展工程团队的文章和书籍。现在,假如你的公司是一家涉足机器学习的初创企业。你已经聘请了一位数据科学家来领导完成最初的工作,且成效显著。机器学习与公司产品的关系越来越紧密,数据科学家承担的责任越来越重大,很明显,机器学习团队需要发展。这种情况下,没有那么多有关如何组建生产机器学习团队的文章和书籍供人参考。这种情况十分普遍,机器学习公司的新责任(尤其是基础设施)交由数据科学家承担的情况时有发生。这样是不对的。机器学习和机器学习基础设施之间的区别来源:Pexels现在,平台工程师和产品工程师之间的区别已经很清楚了。同样,数据分析师和数据工程师之间也有着明显的不同。很多公司的机器学习仍然缺少这样的专业知识。要了解区分机器学习和机器学习基础设施为什么这么重要,这对于研究两者各自的工作内容和所需工具会很有帮助。为了设计和训练新模型,数据科学家需要:·花时间在notebook上分析数据、进行实验。·考虑数据结构、为数据集选择正确的模型体系等问题。·使用Python、R、Swift或Julia之类的编程语言。·在PyTorch或TensorFlow等机器学习框架方面有自己的见解。换句话说,数据科学家的职责、技能和工具将围绕操纵数据来开发模型,最终输出的将是能够提供最准确预测的模型。机器学习基础设施与之截然不同。将模型投入生产的普遍做法是将其作为微服务部署到云端。要将模型部署为生产应用程序界面,工程师需要:·同时


转载请注明:http://www.aierlanlan.com/grrz/7501.html