微软开源深度学习库SynapseML:可直接在系统中嵌入45种不同机器学习服务支持100多种语言文本翻译腾讯云开发者社区

为了缓解这一现状,近日,微软宣布了开源一款简单的、多语言的、大规模并行的机器学习库SynapseML(以前称为MMLSpark),以帮助开发人员简化机器学习管道的创建。微软表示,借助SynapseML,开发人员可以构建“可扩展的智能”系统来解决跨领域的挑战,包括文本分析、翻译和语音处理。

构建可用于生产的分布式ML管道通常困难,即使对于最有经验的开发人员也是如此。而对于初学者来说,组合来自不同生态系统的工具需要大量代码,而且许多框架在设计时并没有考虑到服务器集群。SynapseML通过将多个现有的ML框架和新的Microsoft算法统一到一个可跨Python、R、Scala和Java使用的可扩展API中来解决这一挑战。

借助SynapseML,开发人员可以构建可扩展的智能系统来解决以下领域的挑战:

异常检测

计算机视觉

深度学习

表格识别和人脸识别

梯度提升

微服务编排

模型可解释性

强化学习和个性化

搜索和检索

语音处理

文本分析

翻译

通过统一的API简化分布式机器学习

编写容错分布式程序很复杂,而且是一个容易出错的过程。我们来举个深度网络的分布式评估的例子。第一步是将一个GB量级的模型发送到数百台工作机器上,而不会使网络不堪重负。第二步,必须协调数据读取器以确保所有数据都排队等待处理并且GPU处于满负荷状态。如果新计算机加入或离开集群,新的工作机器必须接收模型的副本,数据读取器需要适应与新机器共享工作并重新计算丢失的工作。最后,必须跟踪进度以确保正确释放资源。

当然,像Horovod这样的框架可以管理这一点,但是如果想要与不同的ML框架(例如LightGBM、XGBoost或SparkML)进行比较,则需要新的环境和集群。此外,这些训练系统并非旨在服务或部署模型,因此需要单独的推理和流媒体架构。

SynapseML通过将许多不同的ML学习框架与一个可扩展、与数据和语言无关且适用于批量处理、流媒体和服务应用程序的API统一起来,简化了这种体验。它旨在帮助开发人员专注于其数据和任务的高级结构上,而无需过多考虑不同ML生态系统和数据库的实现细节和特性。

统一的API标准化了当下许多的工具、框架和算法,从而简化了分布式ML体验。这使开发人员能够为需要多个框架的用例快速组合不同的ML框架,例如网络监督学习、搜索引擎创建等。它还可以在单节点、多节点和可弹性调整大小的计算机集群上训练和评估模型,因此开发人员可以在不浪费资源的情况下扩展他们的工作。

除了在几种不同的编程语言中的可用性之外,该API还对各种数据库、文件系统和云数据存储进行了抽象,以简化实验。

深耕五年,打造高普世化机器学习库

正如微软在项目网站上所解释的那样,SynapseML在几个新方向上扩展了用于大规模数据处理的开源引擎ApacheSpark:“SynapseML中的工具允许用户制作功能强大且高度可扩展的模型,这些模型可以跨多个机器学习生态系统完成工作。SynapseML还为Spark生态系统带来了新的网络功能。通过HTTPonSpark项目,用户可以将任何Web服务嵌入到他们的SparkML模型中,并使用他们的Spark集群进行大规模的网络工作流。”

SynapseML能够让开发者将超过45种不同的先进的机器学习服务直接嵌入到他们的系统和数据库中。最新版本增加了对分布式表单识别、对话转录和翻译的支持。

这些即用型算法可以解析各种文档、实时转录多说话者对话,此外还能翻译100多种不同语言的文本。

使用SynapseML构建负责任的AI系统

SynapseML使开发人员不仅可以使用现有的模型和服务,还可以构建和训练自己的模型和服务。此版本的SynapseML引入了使用VowpalWabbit框架进行个性化推荐和上下文老虎机强化学习的新算法。这种VowpalWabbit集成可以为单个模型分配模型训练和预测,或者跨多个模型并行训练。这对于快速调整策略优化和个性化系统的超参数非常有效。

VowpalWabbit项目地址:

构建模型后,研究人员和工程师需要在部署前了解其局限性和行为。SynapseML通过引入新工具来帮助开发人员和研究人员构建负责任的AI系统,这些工具揭示了模型为什么会做出这样的预测以及如何改进训练数据集以消除偏见。

除了有监督的模型可解释性之外,SynapseML还为无监督的负责任AI引入了几项新功能。借助微软的用于理解数据集不平衡的新工具,研究人员可以检测敏感数据集特征(例如种族或性别)是否被过度或不足表达,并采取措施提高模型公平性。此外,SynapseML的分布式孤立森林使研究人员能够在不需要标记训练数据的情况下检测其数据集中的异常值和异常情况。

“我们的目标是帮助开发人员简化分布式实现细节,并使他们能够将分布式部署到各种数据库、集群和语言中,而无需更改原来的代码,”Hamilton说道。

THE END
1.12道营养又下饭的家常菜,每天都不重样,简单易做降营养还好吃洋葱豆腐别再红烧了,教你个简单做法,比吃大鱼大肉都香,营养下饭 美食强上墙 2024-11-28 06:31:48 5 跟贴 5 鸡蛋倒入洋葱中,瞬间变成一道好吃的美食 李老浪的菜 2024-11-27 16:16:27 15 跟贴 15 素炒西兰花,西兰花,木耳,胡萝卜在一起搭配,营养加倍#美食 大什么玮 2024-11-30 11:08:56 0 跟贴 0https://www.163.com/dy/article/JIBJOD2E0553TKGX.html
2.家用微波炉小菜大味10款简单快捷的配方家用微波炉小菜大味10款简单快捷的配方 在现代生活中,人们对食物的健康性、口感和美观有了更高的要求,同时也希望能够快速地准备出满足这些需求的餐点。微波炉作为一种节能环保、操作简便的厨房电器,它提供了一种既快速又方便地烹饪食物的手段。本文将为大家介绍10款利用家用微波炉制作的小菜,每一款都具有一定的特色https://www.firedslze.cn/ji-qi-ren/348924.html
3.晚饭吃什么菜(100种懒人晚餐做法)成都户口网土豆新做法,许多街边小吃都能看到这样做,不过一般比较重油炸一遍,在家可以不费油也能做出街边小时的风味,香辣开胃,也适合做成下酒小菜。 做法:1、土豆1个,把土豆削皮后切成厚片,用波纹刀具把土豆片切成带波纹样的土豆条。 2、土豆含较高淀粉质,也容易氧化变黑,切好的土豆条放入清水中浸泡一会。 https://www.028honghai.com/250456.html
4.吃鱼的100种方法精选菜单吃鱼的100种方法 年夜饭_清蒸鱼 按说呢,纯清蒸鱼不用加豉油。这个做法不加豉油味道已经很好了,用了葱姜、料酒去腥,盐和红枣丝提鲜。但我个人偏爱蒸鱼豉油的味道,最后还是加了一点点。 浤辰_原生说美食770072浏览8147赞 蜜汁核桃小鱼干 这是一道非常简单开胃的小菜,亦可当做解馋的小零食,而且价格相也是当便宜https://mip.xiangha.com/caipu/caidan/2405/
5.厨房必备100种厨房用具的精选大全炒锅和煎锅是任何家居中的基本工具,无论是制作简单的小菜还是复杂的大餐,这两样都是必需品。 1.2 烤箱与微波炉 随着生活节奏的加快,快速便捷地烹调食物变得越来越重要。烤箱和微波炉就是这样一种解决方案,它们能够提供多种不同的烹饪方式。 2.0 切割与准备工具 https://www.topwlw39.cn/kong-diao/413435.html
6.嵌入式软件开发笔试题(精选6篇)化学实验的考查陷入了一种较为尴尬的境地。如何使“纸笔测验”能真实、有效地考查、评价学生的实验能力,并引导中学化学教学重视学生实验,促进学生积极主动地發展,是摆在化学教学工作者面前的一个重要课题。 二、化学实验“纸笔测验”的考查目标 化学实验考查目标具有层次性,体现由易到难、由简单到复杂的顺序。在化学https://www.360wenmi.com/f/filef9ms5rd0.html
7.生活在海边的你,这100多种海鲜你都认识吗?吃海鲜一定要知道的禁忌~基围虾富含高蛋白,而且做法多样,不过最原始的也是最美味的,加些姜葱白灼一下,上桌时配上香醋生抽,简简单单,清清爽爽,也很适合做宴客菜。 25、蛇鳗 蛇鳗的品种很多,共200多种,遍布全世界,穴居于泥沙底质的低潮区或近岸处。蛇鳗与醋一同食用会引起中毒。 http://m.dljdb.net/h-nd-1051.html
8.青瓜拌皮蛋换个方法颜值提升100倍夏天的开胃小菜这几天广州热死了,总想吃点清淡的。 过往凉拌青瓜一般会用拍扁这个简单粗暴的方法,今天换个形式,颜值立马就提升了许多,上桌时儿子已经忍不住夹了好多。 调料的份量根据自己的喜好调整哟。 用料 蒜头 3瓣 辣椒粉 适量 糖 1茶匙 盐 半茶匙 蒸鱼豉油 https://hanwuji.xiachufang.com/recipe/104583431/
9.十六个月宝宝辅食制作100款,让宝宝降成长2.3 小菜类 - 鲜虾扇贝球:荷包蛋内加入醇香鲜虾和鲜美扇贝肉,辅以白胡椒和海水盐的混合汁作调料,制作出口感Q弹,味道鲜美的虾扇贝球。 - 香煎鸡胸肉:用开水焯烫至变色的鸡胸肉,用麻油或自制酱汁煎到熟透即可,可以与其他小菜一起配餐。 - 红烧笋干:干笋炒糖色,再加入酱油和肉丝一起炖煮,制作成多汁肉香味浓郁http://www.yaolan.com/beiyun/byzn/65416.html