关于ML.NET v1.0 的发布说明

今天,咱们很高兴宣布发布 ML.NET 1.0。ML.NET 是一个免费的、跨平台的开源机器学习框架,旨在将机器学习(ML)的强大功能引入.NET 应用程序。 git

ML.NET GitHub:https://github.com/dotnet/machinelearninggithub

入门 @ http://dot.net/ml算法

ML.NET 容许你使用 C#或 F#训练、构建和发布自定义机器学习模型,用于情景分析、问题分类、预测、推荐等场景。你能够在咱们的ML.NET 样品库中查看这些常见的场景和任务。架构

ML.NET 最初是在微软研究院内部研发,后来演变成许多微软产品使用的重要框架,例如 Windows Defender、Microsoft Office(Powerpoint 设计思想、Excel 图表推荐)、Azure 机器学习、PowerBI 关键影响者等!框架

自推出以来,许多组织都在使用 ML.NET,如 SigParser(垃圾邮件检测)、William Mullens(法律问题分类)和 Evolution 软件(榛子水分检测)。机器学习

ML.NET 1.0 版本添加了新的预览功能,如自动机器学习(AutoML)功能,ML.NET CLI 和 ML.NET Model Builder 等新工具,这意味着,如今为你的应用程序添加机器学习模型只需点击右键!工具

本文的其他部分重点介绍这些新体验。性能

  • ML.NET 核心组件学习

  • 自动机器学习预览ui

  • ML.NET 模型生成器预览

  • ML.NET CLI 预览

  • ML.NET 入门

  • 将来计划

ML.NET 核心组件

ML.NET 旨在提供终端工做流程,以便在机器学习(预处理、特征工程、建模、评估和操做)的各个步骤中将 ML 用于.NET 应用程序。ML.NET 1.0 提供如下关键组件:

  • 数据表示

    • 基本 ML 数据管道数据类型,如 IDataView——基本数据管道类型

    • 阅读器支持从分隔文本文件或 IEnumerable 对象中读取数据

  • 支持机器学习任务:

    • 二进制分类

    • 多级分类

    • 回归

    • 排序

    • 异常检测

    • 聚类

    • 推荐(预览)

  • 数据转换和特性化

    • 文本

    • 分类

    • 特征选择

    • 规范化和缺失值处理

    • 图像特征化

    • 时间序列(预览)

    • 支持 ONNX 和 TensorFlow 模型集成(预览)

  • 其余

    • 模型理解和解释

    • 用户定义的自定义转换

    • 架构操做

    • 支持数据集操做和交叉验证

自动机器学习预览

现在,机器学习入门学习过程很是艰难。在构建自定义机器学习模型时,你必须肯定为你的场景选择机器学习任务(即分类或回归?),将你的数据转换为 ML 算法能够理解的格式(例如文本数据 - > 数字向量),并微调这些 ML 算法以达到最佳性能。若是你是 ML 新手,这些步骤中的每一步都会很是艰巨!

自动机器学习经过自动肯定如何转换输入数据并选择性能最佳的 ML 算法,使你可以轻松构建一流的自定义 ML 模型,使你的 ML 之旅更加简单。

ML.NET 中的 AutoML 支持处于预览阶段,咱们目前支持回归(用于价格预测等场景)和分类(用于情感分析、文档分类、垃圾邮件检测等场景)ML 任务。

你可使用 ML.NET Model Builder、ML.NET CLI 或直接使用 AutoML API(可在此处找到样本)三种形式在 ML.NET 中体验 AutoML。

对于不熟悉机器学习的用户,咱们建议从 Visual Studio 中的 ML.NET 模型构建器和任何平台上的 ML.NET CLI 开始。AutoML API 对于你想要动态构建模型的场景也很是方便。

模型生成器预览

为了简化.NET 开发人员构建 ML 模型的过程,咱们今天也很高兴地发布 ML.NET 模型构建器。使用 ML.NET 模型构建器,只需右键单击便可将机器学习添加到你的应用程序中!

Model Builder 是一个简单的 UI 工具,供开发人员使用本身的数据集,经过 AutoML 使构建最佳的 ML 模型。除此以外,Model Builder 还能够生成模型训练和模型消耗代码,以达到最佳性能,让你快速将 ML 添加到现有应用程序中。

了解有关 ML.NET 模型构建器的更多信息

Model Builder 目前处于预览阶段,欢迎试用并告诉咱们你的想法!

ML.NET CLI 预览

ML.NET CLI(命令行界面)是咱们今天推出的另外一个新工具!

ML.NET CLI 是一个 dotnet 工具,容许使用 AutoML 和 ML.NET 生成 ML.NET 模型。ML.NET CLI 能够快速遍历你的数据集以获取特定的 ML 任务(目前支持回归和分类)并生成最佳模型。

CLI 除了生成最佳模型外,还容许用户为最佳性能模型生成模型训练和模型消耗代码。

ML.NET CLI 是跨平台的,能够轻松添加到.NET CLI。Model Builder Visual Studio 扩展还使用 ML.NET CLI 提供模型构建器功能。

你能够经过此命令安装 ML.NET CLI。

dotnet tool install -g mlnet

下图显示了 ML.NET CLI 构建情感分析数据集。

了解有关 ML.NET CLI 的更多信息

ML.NET CLI 目前也处于预览状态,欢迎试用并分享你的想法!

开始吧!

从头开始使用 ML.NET 很简单,你能够经过几个简单的步骤来完成,以下所示。 下面的示例显示了如何使用 ML.NET 进行情绪分析。 

//Step 1. Create a ML Context
var ctx = new MLContext();
 
//Step 2. Read in the input data for model training
IDataView dataReader = ctx.Data
    .LoadFromTextFile<MyInput>(dataPath, hasHeader: true);
 
//Step 3. Build your estimator
IEstimator<ITransformer> est = ctx.Transforms.Text
    .FeaturizeText("Features", nameof(SentimentIssue.Text))
    .Append(ctx.BinaryClassification.Trainers
        .LbfgsLogisticRegression("Label", "Features"));
 
//Step 4. Train your Model
ITransformer trainedModel = est.Fit(dataReader);
 
//Step 5. Make predictions using your model
var predictionEngine = ctx.Model
    .CreatePredictionEngine<MyInput, MyOutput>(trainedModel);
 
var sampleStatement = new MyInput { Text = "This is a horrible movie" };
 
var prediction = predictionEngine.Predict(sampleStatement);

你还能够探索各类其余学习资源,如 ML.NET 的教程和资源,以及 ML.NET 示例、演示产品推荐、异常检测和更多实际操做等流行方案。

ML.NET 的下一步

今天发布 ML.NET 1.0 的同时,咱们的团队已经在努力为 ML.NET 1.0 版发布如下功能。

  • 其余 ML 场景的 AutoML 体验

  • 改进了对深度学习场景的支持

  • 支持其余其余来源,如 SQL Server、CosmosDB、Azure Blob 存储等。

  • 在 Azure 上横向扩展以进行模型训练和消耗

  • 使用模型构建器和 CLI 时,支持其余 ML 方案和功能

  • 用于 Apache Spark 和 ML.NET 的.NET 大规模机器学习的本地集成

  • .NET 中的新 ML 类型,例如数据帧