掌握聚合最新动态了解行业最新趋势
API接口,开发服务,免费咨询服务

如何开始机器学习,从TensorFlow开始

对于大多数组织来说,机器学习仍然是一个白日梦,Gartner估计,只有不到15%的企业成功地将机器学习投入生产。即便如此,公司也需要开始用机器学习来进行实验,这样他们就可以把它建立在他们的DNA里。

机器学习容易吗?MapR首席应用程序架构师泰德•邓宁(TedDunning)表示,即便如此,“任何认为自己能从货架上买到魔法子弹的人,都没有“购买机器学习技术”的初衷。

除非你已经知道机器学习以及如何将它带到生产中,否则你可能无法理解你将要为公司的生命周期增添的复杂性。另一方面,如果你以前做过这个,良好的机器学习肯定是一个非常惊人大的区别,”邓宁说。

像TensorFlow这样的开源项目可以极大地提高企业机器学习成功的机会。“TensorFlow”让没有高级数学训练的人能够建立复杂的,甚至是有用的模型。这是一个很好的事情,对于大多数组织来说,这是机器学习最好的方式。

机器学习不需要任何东西,预测是免费的

Dunning说,机器学习的成功率如此之低,因为“机器学习呈现出新的障碍,这些障碍在标准的软件工程实践中并没有得到很好的处理”。一个成功的数据处理团队需要复杂的通信线路和多管齐下的开发过程。

把这些复杂的事结合在一起,机器学习系统“很容易隐藏非常微妙的依赖”,而你有一个完美的方式,让事情出错。

谷歌比大多数人更清楚知道机器学习的收益和陷阱,它设计的是使用机器学习系统的隐藏技术债务。正如谷歌的作者所强调的,“在现实世界的机器学习系统中,经常需要花费大量的维护费用。“风险?“边界侵蚀、纠缠、隐藏的反馈循环、未声明的消费者、数据依赖、配置问题、外部世界的变化以及各种系统级的反模式。”

这只是个开始。

不足为奇的是,软件工程团队通常没有足够的能力来处理这些复杂的问题,因此可能会非常严重地失败。邓宁说:“一个好的、坚实的、综合的平台可以让你毫不费力地扩展,这是克服某些复杂性的关键因素。”你需要为你痴狂关注建立价值客户和你做不到,如果你没有得到一个平台,所有你需要的功能,可以让你专注于你生活中的数据以及如何将导致顾客感知价值。”

进入TensorFlow的世界

TensorFlow让机器学习成为可能的四种方式

开源,作为开发者的通用货币,在大数据中扮演了更重要的角色。即便如此,邓宁断言“开源项目直到最近才真正处于生产机器学习的前沿。”随着谷歌引入了TensorFlow,一个架构转变开始了。

但在邓宁看来,TensorFlow(以及Caffe、MXNet和CNTK)对机器学习正统的基础的动摇并不是什么大不了的事。不,“真正重要的是,现在有一个强大的框架可以做非常重要的项目,被广泛接受和广泛使用,并且提供了足够的抽象,从底层的高等数学。”

他的第一点——真正的机器学习计划——是一个噱头。仅仅局限于非常简单的模型并不是进行机器学习的一种方式。

然而,他的第二个观点更令人惊讶:“关键在于,我们需要一个系统,由各种各样的团队使用,以解决更广泛的问题,让足够多的人为新手编写简单的例子。”我们需要一个系统,它成为与机器学习文件的配套实现的标准,这样我们就能知道论文在哪里掩盖了一些细节。

他关于抽象的第三个观点也是非常重要的:“事实上,程序转换能够产生一种有效地实现函数的导数的代码,即使是在一段时间之前也不明显。”“但这是至关重要的。“这种能力,比其他任何东西都更重要——包括深度学习——已经让没有高级数学训练的人能够建立复杂的,有时甚至是有用的模型。”

通过使用TensorFlow和其他类似的开源项目,团队可以通过迭代和试验获得成功地部署机器学习的新技能。这种愿意用开源代码弄脏自己的意愿是他的第四点,“成功地部署机器学习将需要一个团队愿意深入研究事物的运作方式。”

换句话说,真正的机器学习成功不会来自于现成的软件包,不管公司的市场有多艰难(想想IBM的沃森)。

做真正机器学习的建议

对于那些准备开始真正的机器学习之旅的人来说,TensorFlow是一个很好的开始。当你踏上这段旅程的时候,邓宁有两个建议:

首先,优先考虑流程框架、模型交付框架、度量标准和模型评估。“如果你所拥有的只是一个模型,没有好的数据和模型执行管道,那么你注定会失败。”

第二,“立即抛弃模型的神话。”当一个函数全部投入生产的时候,你不会有一个单一的模型。你将会有多个函数模型。你会有微妙的互动。您必须能够运行一个模型,以便在相当长的时间内确保它已经为黄金时间做好准备。你需要有完整的输入记录历史。你需要知道所有的潜在模型对输入的反应。

原文来自:云技术实践

声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com

  • 全球天气预报

    支持全球约2.4万个城市地区天气查询,如:天气实况、逐日天气预报、24小时历史天气等

    支持全球约2.4万个城市地区天气查询,如:天气实况、逐日天气预报、24小时历史天气等

  • 购物小票识别

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

  • 涉农贷款地址识别

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

  • 人脸四要素

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

  • 个人/企业涉诉查询

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

0512-88869195
数 据 驱 动 未 来
Data Drives The Future