掌握聚合最新动态了解行业最新趋势
API接口,开发服务,免费咨询服务

TOMASZ TUNGUZ:用机器学习SaaS软件管理用户信任

失去信任要比失去软件的用户或买家来得更快,比如这个软件没有保存我的数据、数据库损坏、网站安全系数频繁下降。数据完整性是每个公司存储数据所面临的挑战。机器学习SaaS初创企业面临着另一种信任风险——一种以概率引入的风险。

当年,内森预测2008年巴拉克·奥巴马(Barack Obama)的成功选举,每个地区的准确率几乎达到100%时,概率论可谓是大放异彩。真实世界与可能的预测一致。然而八年后的这次选举,概率没能预测对新总统的人选。

在2008年和2016年的分析中,预测可能是正确的。2008年的成功预测使人们对数据更加信任,然而在2016年,结果却发生了变化,预测反倒不准了。这种现象很自然。

置信系数和2类错误

许多机器学习系统也依赖概率。程序员将阈值编码到机器学习模型中,系统使用该阈值来决定概率是否可以得出结论,有时这被称置信系数。例如,该图像包含猫的最小概率、sacre blue 被翻译为“哦,我的天哪!”而不是sacre blue的概率 、高峰时间的范怀克的速度比从新泽西州到曼哈顿的带百汇要快的概率。

在计算机系统推荐之前,这些最小概率应该是多少? 80%? 90%? 95%? 增加概率和减少误报数量或类型1错误。这样您在搜索猫时,结果中出现猫鼬的数量就会更少。

但是,过多的增加信任阈值会引起类型2错误。有可能系统断言图像不包含猫,但经过进一步的检查,你可以看到有一个有猫的图片。

如何管理这种风险

机器学习SaaS公司必须找到平衡。让机器学习系统可以合理的宽松、适当的严格。如果产品掉到一个极端,产品可能会失去用户的信任,最终失去业务。

如何最好地管理这种风险?聊天机器人surge告诉我“人/机器人”交互的一个原则。设置合适的用户对系统容量的期望至关重要。低估和超额投放都会导致不信任。

第二种方法是确定哪种类型的错误对用户更为有利。在电子邮件垃圾邮件检测中,就需要更好地从邮件中分离出没用的垃圾邮件。

这些下一代机器学习产品都将依赖于用户信任的建立。在某些时候,这些产品必须明确什么时候的概率足够好,才能将营销预算转移到新的广告系列,分类图片,翻译,分类垃圾邮件或升级错误。

这类产品决定选择一定要谨慎。ML系统的信心得分直接关系到用户对产品的信任程度。

原文来自:36Kr

声明:所有来源为“聚合数据”的内容信息,未经本网许可,不得转载!如对内容有异议或投诉,请与我们联系。邮箱:marketing@think-land.com

  • 全球天气预报

    支持全球约2.4万个城市地区天气查询,如:天气实况、逐日天气预报、24小时历史天气等

    支持全球约2.4万个城市地区天气查询,如:天气实况、逐日天气预报、24小时历史天气等

  • 购物小票识别

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

    支持识别各类商场、超市及药店的购物小票,包括店名、单号、总金额、消费时间、明细商品名称、单价、数量、金额等信息,可用于商品售卖信息统计、购物中心用户积分兑换及企业内部报销等场景

  • 涉农贷款地址识别

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

    涉农贷款地址识别,支持对私和对公两种方式。输入地址的行政区划越完整,识别准确度越高。

  • 人脸四要素

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

    根据给定的手机号、姓名、身份证、人像图片核验是否一致

  • 个人/企业涉诉查询

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

    通过企业关键词查询企业涉讼详情,如裁判文书、开庭公告、执行公告、失信公告、案件流程等等。

0512-88869195
数 据 驱 动 未 来
Data Drives The Future