除了技术，无它

439篇博客

编辑推荐

网易数帆开源API网关与容器云项目，让云原生生产落地“多快好

网易汪源：统一负载与多云环境的“开放姿态”，才是云原生

网易数帆如何用 Kubernetes“原语”搞定云原生中间件

快手打新挤爆券商系统，网易数帆推出券商稳定性保障方案

探索智慧校园新模式，网易有数在教育行业的实践分享

金融行业大数据治理之路——数据模型篇

机器学习？抱歉，有Apple就可以为所欲为（下篇）

达芬奇密码2018-07-13 15:44

使用效果

实时性：

到上一步为止，基本的步骤已经完成了，但既然开头说了，要达到能实际使用的程度，那就需要再进行一些完善了。先得试试实时性怎么样，因此采用摄像头实时获取图片，实时辨别来试试效果。这部分和机器学习关系不大，因此略过详细过程，核心方法为- (void)captureOutput:(AVCaptureOutput *)output didOutputSampleBuffer:(CMSampleBufferRef)sampleBuffer fromConnection:(AVCaptureConnection *)connection，

使用的queue要注意下，更新的时候也要注意切回主线程

在这个回调里，先把图片摆正，这样能提高准确率。[connection setVideoOrientation:AVCaptureVideoOrientationPortrait];然后根据sampleBuffer获取图片即可。

实际效果下图：

图不动的话，戳这里。这里在末尾也演示了前面提到的other这个分类，其实这个分类存在的目的，就是为了增加分类器的健壮性，可参加这个issue。如果只训练两个分类A和B，那么分类器A和B的概率相加为1，假设新物体非常不像A，那么有可能显示的B的概率为1，造成误判，other这个分类的意义就在于摊平这里的概率，当然对于other里训练的图片选择，感觉是个大学问，目前我只是随意的放了些非目标分类的图片。

准确性

做了那么多的步骤，直接看图就知道效果了：

图不动的话，戳这里。

总体来说，目标物对的稍微准点，95+%的识别率还是有的，超过了我的预期，可应用到实际中。

包的大小

前文提到过，导出的包为94.2MB，这对于一个iOS App来说，实在是有点太大了。贴心的Apple当然也给了解决方法，那就是替换卷积神经网络CNN，CNN的主要目的是提取图片的特征值。替换的地方在turi_train.py的第三步：

# 3. 生成模型
model = tc.image_classifier.create(train_data,     target='name')

这里还有一个参数，model，改成

model = tc.image_classifier.create(train_data, target='name',model='squeezenet_v1.1')

也就是把model的CNN指定为squeezenet_v1.1（默认的为resnet-50）。当然这里还可以设置其他的参数，比如最大迭代次数等。这样导出的mlmodel一下子就变成了5MB左右，小了非常的多！当然，这也牺牲了一定的精度。具体对比，Apple已经列了对比：

而Apple官网提供的“从1000种类别的对象中检测出图像中的主体”的训练集当中，从大到小依次为

VGG16： 553.5MB
ResNet50: 102.6MB
Inception v3: 94.7MB
MobileNet: 17.1MB
SqueezeNet: 5MB

至于如何在精度和包大小取舍就看自己的选择了。

在线下载、更新包

一个包离线打在项目里，既更新不了，又导致每个用户的包都变大了，这显然不是一个好的实践。Apple提供了一个新的API，+ (NSURL *)compileModelAtURL:(NSURL *)modelURL error:(NSError * _Nullable *)error;，使用方法也很简单，下载数据，放到沙盒里，然后compile即可。需要注意的是，这个方法较为耗时，不要放在主线程。

这样包大小的问题也算一定程度上解决了。

存在的问题

读文章最怕介绍的都是各种优点的文章，显然，作为这么个工具，还是需要提出我在这整个过程中遇到的问题：

训练模型需较多，识别出的内容仅在训练分类中，如果不是，会出现误识别，比如训练中有“杯子”这个种类，如果有个电器长得跟“杯子”很像，那这个电器就会被识别为“杯子”，属于误识别。这个通过增加训练种类能一定程度上解决。
由于是摄像头实时取，实时识别，识别结果会存在一定程度的抖动。这个通过设置阈值等可以解决
实时获取判断，机器发热较为严重，没有做过具体的性能检测。这个可以定时获取或者继续优化代码来调优。
试验中涉及到的种类较少，实际应用到需求里所需的种类后，训练情况和效果未知。

第三部分：What's More?

目标跟踪

Turi Create这个工具能做到的远不止图像分类，还有目标追踪，推荐系统，相似图片，文字识别等等。其中目标跟踪跟本实践较为接近，这个可以继续叠加训练数据的维度来实现。需要增加的工作为，需要标记每一张训练图的目标物方框坐标，数据格式为：

[{'coordinates': {'height': 104, 'width': 110, 'x': 115, 'y': 216}, 'label': 'ball'}, {'coordinates': {'height': 106, 'width': 110, 'x': 188, 'y': 254}, 'label': 'ball'}, {'coordinates': {'height': 164, 'width': 131, 'x': 374, 'y': 169}, 'label': 'cup'}] 其他步骤跟前文提到的基本一致。具体可以大家自己尝试。介绍在官网github上。

Android使用

本文中通过TuriCreate生成的数据为mlmodel，仅供iOS使用，可通过开源工具MMdnn来转换为Caffe, Keras, MXNet, Tensorflow, CNTK, PyTorch Onnx这些模型，从而供其他方来使用。

@张云龙：

也可以只用训练素材图片，然后用 tensorflow-for-poets-2 来训练，得到 retrained_graph.pb 和 retrained_labels.txt 集成到Android中。

执行脚本

算法学习

本文是一篇应用型的文章，基本没有介绍真正的机器学习的知识。这部分还是很有必要深入了解下的，这两个感觉介绍的不错，可推荐：

谷歌 - 机器学习速成课程

知乎专栏 - 卷积神经网络（CNN）入门讲解

第四部分：参考文章

机器学习？抱歉，有Apple就可以为所欲为（上篇）

本文来自网易实践者社区，经作者陈蒙奇授权发布。

<上一篇机器学习？抱歉，有Apple就可以为所欲为（上篇）

下一篇中文网页字体的最佳选择 >

最新博客

最新资源下载

编辑推荐

机器学习？抱歉，有Apple就可以为所欲为（下篇）