您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给AI研习社-译站
发送

1

可应用的目标检测代码来了,一秒锁定你

本文作者: AI研习社-译站 2018-07-24 18:09
导语:早期的目标检测使用的是传统算法,如 OpenCV(主流的计算机视觉库)中提供的算法,但是这些经典算法在不同场景下表现的不是很稳定。

雷锋网按:本文为雷锋字幕组编译的技术博客,原标题 Object Detection with 10 lines of code ,作者为 Moses Olafenwa 。

翻译 | 于志鹏    校对 |  陈涛    整理 |  MY


可应用的目标检测代码来了,一秒锁定你

计算机视觉是人工智能的一个重要领域。计算机视觉是一门关于计算机和软件系统的科学,可以让计算机对图像及场景进行识别和理解。计算机视觉还包括图像识别、目标检测、图像生成、图像超分辨率重建等分支领域。因为有众多的现实需求,目标检测可能是计算机视觉中最有价值的的领域。在本教程中,我会简要介绍目标检测的概念、开发者面临的挑战和我们提供的解决方案包括高效率的目标检测代码。

在应用内或者系统中使用最新的目标检测算法很困难,同样基于这些算法构建新的应用也并非易事。早期的目标检测使用的是传统算法,如 OpenCV(主流的计算机视觉库)中提供的算法,但是这些经典算法在不同场景下表现的不是很稳定。

2012 年深度学习的突破和快速普及,为我们带来了全新的高精确的目标检测算法和方法,如 R-CNN、Fast-RCNN、Faster-RCNN、RetinaNet 以及 SSD 和 YOLO 等快速而高度精确的目标检测算法。使用这些基于深度学习(同时也是基于机器学习)的算法和方法,需要一定的数学及深度学习框架的基础。目前有数百万程序员和软件开发人员致力于整合和开发使用目标检测技术的新产品。不过由于这项技术过于复杂和艰深,你很难将算法直接应用到实际开发中。

我们的团队在几个月前注意到了这个问题,所以我们和 John Olafenwa 共同开发了 ImageAI,这是一个 python 库,它允许程序员和软件开发人员只用几行代码就能将最新的目标检测算法整合到自己的项目中。

使用 ImageAI 进行目标检测时,需要以下步骤:

  1. 在当前系统上安装 Python

  2. 安装 ImageAI 和相关依赖包

  3. 下载目标检测模型文件

  4. 运行样例代码 (只需 10 行)


让我们开始开始吧。

  1.  在官方网站下载 Python3

https://python.org

  2.用 pip 命令安装以下依赖包:

i. Tensorflow

pip install tensorflow

ii. Numpy

pip install numpy

iii. SciPy

pip install scipy

iv. OpenCV

pip install opencv-python

v. Pillow

pip install pillow

vi. Matplotlib

pip install matplotlib

vii. H5py

pip install h5py

viii. Keras

pip install keras

ix. ImageAI

pip install 

https://github.com/OlafenwaMoses/ImageAI/releases/download/2.0.1/imageai-2.0.1-py3-none-any.whl

   3. 下载目标检测要用到的 RetinaNet 模型文件 link

很好!现在您已经安装了依赖包,可以开始编写第一个目标检测的代码了。创建一个 Python 文件并命名(例如 FirstDetection.py),然后将下面的代码写入其中。将 RetinaNet 模型文件和要检测的图像复制到包含 python 文件的文件夹。

FirstDetection.py

可应用的目标检测代码来了,一秒锁定你

然后运行代码并等待结果输出到控制台。在结果显示后,转到 FirstDetection.py 所在的文件夹,您将找到保存的新图像。请看下面的 2 个图像样例,代码运行后将保存新图像。

运行代码前:

可应用的目标检测代码来了,一秒锁定你

图片来源:alzheimers.co.uk

可应用的目标检测代码来了,一秒锁定你

图片来源:Wikicommons

运行代码后:

可应用的目标检测代码来了,一秒锁定你

上图的控制台结果:

person : 55.8402955532074

person : 53.21805477142334

person : 69.25139427185059

person : 76.41745209693909

bicycle : 80.30363917350769

person : 83.58567953109741

person : 89.06581997871399

truck : 63.10953497886658

person : 69.82483863830566

person : 77.11606621742249

bus : 98.00949096679688

truck : 84.02870297431946

car : 71.98476791381836

可应用的目标检测代码来了,一秒锁定你

上图的控制台结果:

person : 71.10445499420166

person : 59.28672552108765

person : 59.61582064628601

person : 75.86382627487183

motorcycle : 60.1050078868866

bus : 99.39600229263306

car : 74.05484318733215

person : 67.31776595115662

person : 63.53200078010559

person : 78.2265305519104

person : 62.880998849868774

person : 72.93365597724915

person : 60.01397967338562

person : 81.05944991111755

motorcycle : 50.591760873794556

motorcycle : 58.719027042388916

person : 71.69321775436401

bicycle : 91.86570048332214

motorcycle : 85.38855314254761

现在我来解释一下这 10 行代码是如何工作的。

可应用的目标检测代码来了,一秒锁定你

在上面的 3 行代码中,我们在第一行导入了 ImageAI 的目标检测类,在第二行导入了 python 的 os 类。然后在第三行定义了一个变量来保存文件夹的路径地址,该文件夹是我们用来保存 python 文件、RetinaNet 模型文件和图像的。

可应用的目标检测代码来了,一秒锁定你

在上面的 5 行代码中,我们在第一行定义了一个目标检测类的实例,在第二行将实例的模型类型设置为 RetinaNet,在第三行将实例的模型路径设置为我们的 RetinaNet 模型文件所在的路径,第四行将模型加载到目标检测类的实例中,第五行我们调用检测函数,并将文件输入输出路径作为参数传入。

可应用的目标检测代码来了,一秒锁定你

在上面两行代码中,第一行用来对 detector.detectObjectsFromImage 函数返回的所有结果进行迭代,第二行用来输出图片中检测到的每个目标的名字和概率。

ImageAI 还有很多强大的自定义功能。比如,可以将图片中被检测到的每个对象提取出来。只需要将参数 extract_detected_objects = True 传入到 detectObjectsFromImage 函数中就可以实现,如下所示,目标检测类将为图像对象创建一个文件夹,提取每个检测到的子图像,将每个子图像保存到创建的新文件夹中,并返回包含每个图像路径的数组。

可应用的目标检测代码来了,一秒锁定你

我们将这个方法应用于第一张图片,一些提取到的子图如下:

可应用的目标检测代码来了,一秒锁定你

所有行人的图片都很好的提取了出来。为了节约空间这里只显示了一部分。

ImageAI 提供了许多有用的功能,可用于自定义的目标检测任务和部署项目。支持的一些功能包括:

- 调整最小概率:默认情况下,检测到概率百分比小于 50 的对象将不会显示。你可以在需要高精度的场景提高此值,或者在需要检测所有可能目标时减小此值。

- 自定义目标检测:使用 CustomObject 类,您可以告诉检测类检测一个或多个独立目标。

- 检测速度:可以将检测速度设置为「fast」,「faster」和「fastest」,来缩短检测时间。

- 输入类型:可以将输入参数指定为图像路径,Numpy 数组或图像文件流的类型。

- 输出类型:可以指定 detectObjectsFromImage 函数返回图像的方式是文件还是 Numpy 数组。


你可以在官方 GitHub 库中找到上述功能以及 ImageAI 中其他计算机视觉功能的详细信息和文档。

https://github.com/OlafenwaMoses/ImageAI

如果你觉得这篇文章对你有所帮助或者你也对它感兴趣的话,请点个赞。欢迎随时与朋友同事分享。

如果您有任何疑问、建议、或想与我联系。请发送电子邮件至 guymodscientist@gmail.com。也可以通过我的 Twitter 账号 @OlafenwaMoses 和 Facebook https://www.facebook.com/moses.olafenwa 与我联系。


原文链接:https://towardsdatascience.com/object-detection-with-10-lines-of-code-d6cb4d86f606可应用的目标检测代码来了,一秒锁定你

雷锋网雷锋网

雷峰网原创文章,未经授权禁止转载。详情见转载须知

可应用的目标检测代码来了,一秒锁定你

分享:
相关文章

知情人士

AI研习社(yanxishe.com)译站频道,传播前沿人工智能知识,让语言不再成为学习知识的门槛。(原雷锋字幕组)
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
Baidu
map