+ [1.4、 Xml转CSV文件](#14%09XmlCSV_233)
+ [1.5、CSV转tfrecord文件](#15CSVtfrecord_246)
+ [1.6、修改config文件](#16config_272)
+ [1.7、训练](#17_289)
+ [1.8、Tensorboard观察训练过程](#18Tensorboard_294)
+ [1.9、评估模型](#19_302)
+ [1.10、检查点文件转pb](#110pb_313)
+ [1.11、识别](#111_320)
本文采用tensorflow开源的object detection api部署深度学习pb文件。
用LabVIEW2020自带的deep learning工具进行检测。
主要工作量在于object detection api的部署,主要参考《
深度学习图像识别技术:基于TensorFlow Object Detection API和OpenVINO 工具套件》
环境:
软件名称 | 用途 |
---|---|
NVIDIA显卡驱动 | TnesorFlow GPU版本依赖的显卡驱动软件 |
Anaconda | 管理Python软件包和环境的工具 |
Python | TensorFlow依赖的程序开发语言 |
TensorFlow | Google开源的机器学习库 |
TensorFlow Object Detection API | 深度学习目标检测算法的软件框架 |
显卡选择建议参考链接:
https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/
本文使用1660Ti
入门级别参考:GeForce GTX 1050/1060/1070
驱动下载链接:
https://www.nvidia.com/Download/index.aspx?lang=en-us
国内镜像下载链接:
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
本文使用2019.07(64bit)版本:
在默认路径C:\Users\Administrator里有.condar文件,修改为:
show_channel_urls:true
channel_alias:http://mirrors.tuna.tsinghua.edu.cn/anaconda
default_channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom channels:
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
msys2:https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
simpleitk:https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudssl
verify:true
打开anaconda→选中"Environment"→点击"create"→Name修改为"tf_gpu",python选中"3.6"
打开Anaconda如果一直停留在初始化的界面,可以通过以下方法解决
① 在路径:C:\ProgramData\Anaconda3\Lib\site-packages\anaconda_navigator\api中,找到conda_api.py,搜索yaml.load,修改为yaml.safeload
② 重启电脑后,再打开就能正常打开了。
常用的一些conda指令可以参考以下网站:
https://docs.conda.io/projects/conda/en/latest/user-guide/cheatsheet.html
本文常用的有:
vscode仅用修改对应的代码行,不作调试要求,相当于文本编辑软件,可以更换。
下载链接:
https://code.visualstudio.com/
1、win+R→输入"cmd"后,执行
2、命令行中输入后回车,等待安装完成
conda activate tf_gpu
conda install tensorflow-gpu=1.13.1
3、命令行中,输入"python"后回车,后再输入"import tensorflow as tf",显示如下信息,即安装完整
下载Git,直接下载最新版本的Git就行,下载链接:
https://git-scm.com/
TensorFlow Object Detection API是一个在TensorFlow基础上开发出来的用于计算机视觉领域实现在图像中检测并定位多个目标物体的软件框架。
1、建立文件夹目录结构,本文源路径为"D:\deep_learning\src_code\tf_train"
git clone -b r1.13.0 https://github.com/tensorflow/models
如果报Git SSL错误的话,则需要先关闭SSL校验
输入
git config --global http.sslverify false
如果Git太慢,可以从云盘下载
https://pan.baidu.com/s/1klGCW0ckE2BQvY4cRscRYA#list/path=%2F
提取码: h9m3
4、下载完成后,路径变为:
软件包名称 | 用途 |
---|---|
matplotlib | 绘制图表 |
pillow | 图像处理 |
lxml | 处理XML和HTML |
contextlib2 | with语句上下文管理 |
cython | 让Python脚本支持C语言扩展的编译器 |
opencv-python | OpenCV的python库 |
1、win+R→输入"cmd"后,执行 | |
2、命令行中输入后回车,等待安装完成 |
conda activate tf_gpu
3、再输入
pip install matplotlib pillow lxml contextlib2 cython opencv-python
如果碰到个别的出错,可以单独执行。
为了让Python可以找到TensorFlow Object Detection API依赖的软件模块,需要配置环境变量,本文添加以下三个路径:
D:\deep_learning\src_code\tf_train\models\research
D:\deep_learning\src_code\tf_train\models\research\slim
D:\deep_learning\src_code\tf_train\models\research\object_detection
1、打开"此电脑"→右键空白处,点击"属性"
2、点击高级系统设置
3、点击环境变量
4、添加对应的环境变量
1、在addons文件夹中点击鼠标右键,选中Git Bash,在Git Bash中输入
git clone https://github.com/philferriere/cocoapi
下载完成后,文件目录变为
2、在命令行中激活tf_gpu环境→输入后执行,命令行进入PythonAPI
cd /d D:\deep_learning\src_code\tf_train\addons\cocoapi\PythonAPI
3、再执行
python setup.py install
1、进入"D:\deep_learning\src_code\tf_train\models\research"路径
2、在文件路径中输入cmd,弹出命令行
3、激活tf_gpu环境后,输入以下命令执行后,完成proto文件的编译
for /f gi in('dir /b object detection\protos\*.proto')do protoc object detection\protos\&i--python out=.
1、从https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/tf1_detection_zoo.md下载ssd_inception_v2_coco
2、下载完成后,解压到路径"D:\deep_learning\src_code\tf_train\models\research\object_detection"中
3、注释掉26行"import matplotlib; matplotlib.use(‘Agg’)"
4、在命令行中激活tf_gpu环境,然后执行object_detection_example_1.py
5、执行结果如下,说明检测环境配置完成。
激活tf_gpu,运行pip install labelimg
本文选用ssd_mobilenet_v2_coco。
其中模型名称含义:
ssd_mobilenet_v2_coco:该模型使用了SSD(Single Shot Multibox Detector)目标检测算法,mobilenet特征提取网络,在COCO数据集上进行了训练。
1、准备好对应的图集。
2、用labelImg标注图片,并建立对应文件夹,包括images里面的eval,test,train,其中train里面包含图片和对应标注后以图片命名的xml文件,test是部分标注后的图片,eval是只有部分图片。
labelImg常用功能有:
修改"D:\deep_learning\src_code\tf_train\workspaces\cats_dogs\annotations"路径中的label_map.pbtxt文件。
item {
id: 1
name: "cat"
}
item {
id: 2
name: "dog"
}
执行xml_to_csv.py
Python xml_to_csv.py -i D:\deep_learning\src_code\tf_train\workspaces\cats_dogs\images\train -o D:\deep_learning\src_code\tf_train\workspaces\cats_dogs\annotations\train_labels.csv
Python xml_to_csv.py -i D:\deep_learning\src_code\tf_train\workspaces\cats_dogs\images\eval-o D:\deep_learning\src_code\tf_train\workspaces\cats_dogs\annotations\eval_labels.csv
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
外链图片转存中…(img-3dUeUMLs-1712877504572)]
[外链图片转存中…(img-05t50bFw-1712877504573)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
文章浏览阅读1k次。通过使用ajax方法跨域请求是浏览器所不允许的,浏览器出于安全考虑是禁止的。警告信息如下:不过jQuery对跨域问题也有解决方案,使用jsonp的方式解决,方法如下:$.ajax({ async:false, url: 'http://www.mysite.com/demo.do', // 跨域URL ty..._nginx不停的xhr
文章浏览阅读2k次。关于在 Oracle 中配置 extproc 以访问 ST_Geometry,也就是我们所说的 使用空间SQL 的方法,官方文档链接如下。http://desktop.arcgis.com/zh-cn/arcmap/latest/manage-data/gdbs-in-oracle/configure-oracle-extproc.htm其实简单总结一下,主要就分为以下几个步骤。..._extproc
文章浏览阅读1.5w次。linux下没有上面的两个函数,需要使用函数 mbstowcs和wcstombsmbstowcs将多字节编码转换为宽字节编码wcstombs将宽字节编码转换为多字节编码这两个函数,转换过程中受到系统编码类型的影响,需要通过设置来设定转换前和转换后的编码类型。通过函数setlocale进行系统编码的设置。linux下输入命名locale -a查看系统支持的编码_linux c++ gbk->utf8
文章浏览阅读750次。今天准备从生产库向测试库进行数据导入,结果在imp导入的时候遇到“ IMP-00009:导出文件异常结束” 错误,google一下,发现可能有如下原因导致imp的数据太大,没有写buffer和commit两个数据库字符集不同从低版本exp的dmp文件,向高版本imp导出的dmp文件出错传输dmp文件时,文件损坏解决办法:imp时指定..._imp-00009导出文件异常结束
文章浏览阅读143次。当下是一个大数据的时代,各个行业都离不开数据的支持。因此,网络爬虫就应运而生。网络爬虫当下最为火热的是Python,Python开发爬虫相对简单,而且功能库相当完善,力压众多开发语言。本次教程我们爬取前程无忧的招聘信息来分析Python程序员需要掌握那些编程技术。首先在谷歌浏览器打开前程无忧的首页,按F12打开浏览器的开发者工具。浏览器开发者工具是用于捕捉网站的请求信息,通过分析请求信息可以了解请..._初级python程序员能力要求
文章浏览阅读7.6k次,点赞2次,收藏6次。@Service标注的bean,类名:ABDemoService查看源码后发现,原来是经过一个特殊处理:当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致public class AnnotationBeanNameGenerator implements BeanNameGenerator { private static final String C..._@service beanname
文章浏览阅读6.9w次,点赞73次,收藏463次。1.前序创建#include<stdio.h>#include<string.h>#include<stdlib.h>#include<malloc.h>#include<iostream>#include<stack>#include<queue>using namespace std;typed_二叉树的建立
文章浏览阅读7.1k次。在Asp.net上使用Excel导出功能,如果文件名出现中文,便会以乱码视之。 解决方法: fileName = HttpUtility.UrlEncode(fileName, System.Text.Encoding.UTF8);_asp.net utf8 导出中文字符乱码
文章浏览阅读2.1k次,点赞4次,收藏23次。第一次实验 词法分析实验报告设计思想词法分析的主要任务是根据文法的词汇表以及对应约定的编码进行一定的识别,找出文件中所有的合法的单词,并给出一定的信息作为最后的结果,用于后续语法分析程序的使用;本实验针对 PL/0 语言 的文法、词汇表编写一个词法分析程序,对于每个单词根据词汇表输出: (单词种类, 单词的值) 二元对。词汇表:种别编码单词符号助记符0beginb..._对pl/0作以下修改扩充。增加单词
文章浏览阅读773次。我在使用adb.exe时遇到了麻烦.我想使用与bash相同的adb.exe shell提示符,所以我决定更改默认的bash二进制文件(当然二进制文件是交叉编译的,一切都很完美)更改bash二进制文件遵循以下顺序> adb remount> adb push bash / system / bin /> adb shell> cd / system / bin> chm..._adb shell mv 权限
文章浏览阅读6.8k次,点赞12次,收藏125次。1. 单目相机标定引言相机标定已经研究多年,标定的算法可以分为基于摄影测量的标定和自标定。其中,应用最为广泛的还是张正友标定法。这是一种简单灵活、高鲁棒性、低成本的相机标定算法。仅需要一台相机和一块平面标定板构建相机标定系统,在标定过程中,相机拍摄多个角度下(至少两个角度,推荐10~20个角度)的标定板图像(相机和标定板都可以移动),即可对相机的内外参数进行标定。下面介绍张氏标定法(以下也这么称呼)的原理。原理相机模型和单应矩阵相机标定,就是对相机的内外参数进行计算的过程,从而得到物体到图像的投影_相机-投影仪标定
文章浏览阅读2.2k次。文章目录Wayland 架构Wayland 渲染Wayland的 硬件支持简 述: 翻译一篇关于和 wayland 有关的技术文章, 其英文标题为Wayland Architecture .Wayland 架构若是想要更好的理解 Wayland 架构及其与 X (X11 or X Window System) 结构;一种很好的方法是将事件从输入设备就开始跟踪, 查看期间所有的屏幕上出现的变化。这就是我们现在对 X 的理解。 内核是从一个输入设备中获取一个事件,并通过 evdev 输入_wayland