高级大数据人才培养丛书之一,大数据挖掘技术与应用

Slides:



Advertisements
Similar presentations
第8讲 安装和卸载软件包 本章主要内容: 包管理 RPM操作 用RPM诊断 文件压缩与打包 图形界面下包的安装与管理.
Advertisements

SCILAB 科學軟體教學 撰寫者: 1.中央大學大氣科學系 楊善文 2. (為本文有貢獻者,記得在此留名。)
課程地圖 (104年入學-日間部) 校通識核心 專業課程 必修與選修 與管理模組 網路技術 App設計與應用模組 學院通識核心 學院專業核心
教育局資安課程 戒慎恐懼-談公務上的資安認知.
Linux并行计算平台搭建及应用 王彦棡 2010年5月.
技术支持部 张新凤( ) 并行机群系统安装、使用和管理 技术支持部 张新凤( )
MHA(Master High Availability) 作者
自由軟體SFS3 SFS3 學務系統是採用開放原始程式碼所架構的校務行政電腦化系統,目標是希望使各中小學校能擁有一個自由開放強大的校務E化平台。 本系統採用 Apache+PHP+MySQL,具備強大的模組功能,並且跨平台支援 Linux/FreeBSD/Windows等作業環境。 最大的特色是:自由、開放、模組化、高度可擴展能力。
常优
轉移SFS3學務系統至CentOS 6.3 臺中市教育網路中心 曾文芳 2012/8/13.
資訊安全與系統管理 2013/3/13 Chien wei lin.
计算机与信息技术应用基础 徐东雨 计算机中心
第16章 編譯與升級Kernel系統核心 課前指引
Made by Feng Nie 开源机器学习库&Hadoop介绍 Made by Feng Nie
QtiPlot-實驗室數據分析與繪圖 撰文者: 1.海洋大學光電所 楊善文 2. (如對本文有貢獻者,記得在此留名)
Linux.
网络仿真工具介绍
雲端計算 參考書籍:Python+Spark 2.0+Hadoop 機器學習與大數據分析實戰
并行计算实验上机 国家高性能计算中心(合肥).
人人网安全交流 qQ: 信息安全监控 人人网安全交流 qQ:
编译与多文件.
讲议: PXE 介绍及实现 Jarvis
第二天 计算机基础技能培训 (一)linux基础知识
軟體的安裝升級與移除 Linux軟體安裝簡介 原始碼安裝 以 RPM 指令管理套件 使用 Yum 線上安裝、移除與更新套件
林韬 高能所计算中心 on behalf of JUNO Offline Group 高能物理计算和软件会议 2017/06/06 成都
An introduction to Subversion
曙光集群简明使用手册 技术支持中心.
林韬 高能所计算中心 on behalf of JUNO offline group 第十八届全国科学计算与信息化会议 2017/07 威海
日构建
第 22 章 架設 WWW 伺服器.
TinyOS开发环境安装 基于Ubuntu14.04.
Linux核心編譯與模組管理 2013/01/19.
用Python建模与数据处理 俞熹 2017/1.
成都教学展示会跟踪事项讨论 课程建设: 人工智能通识课、Python 纳入课程开发资助申报指南,但所占比例不宜高。初级案例开发也将纳入。
编辑文本文件 软件包管理 Samba 在Linux下使用Windows共享打印机
2017 Operating Systems 作業系統實習 助教:陳主恩、林欣穎 實驗室:720A Lab3.
利用ICE通信中间件构建分布式应用程序开发框架
雲端計算.
人工智能人才培养示范基地建设分享 上海电子信息职业技术学院 邵瑛.
第二章 UNIX系统安装与常用命令.
【南區Fintech研習營】Python 程式設計基礎:
Confidential Property
2018 Operating Systems 作業系統實習 助教:林欣穎 實驗室:720A Lab3.
古佳怡 實驗流程.
杨振伟 清华大学 第一讲:Linux环境下编程(1)
Linux 服务器配置与管理 用yum管理 软件包 宁波城市职业技术学院
实验一:编译运行Linux内核并使用gdb进行调试
雲端計算.
助教:田成锦、汪睿、游翎璟 吴加禹、李佳伟、唐凯成
吳政璋 指導教授: 廖洺漢 台大機械系 週會報告 吳政璋 指導教授: 廖洺漢 台大機械系
作業一: 安裝Linux於btrfs上 中正大學 作業系統實驗室 指導教授:羅習五
Git 新一代版本控制系统 superwen.
大数据应用人才培养系列教材 R 语言 刘 鹏 张 燕 总主编 程显毅 主编 刘颖 朱倩 副主编.
大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编.
大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编.
大数据应用人才培养系列教材 数据清洗 刘 鹏 张 燕 总主编 李法平 主编 陈潇潇 副主编.
高级大数据人才培养丛书之一,大数据挖掘技术与应用
大数据应用人才培养系列教材 数据挖掘基础 刘 鹏 张 燕 总主编 陶建辉 主编 姜才康 副主编.
杨振伟 清华大学 第一讲:Linux环境下编程(1)
数据挖掘 DATA MINING 刘 鹏 张 燕 总主编 王朝霞 主编 施建强 杨慧娟 陈建彪 副主编
大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编.
大数据应用人才培养系列教材 数据清洗 刘 鹏 张 燕 总主编 李法平 主编 陈潇潇 副主编.
大数据应用人才培养系列教材 R 语言 刘 鹏 张 燕 总主编 程显毅 主编 刘颖 朱倩 副主编.
高级大数据人才培养丛书之一,大数据挖掘技术与应用
大数据应用人才培养系列教材 数据挖掘基础 刘 鹏 张 燕 总主编 陶建辉 主编 姜才康 副主编.
大数据应用人才培养系列教材 大数据实践 刘 鹏 张 燕 总主编 袁晓东 主编 黄必栋 副主编.
劉庠宏、林合治編著 國立高雄大學應用數學系 2005年3月1日
第六章 文件系统与文件管理 6.4 Linux文件管理 1、比较MS DOS 与 Linux的目录结构 一、Linux文件系统的树形结构
大数据应用人才培养系列教材 数据清洗 刘 鹏 张 燕 总主编 李法平 主编 陈潇潇 副主编.
Presentation transcript:

高级大数据人才培养丛书之一,大数据挖掘技术与应用 深度学习 BIG DATA 刘 鹏 张 燕 总主编 刘鹏 主编 赵海峰 副主编

第六章 深度学习开源框架 6.1 Caffe 6.2 TensorFlow 6.3 其它开源框架 习题 全国高校标准教材《云计算》姊妹篇,剖析大数据核心技术和实战应用 第六章 深度学习开源框架 6.1 Caffe 6.2 TensorFlow 6.3 其它开源框架 习题 2 of 40

6.1Caffe 6.1.1Caffe框架 第六章 深度学习开源框架 Caffe是一个清晰、高效、开源的深度学习框架,很适合初学者。它由加州大学伯克利的PHD贾扬清开发是应用最广泛的深度学习框架之一。 贾扬清 3 of 40

易上手 多语言 速度快 社区好 6.1Caffe 6.1.1Caffe框架 第六章 深度学习开源框架 Caffe是一个清晰、高效、开源的深度学习框架,很适合初学者。它由加州大学伯克利的PHD贾扬清开发是应用最广泛的深度学习框架之一。 易上手 多语言 速度快 社区好 代码组织好。可读性强,例子多。 支持C++、Python和Matlab。 采用MKL、OpenBLAS等计算库,支持GPU加速。 国内外都有较活跃的社区、且有很多衍生项目。 4 of 40

6.1Caffe 6.1.2安装Caffe 1、操作系统为centenos7 2、安装Nvidia GPU驱动 第六章 深度学习开源框架 (1)添加ELRepo 源 # rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org # rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm 5 of 40

6.1Caffe 6.1.2安装Caffe 第六章 深度学习开源框架 (2)安装显卡驱动 # yum install nvidia-x11-drv nvidia-x11-drv-32bit 6 of 40

6.1Caffe 6.1.2安装Caffe 第六章 深度学习开源框架 (3)重启 # reboot (4)查看GPU信息 # nvidia-smi 7 of 40

6.1Caffe 6.1.2安装Caffe 第六章 深度学习开源框架 (5)安装CUDA 7.5 Toolkit:CUDA 7.5 Toolkit为Nvidia工具包。该工具包包括GPU加速库,调试和优化工具,C / C ++编译器和运行库等。 # cd /root/cDeep/Nvidia/ # sh cuda_7.5.18_linux.run 8 of 40

6.1Caffe 6.1.2安装Caffe 第六章 深度学习开源框架 (6)安装cuDNN v4:针对深度学习框架的一套GPU加速方案 # cd /root/cDeep/Nvidia/ # tar xvzf cudnn-7.0-linux-x64-v4.0-prod.tgz # cp cuda/include/cudnn.h /usr/local/cuda-7.5/include # cp cuda/lib64/libcudnn* /usr/local/cuda-7.5/lib64 # chmod a+r /usr/local/cuda-7.5/lib64/libcudnn* (7)配置环境变量 # vim /etc/profile 在文件最后添加 export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-7.5/lib64" export CUDA_HOME=/usr/local/cuda-7.5 更新环境变量 # source /etc/profile 9 of 40

6.1Caffe 6.1.2安装Caffe 3、Caffe 安装 (1)安装依赖库 第六章 深度学习开源框架 # source /etc/profile # yum install protobuf-devel snappy-devel opencv-devel boost-devel # cd /root/cDeep/Caffe/ # unzip leveldb-master.zip # cd leveldb-master # ./build_detect_platform build_config.mk ./ # make # cp –r include/leveldb /usr/local/include # cp /root/cDeep/Caffe/leveldb-master/out-static /libleveldb.a /usr/local/lib 10 of 40

6.1Caffe 6.1.2安装Caffe (5)安装GFLAGS (2)安装GCC和GCC++ 第六章 深度学习开源框架 # cd /root/cDeep/Caffe/ # unzip gflags-master.zip # cd gflags-master # mkdir build&& cd build # export CXXFLAGS="-fPIC" && cmake .. && make VERBOSE=1 # make&&make install (6)安装LMDB # unzip lmdb.zip # cd lmdb-mdb.master/libraries/liblmdb (2)安装GCC和GCC++ # yum -y install gcc gcc-c++ (3)安装GIT和CMAKE # yum -y install git # yum -y install cmake (4)安装GLOG # cd /root/cDeep/Caffe/ # tar zxvf glog-0.3.3.tar.gz # cd glog-0.3.3 # ./configure # make # make install 11 of 40

6.1Caffe 6.1.2安装Caffe (7)安装HDF5 (9)安装OpenCV 第六章 深度学习开源框架 # cd /root/cDeep/Caffe/ # tar –xf hdf5-1.8.17.tar # cd hdf5-1.8.17 #./configure --prefix=/usr/local/hdf5 # make&&make install (8)安装OpenBlas # unzip OpenBLAS.zip # cd xianyi-OpenBLAS-3f6398a # make # make PREFIX=/usr/local/openblas install (9)安装OpenCV # cd /root/cDeep/Caffe/ # unzip opencv-2.4.13.zip # cd opencv-2.4.13 # mkdir release&&cd release # cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local -D BUILD_PYTHON_SUPPORT=ON -D BUILD_EXAMPLES=ON .. # make # make install 12 of 40

6.1Caffe 6.1.2安装Caffe (10)修改配置文件 第六章 深度学习开源框架 # cd /root/cDeep/Caffe/ # unzip caffe-master.zip&& cd caffe-master # cp Makefile.config.example Makefile.config # vim makefile.config 修改makefile.config文件里的信息 1)USE_CUDNN := 1 使用cuda进行加速 2)OPENCV_VERSION := 2 对应OpenCV版本是2.4.1 ~ 2.4.13 3)CUDA_DIR := /usr/local/cuda-7.5 cuda头文件及库目录 4)BLAS := open 使用openblas BLAS_INCLUDE := /usr/local/openblas/include 设置头文件路径 BLAS_LIB := /usr/local/openblas/lib 设置动态库路径 5)INCLUDE_DIRS := /usr/local/include /usr/local/hdf5/include /usr/include/python2.7 6)设置其它依赖库头文件路径 LIBRARY_DIRS := /usr/local/lib /usr/lib /usr/local/hdf5/lib 设置其它依赖库动态库路径 13 of 40

6.1Caffe 6.1.2安装Caffe (11)Caffe编译 # cd /root/cDeep/Caffe/ 第六章 深度学习开源框架 6.1.2安装Caffe (11)Caffe编译 # cd /root/cDeep/Caffe/ # cd caffe-master # make all –j4 # make test # make runtest 14 of 40

6.1Caffe 6.1.3 案例:基于Caffe的目标识别 1.获取数据集 # cd ./data/cifar10 第六章 深度学习开源框架 6.1.3 案例:基于Caffe的目标识别 1.获取数据集 # cd ./data/cifar10 # ./get_cifar10.sh cifar10数据集文件示意图 Cifar10图像示意图 15 of 40

6.1Caffe 6.1.3 案例:基于Caffe的目标识别 2.成训练及测试数据,将样本转为LMDB格式 第六章 深度学习开源框架 6.1.3 案例:基于Caffe的目标识别 2.成训练及测试数据,将样本转为LMDB格式 # cd ./data/cifar10 # ./get_cifar10.sh 3.训练及测试 # cd ./examples/cifar10&& ./train_full.sh 16 of 40

第六章 深度学习开源框架 6.1 Caffe 6.2 TensorFlow 6.3 其它开源框架 习题 全国高校标准教材《云计算》姊妹篇,剖析大数据核心技术和实战应用 第六章 深度学习开源框架 6.1 Caffe 6.2 TensorFlow 6.3 其它开源框架 习题 17 of 40

6.2TensorFlow 6.2.1TensorFlow框架 第六章 深度学习开源框架 6.2.1TensorFlow框架 TensorFlow是Google开源的一个深度学习框架。实现了本地和分布式两种接口机制。本地实现机制的client端、master端和worker均运行在同一个机器中;分布式实现机制它与本地实现的代码基本相同,但是client端、master端和worker进程一般运行在不同的机器中,所包含的不同任务由一个集群调度系统进行管理。 具备如下优点:1.多样化部署;2.可被基于梯度的机器学习算法借鉴;3.灵活的Python接口;4.可映射到不同硬件平台;5.支持分布式训练。 18 of 40

6.2TensorFlow 6.2.2安装TensorFlow 1、安装pip # cd /root/cDeep/Tensorflow/ 第六章 深度学习开源框架 6.2.2安装TensorFlow 1、安装pip # cd /root/cDeep/Tensorflow/ # python get-pip.py pip安装示意图 19 of 40

6.2TensorFlow 6.2.2安装TensorFlow 2.安装TensorFlow 第六章 深度学习开源框架 6.2.2安装TensorFlow 2.安装TensorFlow # cd /root/cDeep/Tensorflow/ # pip install --upgrade tensorflow-0.8.0-cp27-none-linux_x86_64.gpu.whl 左图为tensorflow安装示意图 20 of 40

6.2TensorFlow 6.2.2安装TensorFlow 3.安装测试 # python ... 第六章 深度学习开源框架 6.2.2安装TensorFlow 3.安装测试 # python ... >>> import tensorflow as tf >>> hello = tf.constant('Hello, TensorFlow!') >>> sess = tf.Session() >>> print(sess.run(hello)) Hello, TensorFlow! >>> sess.close() >>> exit() tensorflow测试示意图 21 of 40

6.2TensorFlow 6.2.3案例:基于TensorFlow的目标识别 1. 下载Cifar10数据集 第六章 深度学习开源框架 6.2.3案例:基于TensorFlow的目标识别 1. 下载Cifar10数据集 # wget http://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz # tar -xzf cifar-10-python.tar.gz Cifar10数据集示意图 22 of 40

6.2TensorFlow 6.2.3案例:基于TensorFlow的目标识别 2. 运行训练程序 第六章 深度学习开源框架 6.2.3案例:基于TensorFlow的目标识别 2. 运行训练程序 # cd /tensorflow/models/image/cifar10/ # python cifar10_train.py 3. 运行测试程序 # python cifar10_eval.py 4. 如图所示,资源消耗: CPU:~41% GPU:~42% 耗时:~50min 训练时资源消耗图 23 of 40

6.2TensorFlow 6.2.3案例:基于TensorFlow的目标识别 5. 训练完成示意 6. 测试示意 准确率:~84.4% 第六章 深度学习开源框架 6.2.3案例:基于TensorFlow的目标识别 5. 训练完成示意 6. 测试示意 准确率:~84.4% 24 of 40

第六章 深度学习开源框架 6.1 Caffe 6.2 TensorFlow 6.3 其它开源框架 习题 全国高校标准教材《云计算》姊妹篇,剖析大数据核心技术和实战应用 第六章 深度学习开源框架 6.1 Caffe 6.2 TensorFlow 6.3 其它开源框架 习题 25 of 40

6.3其它开源框架 1.CNTK 2.MXNet 3.Theano 4.Torch 5.Deeplearning4j 第六章 深度学习开源框架 1.CNTK 2.MXNet 3.Theano 4.Torch 5.Deeplearning4j 26 of 40

6.3其它开源框架 CNTK的5个 主要特点 6.3.1CNTK A B C D E E 训练和测试多种神经网络的通用解决方案。 第六章 深度学习开源框架 6.3.1CNTK 训练和测试多种神经网络的通用解决方案。 A B 用户使用一个简单的文本配置文件指定一个网络。 CNTK的5个 主要特点 C 尽可能无缝地把很多计算在一个GPU上进行。 D 自动计算所需要的导数,网络是由许多简单的元素组成。 E 通过添加少量的C ++代码来实现必需块的扩展。 E 对windows平台的支持更好。 27 of 40

6.3其它开源框架 6.3.2MXNet MXNet的7个主要特点: (1)其设计说明可以被重新应用到其他深度学习项目中。 第六章 深度学习开源框架 6.3.2MXNet MXNet的7个主要特点: (1)其设计说明可以被重新应用到其他深度学习项目中。 (2)任意计算图的灵活配置。 (3)整合了各种编程方法的优势,最大限度地提高灵活性和效率。 (4)轻量、高效的内存,以及支持便携式的智能设备,如手机等。 (5)多GPU扩展和分布式的自动并行化设置。 (6)支持Python、R、C++和Julia。 (7)对云计算友好,直接兼容S3、HDFS和Azure。 28 of 40

6.3其它开源框架 Theano的6个 主要特点 6.3.3Theano 01 与NumPy紧密相关 02 透明地使用GPU 03 第六章 深度学习开源框架 6.3.3Theano Theano的6个 主要特点 01 与NumPy紧密相关 02 透明地使用GPU 03 高效符号分化 04 速度和稳定性的优化 05 动态生成C代码 06 广泛的单元测试和自我验证 29 of 40

6.3其它开源框架 Torch的4个主要特点 6.3.4Torch 采用Lua语言 通过LuaJIT的C接口。 第六章 深度学习开源框架 6.3.4Torch 采用Lua语言 通过LuaJIT的C接口。 Torch的4个主要特点 很多实现索引、切片、移调的程序。 可嵌入、移植到iOS、Android和FPGA的后台。 快速、高效的GPU支持。 30 of 40

集合了Cuda内核,支持CPU和分布式GPU。 6.3其它开源框架 第六章 深度学习开源框架 6.3.5Deeplearning4j Deeplearning4j的4个主要特点: 依赖于广泛使用的编程语言Java。 Canova向量化各种文件形式和数据类型。 集合了Cuda内核,支持CPU和分布式GPU。 可专门用于处理大型文本集合。 31 of 40

习题: 1.安装TensorFlow。 2.安装配置Caffe 环境,跑通test。 3.深度学习的开源框架有哪些。 4.分别简述CNTK、MXNet、Theano、Torch深度学习软件的主要特点。

AIRack人工智能实验平台 ——一站式的人工智能实验平台 DeepRack深度学习一体机 ——开箱即用的AI科研平台 BDRack大数据实验平台——一站式的大数据实训平台

云创公众号推荐 刘鹏看未来 云计算头条 中国大数据 深度学习世界 云创大数据订阅号 云创大数据服务号 高校大数据与人工智能 微信号:lpoutlook 云计算头条 微信号:chinacloudnj 中国大数据 微信号:cstorbigdata 深度学习世界 微信号:dl-world 云创大数据订阅号 微信号:cStor_cn 云创大数据服务号 微信号:cstorfw 高校大数据与人工智能 微信号:data_AI

手机APP推荐 我的PM2.5 随时随地准确 查看身边的 PM2.5值 同声译 支持26种语言 互译的实时翻 译软件 我的南京 云创大数据为路 况大数据应用提 供技术支持 科技头条 汇聚前沿资讯 的科技情报站

网站推荐 万物云 智能硬件大数据免费托管平台 环境云 环境大数据开放共享平台

感谢聆听