基于Hadoop的广告投放系统 暴风影音--李立松.

Slides:



Advertisements
Similar presentations
秀峰國小特教組 8/29 學期開始前特教會議 1. 報告內容 一、身障生轉介 二、身障生福利服務 三、資源班學生成績評量相關規定 四、特教資源 2.
Advertisements

通用航空供应链融资. 凯塔公司介绍 2010 年 中国航空运输协会发起 凯塔 ( 北京 ) 信息技术有限公司成立 2011 年 沈阳凯塔数据科技有限公司成立 凯塔系统的运营基地.
课程介绍 (PPT版本号:2016年1月24日版本) 温馨提示:编辑幻灯片母版,可以修改每页PPT的厦大校徽和底部文字 林子雨
中华字库的云输入法 王勇 基础软件国家工程研究中心
瑞文氏彩色圖形 推理測驗 莊敬國小/輔導處/親職組 製作.
瑞文氏彩色矩陣推理測驗說明 •••••••••••••••••••••••••••••••••••••••••••••
校園心理師與輔導團隊分享特殊個案輔導經驗
E-Mapreduce培训系列 基本介绍.
公务员管理子系统建设步骤 1、组建由局长直接领导的体制,制定公务员管理、工资管理、其他业务用户的管理权限,以及各业务间的协作流程。
一、我的学校和专业 二、毕业论文主要内容 三、学习的心得体会
第三章 数据类型和数据操作 对海量数据进行有效的处理、存储和管理 3.1 数据类型 数据源 数据量 数据结构
《大数据技术原理与应用》 课程介绍 (2016春季学期)
海量 数据分析架构.
發展東華特色課程 期末成果發表 呂進瑞 國立東華大學財金系.
股骨干骨折护理 6A病区.
中青国信科技(北京)有限公司 空间域名邮局价格表.
施耐德电气(中国)投资有限公司 运动控制部技术经理 李幼涵 高级工程师
基于hadoop与hive的大数据分析体系构建
基于R和pentaho的全套开源BI平台的实现
快速学习环境搭建 安装前预备工作(Linux相关配置) 实操演示(hadoop、hbase为例) 总结&练习题(课后练练手)
Kvm异步缺页中断 浙江大学计算机体系结构实验室 徐浩.
Hadoop I/O By ShiChaojie.
广点通的数据挖掘
Hadoop平台與應用規劃實作 報告者:劉育維.
SOA – Experiment 3: Web Services Composition Challenge
Jul 2014 HEAT部署Hadoop集群
基于大数据的物流资源整合 福建师范大学协和学院 沈庆琼.
华为—E8372h- 155 外观设计 产品类型:数据卡 建议零售价格:299元 上市时间:2017年6月7日 目标人群:大众
第11章:一些著名开源软件介绍 第12章:服务安装和配置 本章教学目标: 了解当前一些应用最广泛的开源软件项目 搭建一个网站服务器
《Spark编程基础》 《 Spark编程基础》课程介绍 (PPT版本号:2018年2月)
大数据管理技术 --NoSQL数据库 HBase 陈 辉 大数据分析技术.
基于全方位视觉的多人体运动检测跟踪 利用全方位摄像机获取360˚ 的环境信息,在室内对多个人体目标进行实时运动检测。
个人简历 PERSONAL RESUME.
基于相似用户群体 图书推荐系统 Book recommendation system ——农E创客.
第二章 Java语言基础.
大数据与物流 沈庆琼 物流教研室.
1085至1125年间的官员地域分布与社会关系 1.
Multi-Function PowerPiont Template
用event class 从input的root文件中,由DmpDataBuffer::ReadObject读取数据的问题
斯坦福大学调研 蒋达晟.
基于大数据平台数据管理研究 何家乐 2013年7月 中国科学院高能物理研究所.
解决变化问题的自底向上 流程建模方法 严志民 徐玮.
学习目标 1、select练习.
适用于工作计划 / 工作总结 / 季度报告等演示
金融财务工作汇报PPT模板 简洁实用·框架完整·大气时尚·工作总结·计划等 汇报人:ABC.
北师大版三年级数学下册 电 影 院.
标准配色方案 背景 文本和线条 阴影 强调色 主色一 主色二 主色三 主色四 推荐应用顺序. 标准配色方案 背景 文本和线条 阴影 强调色 主色一 主色二 主色三 主色四 推荐应用顺序.
VisComposer 2019/4/17.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
产品介绍 TOPOLF-T198 产品类型:4G MIFI 建议零售价格:699元 上市时间: 2015年1月 目标人群:差旅人士
Cassandra应用及高性能客户端 董亚军 来自Newegg-NESC.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
简洁清新小花PPT模板 汇报人:宝藏PPT
点击此处 添加文字 点击添加相关标题文字 点击请替换文字内容 点击请替换文字内容 点击请替换文字内容 点击请替换文字内容 点击请替换文字内容
实验三 16位算术逻辑运算实验 不带进位控制的算术运算 置AR=1: 设置开关CN 1 不带进位 0 带进位运算;
小学新课程标准数学第一册(人教课标版) 加减混合运算 授课人: 孙东霞
2019/5/8 第2章 数据分析软件介绍.
2017 万圣节PPT模版 添加你的标题在此处添加你的标题在此处.
义务教育课程标准实验教科书三年级下册 认 识 小 数 潘 伟.
学习目标 1、了解基本运算符 2、运算符优先级.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
2017 多功能简洁实用PPT模板 木子尧 市场部.
Python 环境搭建 基于Anaconda和VSCode.
基于列存储的RDF数据管理 朱敏
WEB程序设计技术 数据库操作.
本节内容 进程 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
基于学案制作ppt 录屏工具使用 郑建彬.
适用于年终总结 / 汇报 / 提案及相关类别演示
入侵检测技术 大连理工大学软件学院 毕玲.
调研报告展示 过度页1.
Presentation transcript:

基于Hadoop的广告投放系统 暴风影音--李立松

广告投放思维导图

新老系统对比 分析方式 分析效率 及时性 一个是单机 一个是分布式 上百G的数据 以前是10个小时左右 现在能达到10分钟到半个小时 以前按天算 现在可以达到按小时甚至按半个小时

系统流程标准化 日志格式 接收 加载 清洗 分析 展现

硬件储备 采集多台 hadoop 计算节点几十台 机器配置高配

日志接收 格式标准化 接收方式 scribe nginx 每一个小时cut文件 并发量(一天上百G) 接收与集群分离(多台接收机)

加载 清洗 hive建表 一个小时往集群加载一次 一个小时加载完后立即清洗 达到准实时(接下来做成半个小时) 每小时建一次表

广告逻辑实现 手段 内容 策略

手段 hadoop+python + hive+java+mahout 执行方式包括 天执行 小时执行 周执行 月执行 涉及到对表分区

内容 广告转换效果分析 广告空间效果分析 CPM分析 投放效果分析 独立展现用户数 独立点击用户数 协商 库存 覆盖度分布(日、周、月)[1--N频次] 展现点击

策略 所有复杂逻辑均在集群内部完成 数据库展现端不做任何逻辑运算 把所有涉及到的数据资源都同步到HDFS 上述所有 提高用户体验效果

广告投放指数 暴风指数(添加相似影片推荐) 做投放广告指数 使用余弦相似度 帮助广告主选择投放的影片 观看单个广告的投放效果地域分布 根据某个影片可以看出某个广告的受众人群(年龄、职业、性别等)

暴风指数

总结 根据相似的影片找到相似的受众人群 选择影片投放 根据投放效果 (做一个广告指数)调整策略 广告指数和暴风指数相辅相成还是根据最开始那个思维导图 广告指数观看单个广告投放效果 暴风指数帮助调整策略

谢谢!