Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
PyCon2012ChinaBj-AdMaster
Search
Zoom.Quiet
October 20, 2012
Programming
1
500
PyCon2012ChinaBj-AdMaster
http://cn.pycon.org/2012/schedulebj
Zoom.Quiet
October 20, 2012
Tweet
Share
More Decks by Zoom.Quiet
See All by Zoom.Quiet
PyCon2014China-Zhuhai-high performance
zoomquiet
0
150
PyCon2014China-Zhuhai-meta programming
zoomquiet
1
120
PyCon2014China-Zhuhai-bpm.py
zoomquiet
0
99
PyCon2014China-Zhuhai-luna kv db
zoomquiet
0
88
PyCon2014China-Zhuhai-seed studio
zoomquiet
0
87
PyCon2014China-Zhuhai-Docker Registry Build By Python
zoomquiet
0
100
PyCon2014China-Zhuhai-jeff
zoomquiet
0
78
PyCon2014China-Zhuhai-pythonic front-end
zoomquiet
0
110
DevFest2014-Zhuhai-Polymer
zoomquiet
0
400
Other Decks in Programming
See All in Programming
Create a website using Spatial Web
akkeylab
0
310
地方に住むエンジニアの残酷な現実とキャリア論
ichimichi
5
1.4k
Code as Context 〜 1にコードで 2にリンタ 34がなくて 5にルール? 〜
yodakeisuke
0
120
GoのGenericsによるslice操作との付き合い方
syumai
3
700
C++20 射影変換
faithandbrave
0
550
DroidKnights 2025 - 다양한 스크롤 뷰에서의 영상 재생
gaeun5744
3
330
Azure AI Foundryではじめてのマルチエージェントワークフロー
seosoft
0
150
アンドパッドの Go 勉強会「 gopher 会」とその内容の紹介
andpad
0
280
生成AIコーディングとの向き合い方、AIと共創するという考え方 / How to deal with generative AI coding and the concept of co-creating with AI
seike460
PRO
1
340
なぜ適用するか、移行して理解するClean Architecture 〜構造を超えて設計を継承する〜 / Why Apply, Migrate and Understand Clean Architecture - Inherit Design Beyond Structure
seike460
PRO
1
710
Select API from Kotlin Coroutine
jmatsu
1
190
PipeCDのプラグイン化で目指すところ
warashi
1
220
Featured
See All Featured
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
How STYLIGHT went responsive
nonsquared
100
5.6k
Automating Front-end Workflow
addyosmani
1370
200k
Stop Working from a Prison Cell
hatefulcrawdad
270
20k
Gamification - CAS2011
davidbonilla
81
5.3k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
357
30k
Building an army of robots
kneath
306
45k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
5.9k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
22k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.8k
How to train your dragon (web standard)
notwaldorf
94
6.1k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Transcript
Python 在互联网广告 监测分析中的应用 @陆丹峰 from AdMaster (精硕科技)
互联网广告简介 * 广告,和”游戏”、”电子商务”为互联网三大主要盈利途径 * 广告形式:文字链、静态图片、动态Flash、交互式等 * 投放渠道:门户、搜索、视频、微博、SNS、手机…
互联网广告目的:在线营销 广告投放 投放数据采集:曝 光/点击/用户行为 数据 数据分析 数据挖掘 优化投放策略 广告监测/数据分析:优化广告主的在线营销策略,提升广告转化率
AdMaster 广告数据采集分析架构 曝光/点击 /用户行为 LVS Nginx Nginx … Tornado Tornado
log log 数据处理(PyPy) 清洗/扩充/回溯 HDFS Hadoop 实时 数据 汇总 … 华北 华南 … • 用 PyPy 跑 Tornado • 相比 CPython 性能提升 > 30% • 内存使用大,但无泄露
Python 在 Hadoop 处理中的角色 参数 输入 Python *处理输入输出 *控制 Pig
脚本 Pig 算法1 Hadoop 计算结果 Pig 算法2 … 2: 生成脚本 1 3: 执行 MapReduce 计算 4: 返回 MR 结果 5 • 每天新增 TB 级数据 • 每天对千亿行数据进行 各种维度的计算
微博分析工具 WeiboMaster • 企业级 • 微博营销分析管理平台 • 新浪 + 腾讯
• 管理发布 • 指标分析 • 舆情监控
微博分析工具 WeiboMaster 架构 MongoDB MySQL Django Twisted Spider Celery 微博
API 数据 NLP 服务 Worker Worker … Distributed • 每天数千万次微博 API 调用 • Mongodb 累计数据条目数接近 1B
NLP 服务介绍 • RESTful API: Tornado • 进程控制: Supervisor •
libsvm, SciPy,NumPy • 服务被多个产品线使用
AdMaster 介绍 • 中国领先的独立第三方数字营销全流程解决方案供应商;提供包括媒体审计、受 众分析、社交媒体评估、舆情监测、在线调研等全方位的效果评估解决方案; • AdMaster 成立于 2006 年,设有上海、北京、广州
3 家公司; • 宝洁、海尔、LVMH、大众等全球 500 强公司,累计近 3000 个数字营销项目; • 已完成 B 轮融资。 We are hiring! Python Ruby PHP HTML5 MongoDB Hadoop GIT Erlang
Thank you! 新浪微博:@陆丹峰