Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
PyCon2012ChinaBj-AdMaster
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Zoom.Quiet
October 20, 2012
Programming
1
510
PyCon2012ChinaBj-AdMaster
http://cn.pycon.org/2012/schedulebj
Zoom.Quiet
October 20, 2012
Tweet
Share
More Decks by Zoom.Quiet
See All by Zoom.Quiet
PyCon2014China-Zhuhai-high performance
zoomquiet
0
170
PyCon2014China-Zhuhai-meta programming
zoomquiet
1
160
PyCon2014China-Zhuhai-bpm.py
zoomquiet
0
130
PyCon2014China-Zhuhai-luna kv db
zoomquiet
0
100
PyCon2014China-Zhuhai-seed studio
zoomquiet
0
120
PyCon2014China-Zhuhai-Docker Registry Build By Python
zoomquiet
0
140
PyCon2014China-Zhuhai-jeff
zoomquiet
0
110
PyCon2014China-Zhuhai-pythonic front-end
zoomquiet
0
140
DevFest2014-Zhuhai-Polymer
zoomquiet
0
440
Other Decks in Programming
See All in Programming
コマンドとリード間の連携に対する脅威分析フレームワーク
pandayumi
1
450
Basic Architectures
denyspoltorak
0
670
Unicodeどうしてる? PHPから見たUnicode対応と他言語での対応についてのお伺い
youkidearitai
PRO
1
2.5k
Automatic Grammar Agreementと Markdown Extended Attributes について
kishikawakatsumi
0
190
humanlayerのブログから学ぶ、良いCLAUDE.mdの書き方
tsukamoto1783
0
190
OSSとなったswift-buildで Xcodeのビルドを差し替えられるため 自分でXcodeを直せる時代になっている ダイアモンド問題編
yimajo
3
620
dchart: charts from deck markup
ajstarks
3
990
なぜSQLはAIぽく見えるのか/why does SQL look AI like
florets1
0
460
AIで開発はどれくらい加速したのか?AIエージェントによるコード生成を、現場の評価と研究開発の評価の両面からdeep diveしてみる
daisuketakeda
1
2.5k
並行開発のためのコードレビュー
miyukiw
0
150
AI & Enginnering
codelynx
0
110
CSC307 Lecture 01
javiergs
PRO
0
690
Featured
See All Featured
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
How to train your dragon (web standard)
notwaldorf
97
6.5k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
110
Believing is Seeing
oripsolob
1
55
Agile that works and the tools we love
rasmusluckow
331
21k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
240
My Coaching Mixtape
mlcsv
0
48
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
92
Game over? The fight for quality and originality in the time of robots
wayneb77
1
120
Navigating Team Friction
lara
192
16k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
54
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
Transcript
Python 在互联网广告 监测分析中的应用 @陆丹峰 from AdMaster (精硕科技)
互联网广告简介 * 广告,和”游戏”、”电子商务”为互联网三大主要盈利途径 * 广告形式:文字链、静态图片、动态Flash、交互式等 * 投放渠道:门户、搜索、视频、微博、SNS、手机…
互联网广告目的:在线营销 广告投放 投放数据采集:曝 光/点击/用户行为 数据 数据分析 数据挖掘 优化投放策略 广告监测/数据分析:优化广告主的在线营销策略,提升广告转化率
AdMaster 广告数据采集分析架构 曝光/点击 /用户行为 LVS Nginx Nginx … Tornado Tornado
log log 数据处理(PyPy) 清洗/扩充/回溯 HDFS Hadoop 实时 数据 汇总 … 华北 华南 … • 用 PyPy 跑 Tornado • 相比 CPython 性能提升 > 30% • 内存使用大,但无泄露
Python 在 Hadoop 处理中的角色 参数 输入 Python *处理输入输出 *控制 Pig
脚本 Pig 算法1 Hadoop 计算结果 Pig 算法2 … 2: 生成脚本 1 3: 执行 MapReduce 计算 4: 返回 MR 结果 5 • 每天新增 TB 级数据 • 每天对千亿行数据进行 各种维度的计算
微博分析工具 WeiboMaster • 企业级 • 微博营销分析管理平台 • 新浪 + 腾讯
• 管理发布 • 指标分析 • 舆情监控
微博分析工具 WeiboMaster 架构 MongoDB MySQL Django Twisted Spider Celery 微博
API 数据 NLP 服务 Worker Worker … Distributed • 每天数千万次微博 API 调用 • Mongodb 累计数据条目数接近 1B
NLP 服务介绍 • RESTful API: Tornado • 进程控制: Supervisor •
libsvm, SciPy,NumPy • 服务被多个产品线使用
AdMaster 介绍 • 中国领先的独立第三方数字营销全流程解决方案供应商;提供包括媒体审计、受 众分析、社交媒体评估、舆情监测、在线调研等全方位的效果评估解决方案; • AdMaster 成立于 2006 年,设有上海、北京、广州
3 家公司; • 宝洁、海尔、LVMH、大众等全球 500 强公司,累计近 3000 个数字营销项目; • 已完成 B 轮融资。 We are hiring! Python Ruby PHP HTML5 MongoDB Hadoop GIT Erlang
Thank you! 新浪微博:@陆丹峰