Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
PyCon2012ChinaBj-AdMaster
Search
Zoom.Quiet
October 20, 2012
Programming
1
500
PyCon2012ChinaBj-AdMaster
http://cn.pycon.org/2012/schedulebj
Zoom.Quiet
October 20, 2012
Tweet
Share
More Decks by Zoom.Quiet
See All by Zoom.Quiet
PyCon2014China-Zhuhai-high performance
zoomquiet
0
170
PyCon2014China-Zhuhai-meta programming
zoomquiet
1
140
PyCon2014China-Zhuhai-bpm.py
zoomquiet
0
120
PyCon2014China-Zhuhai-luna kv db
zoomquiet
0
98
PyCon2014China-Zhuhai-seed studio
zoomquiet
0
110
PyCon2014China-Zhuhai-Docker Registry Build By Python
zoomquiet
0
130
PyCon2014China-Zhuhai-jeff
zoomquiet
0
97
PyCon2014China-Zhuhai-pythonic front-end
zoomquiet
0
130
DevFest2014-Zhuhai-Polymer
zoomquiet
0
430
Other Decks in Programming
See All in Programming
S3 VectorsとStrands Agentsを利用したAgentic RAGシステムの構築
tosuri13
6
310
Navigation 3: 적응형 UI를 위한 앱 탐색
fornewid
1
330
【CA.ai #3】Google ADKを活用したAI Agent開発と運用知見
harappa80
0
310
dotfiles 式年遷宮 令和最新版
masawada
1
770
「コードは上から下へ読むのが一番」と思った時に、思い出してほしい話
panda728
PRO
38
26k
Why Kotlin? 電子カルテを Kotlin で開発する理由 / Why Kotlin? at Henry
agatan
2
7.2k
実は歴史的なアップデートだと思う AWS Interconnect - multicloud
maroon1st
0
150
バックエンドエンジニアによる Amebaブログ K8s 基盤への CronJobの導入・運用経験
sunabig
0
160
関数実行の裏側では何が起きているのか?
minop1205
1
700
Tinkerbellから学ぶ、Podで DHCPをリッスンする手法
tomokon
0
130
テストやOSS開発に役立つSetup PHP Action
matsuo_atsushi
0
160
認証・認可の基本を学ぼう前編
kouyuume
0
200
Featured
See All Featured
How to Think Like a Performance Engineer
csswizardry
28
2.4k
Unsuck your backbone
ammeep
671
58k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
1k
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Six Lessons from altMBA
skipperchong
29
4.1k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
54k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Transcript
Python 在互联网广告 监测分析中的应用 @陆丹峰 from AdMaster (精硕科技)
互联网广告简介 * 广告,和”游戏”、”电子商务”为互联网三大主要盈利途径 * 广告形式:文字链、静态图片、动态Flash、交互式等 * 投放渠道:门户、搜索、视频、微博、SNS、手机…
互联网广告目的:在线营销 广告投放 投放数据采集:曝 光/点击/用户行为 数据 数据分析 数据挖掘 优化投放策略 广告监测/数据分析:优化广告主的在线营销策略,提升广告转化率
AdMaster 广告数据采集分析架构 曝光/点击 /用户行为 LVS Nginx Nginx … Tornado Tornado
log log 数据处理(PyPy) 清洗/扩充/回溯 HDFS Hadoop 实时 数据 汇总 … 华北 华南 … • 用 PyPy 跑 Tornado • 相比 CPython 性能提升 > 30% • 内存使用大,但无泄露
Python 在 Hadoop 处理中的角色 参数 输入 Python *处理输入输出 *控制 Pig
脚本 Pig 算法1 Hadoop 计算结果 Pig 算法2 … 2: 生成脚本 1 3: 执行 MapReduce 计算 4: 返回 MR 结果 5 • 每天新增 TB 级数据 • 每天对千亿行数据进行 各种维度的计算
微博分析工具 WeiboMaster • 企业级 • 微博营销分析管理平台 • 新浪 + 腾讯
• 管理发布 • 指标分析 • 舆情监控
微博分析工具 WeiboMaster 架构 MongoDB MySQL Django Twisted Spider Celery 微博
API 数据 NLP 服务 Worker Worker … Distributed • 每天数千万次微博 API 调用 • Mongodb 累计数据条目数接近 1B
NLP 服务介绍 • RESTful API: Tornado • 进程控制: Supervisor •
libsvm, SciPy,NumPy • 服务被多个产品线使用
AdMaster 介绍 • 中国领先的独立第三方数字营销全流程解决方案供应商;提供包括媒体审计、受 众分析、社交媒体评估、舆情监测、在线调研等全方位的效果评估解决方案; • AdMaster 成立于 2006 年,设有上海、北京、广州
3 家公司; • 宝洁、海尔、LVMH、大众等全球 500 强公司,累计近 3000 个数字营销项目; • 已完成 B 轮融资。 We are hiring! Python Ruby PHP HTML5 MongoDB Hadoop GIT Erlang
Thank you! 新浪微博:@陆丹峰