Upgrade to Pro — share decks privately, control downloads, hide ads and more …

PyCon2012ChinaBj-AdMaster

Zoom.Quiet
October 20, 2012

 PyCon2012ChinaBj-AdMaster

Zoom.Quiet

October 20, 2012
Tweet

More Decks by Zoom.Quiet

Other Decks in Programming

Transcript

  1. AdMaster 广告数据采集分析架构 曝光/点击 /用户行为 LVS Nginx Nginx … Tornado Tornado

    log log 数据处理(PyPy) 清洗/扩充/回溯 HDFS Hadoop 实时 数据 汇总 … 华北 华南 … • 用 PyPy 跑 Tornado • 相比 CPython 性能提升 > 30% • 内存使用大,但无泄露
  2. Python 在 Hadoop 处理中的角色 参数 输入 Python *处理输入输出 *控制 Pig

    脚本 Pig 算法1 Hadoop 计算结果 Pig 算法2 … 2: 生成脚本 1 3: 执行 MapReduce 计算 4: 返回 MR 结果 5 • 每天新增 TB 级数据 • 每天对千亿行数据进行 各种维度的计算
  3. 微博分析工具 WeiboMaster 架构 MongoDB MySQL Django Twisted Spider Celery 微博

    API 数据 NLP 服务 Worker Worker … Distributed • 每天数千万次微博 API 调用 • Mongodb 累计数据条目数接近 1B
  4. NLP 服务介绍 • RESTful API: Tornado • 进程控制: Supervisor •

    libsvm, SciPy,NumPy • 服务被多个产品线使用
  5. AdMaster 介绍 • 中国领先的独立第三方数字营销全流程解决方案供应商;提供包括媒体审计、受 众分析、社交媒体评估、舆情监测、在线调研等全方位的效果评估解决方案; • AdMaster 成立于 2006 年,设有上海、北京、广州

    3 家公司; • 宝洁、海尔、LVMH、大众等全球 500 强公司,累计近 3000 个数字营销项目; • 已完成 B 轮融资。 We are hiring! Python Ruby PHP HTML5 MongoDB Hadoop GIT Erlang