Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GitRadar——毕业论文答辩

 GitRadar——毕业论文答辩

Shuai Liu

June 30, 2014
Tweet

More Decks by Shuai Liu

Other Decks in Programming

Transcript

  1. 基于GitHub开放数据的   开发者能力评价系统   刘帅     1103710207   指导教师

      计算机科学与技术学院  吴晋   的设计与实现
  2. 内容提要 •  项目来源 &  背景   •  需求分析   • 

    系统设计 &  实现   •  运行结果 &  性能分析   •  结论  
  3. 非功能需求 •  性能   •  数据处理   •  网络访问  

    •  可靠性   •  数据的可靠性   •  系统的可用性
  4. GitHub上开发者评价模型设计 开发者 对 软件项目 做了操作 做了什么 软件项目 开发者 项目被star的个数 ×

     star权重 +  项目被fork个数 ×  fork权重 PushEvent、 IssueEvent、PullRequestEvent 截止到某一时间点开发者的所有行为价值之和
  5. 总体实现方案 •  Python     •  Node.js   •  MongoDB

     +  Redis   •  并发操作的实现:多进程 +  协程   •  gevent  +  whoosh  +  Fluentd  +  SemanHc-­‐UI  +  mapbox.js  +  high-­‐charts  
  6. 性能测试 •  每天行为总数量:50万(平均每小时2万)   •  经过数据清洗后:12万(平均每小时5000)   •  调用地名规范化的Web  Service次数:≤800

      •  缓存命中次数:≥7.5万,缓存数量:2.4万,命中率:98%   •  平均每天数据处理所需时间:约300秒