My Octopress Blog

life and I

Slice Reading 080112

| Comments

Gizzard

Gizzard 这是一个Twitter开源的管理Mysql分片以及集群的方案。对Mysql一定加强

Twitter Mysql

Twitter Mysql 这是Twitter开源的后台记录数据的开源数据库,基于Mysql二次开发,对大数据处理做了优化

Zipkin

Zipkin 这是Twitter开源的分布式查询系统。利用了Facebook的开源日志系统Scribe。Twitter用其查询系统性能瓶颈,对系统进一步优化, 比如memcache请求,mysql重写太慢的select,以及部分服务超时。以 Apache Cassandra 为后端存储,Zookeeper前端协调。

Weka

Weka是一个用java写的开源的数据挖掘软件,类似SPSS。

相关参考书籍

数据挖掘:实用机器学习工具与技术(英文版•第3版) 机器学习

Comments