微博如何使用大数据存储技术
Mongodb和Redis,Mongodb可以满足大量数据的存储,Redis是内存数据库,适合Key-Value形式的快速读写,适合做缓存,占用内存资源多,不适合存储大量数据。
微博是近几年发展得极为火热的信息发布和分享平台,可以发布微博、分享信息、评论和参与话题的讨论。为了让用户及时了解到最热门的话题、最热门的信息。
需要对微博系统中的数据进行实时处理和分析。而Storm是一个免费开源、分布式的、具有很好容错性的实时计算系统,通过Storm可以实时处理微博系统中的数据,并根据处理结果向用户进行实时热门推送。
微博大数据:
微博其实和淘宝是很类似的。一般来说,第一代架构,基本上能支撑到用户到 百万 级别,到第二代架构基本能支撑到 千万 级别都没什么问题,当业务规模到 亿级别时,需要第三代的架构。
从LAMP的架构到面向服务的架构,有几个地方是非常难的,首先不可能在第一代基础上通过简单的修修补补满足用户量快速增长的,同时线上业务又不能停,这是我们常说的在飞机上换引擎的问题。
建议在做服务化的时候,首先更多是偏向业务的梳理,同时要找准一个很好的切入点,既有架构和服务化上的提升,业务方也要有收益,比如提升性能或者降低维护成本同时升级过程要平滑,建议开始从原子化服务切入,比如基础的用户服务, 基础的短消息服务,基础的推送服务。
第二,就是可 以做无状态服 务,后面会详细讲,还有数据量大了后需要做数据Sharding,后面会将。第三代 架构 要解决的 问题,就是用户量和业务趋于稳步增加(相对爆发期的指数级增长),更多考虑技术框架的稳定性, 提升系统整体的性能,降低成本,还有对整个系统监控的完善和升级。