写在第54期
到底什么是NoSQL?公众号一系列前菜,大家可以看看:
NoSQL 还是 SQL ?这一篇讲清楚
新数仓系列:Hbase周边生态梳理(1)
新数仓系列:Hbase国内开发者生存现状(2)
新数仓系列:开源组件运营(3)
HBase 和 Cassandra的浅谈
本期有 HBase、MySQL、Spark、Kylin、MongoDB、分布式。 希望大家会喜欢!
以下是专门NoSQL集合正文,限于众编辑水平有限,不保证大家都喜欢。
1
HBase
①任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题。HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少。总结起来,大家遇到的主要问题无非是Full GC异常导致宕机问题、RIT问题、写吞吐量太低以及读延迟较大。
https://www.cnblogs.com/yingjie2222/p/6084255.html
②了解Hbase 原理的背后 它是如何实现高效I/O的。
https://mp.weixin.qq.com/s/cN8AWeC51HS1ld5FK-Nm7w
2
MySQL
INSERT ... ON DUPLICATE KEY UPDATE语句在innodb5.0版本存在的陷阱
https://blog.csdn.net/pml18710973036/article/details/78452688
3
Spark
本文旨在梳理出 Spark 内存管理的脉络,抛砖引玉,文中阐述的原理基于 Spark 2.1 版本,阅读本文需要读者有一定的 Spark 和 Java 基础,了解 RDD、Shuffle、JVM 等相关概念。
https://mp.weixin.qq.com/s/SFgiMa_cUEplc7cR89D0EA
4
Kylin
本文将介绍如何部署一个Apache Kylin集群,以及通过负载均衡提高查询并发度。
https://mp.weixin.qq.com/s/iGBDVoveRfZUW0wdZ46XEg
5
MongoDB
推荐语:本文讲述了Mongodb索引的结构,索引的使用技巧说明,索引维护操作。
https://m.imooc.com/mip/article/26887
6
分布式
分布式之数据库和缓存双写一致性方案解析,从 如下三点进行分析
1、缓存更新策略
2、对每种策略进行缺点分析
3、针对缺点给出改进方案
http://www.cnblogs.com/rjzheng/p/9041659.html
致谢:
周蓬勃、魏宏斌、王在道、孙亚飞、冯艺帆、陈少军、邓开表、朱洁、张少华