大数据和云计算技术周报(第54期):NoSQL特辑

写在第54期

到底什么是NoSQL?公众号一系列前菜,大家可以看看:

NoSQL 还是 SQL ?这一篇讲清楚

新数仓系列:Hbase周边生态梳理(1)

新数仓系列:Hbase国内开发者生存现状(2)

新数仓系列:开源组件运营(3)

HBase 和 Cassandra的浅谈

本期有 HBase、MySQL、Spark、Kylin、MongoDB、分布式。 希望大家会喜欢!

以下是专门NoSQL集合正文,限于众编辑水平有限,不保证大家都喜欢。

1

HBase

①任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题。HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少。总结起来,大家遇到的主要问题无非是Full GC异常导致宕机问题、RIT问题、写吞吐量太低以及读延迟较大。

https://www.cnblogs.com/yingjie2222/p/6084255.html

②了解Hbase 原理的背后 它是如何实现高效I/O的。

https://mp.weixin.qq.com/s/cN8AWeC51HS1ld5FK-Nm7w

2

MySQL

INSERT ... ON DUPLICATE KEY UPDATE语句在innodb5.0版本存在的陷阱

https://blog.csdn.net/pml18710973036/article/details/78452688

3

Spark

本文旨在梳理出 Spark 内存管理的脉络,抛砖引玉,文中阐述的原理基于 Spark 2.1 版本,阅读本文需要读者有一定的 Spark 和 Java 基础,了解 RDD、Shuffle、JVM 等相关概念。

https://mp.weixin.qq.com/s/SFgiMa_cUEplc7cR89D0EA

4

Kylin

本文将介绍如何部署一个Apache Kylin集群,以及通过负载均衡提高查询并发度。

https://mp.weixin.qq.com/s/iGBDVoveRfZUW0wdZ46XEg

5

MongoDB

推荐语:本文讲述了Mongodb索引的结构,索引的使用技巧说明,索引维护操作。

https://m.imooc.com/mip/article/26887

6

分布式

分布式之数据库和缓存双写一致性方案解析,从 如下三点进行分析

1、缓存更新策略

2、对每种策略进行缺点分析

3、针对缺点给出改进方案

http://www.cnblogs.com/rjzheng/p/9041659.html

致谢:

周蓬勃、魏宏斌、王在道、孙亚飞、冯艺帆、陈少军、邓开表、朱洁、张少华