大数据技术周报第 002 期

这里记录过去一周,大数据相关值得分享的东西,每周发布。

今天尝试写第二期,记录过去一周一点所见所闻。

图片

1、Google 开发者大会提前预热,公众号发彩蛋!

**今年9月,谷歌开发者大会将再次登录上海,**为大家带来新一轮的干货与惊喜。

IMG_8122.PNG

代码语言:javascript
复制
<!DOCTYPE html>
<html lang=”zh-cn“>

<head>
<title>Hello World</title>
<meta charset=”UTF-8“>
<meta name=”keywords“ content=”keynote ,session, code lab , workshop , sandbox“>
</head>

<body>
<h1>2019 Google 重头戏</h1>
<h2> 等你来发现</h2>
<ul>
<li>9月10-11日</li>
<li>上海浦东</li>
</ul>
<p>大量惊喜等待解锁</p>
<img src="http://t.cn/AijsPmUN">
<h3>期待相见!</h3>
</body>

</html>

2、百度搜索 VS Google 搜索

image.png

最近试了下在百度和 Google 搜索自己的id,结果真的差距不小。百度给 CSDN 的权重太高了。。(让人喷饭!)

最近字节跳动也在招募搜索工程师,字节跳动已经低调上线搜索产品。看样子也要动一块搜索的蛋糕了,很看好!

文章

1、美团:Hadoop Yarn 调度性能优化实践

YARN作为Hadoop的资源管理系统,负责Hadoop集群上计算资源的管理和作业调度。美团的YARN以社区2.7.1版本为基础构建分支。目前在YARN上支撑离线业务、实时业务以及机器学习业务。

2、HBase应用 | 用户购物行为分析(订单路径树)

分析用户从打开某网站到最终下单所点击的路径为订单路径树。

3、信息论入门教程 -- 阮一峰

信息论在信号处理、数据压缩、自然语言等许多领域,起着关键作用。虽然,它的数学形式很复杂,但是核心思想非常简单,只需要中学数学就能理解。本文使用了一个最简单的例子,帮助大家理解信息论。

4、Hive 参数官网原文

Hive 参数调优官方指南。

资源

1、Hadoop 2.x HDFS 源码解析,作者徐鹏

image.png

仅供学习,为了更好的体验可购买正版书籍。

链接:https://pan.baidu.com/s/1FFSjFENEhx1Hqqow6a4WEg 密码:qzmt

2、《从paxos到zookeeper分布式原理的实践》

分布式架构、一致性协议、Paxos 的工程实践、Zookeeper 与 Paxos、使用 Zookeeper、Zookeeper 的典型应用场景、Zookeeper 的技术内幕、Zookeeper 运维。

链接:https://pan.baidu.com/s/1XGahayfZUXZo-oq-__8zwg 密码:vz6x