HBase进阶 Posted on 2020-10-26 Edited on 2021-01-19 In Hadoop , HBase Views: Valine: Symbols count in article: 5.2k Reading time ≈ 5 mins. HBase进阶HBase中的HLogHBase中的MemStore 1. 架构 Read more »
Kafka进阶 Posted on 2020-04-21 Edited on 2021-01-19 In Hadoop , Kafka Views: Valine: Symbols count in article: 3.1k Reading time ≈ 3 mins. Kafka1. 知识点1.1 Kafka不能保证消息的全局有序,只能保证消息在partition内有序1.2 每个partition对应于一个log文件,该log文件中存储的就是生产者生成的数据,生产者生成的数据会不断的追加到该log的文件末端,且每条数据都有自己的offset1.3 kafka中的分片+索引 Read more »
Flink总结 Posted on 2020-10-20 Edited on 2021-01-12 In Flink Views: Valine: Symbols count in article: 3.1k Reading time ≈ 3 mins. Flink总结1. 状态一致性 at most once at least once exactly once 2. 端到端的状态一致性 Read more »
数仓架构 Posted on 2020-12-13 Edited on 2020-12-16 In DW Views: Valine: Symbols count in article: 2.8k Reading time ≈ 3 mins. 数仓架构1. 数据仓库特点: 面向主题 电商,流量,交易。。。 集成 各个数据源:数据库,日志,爬虫。。。 相对稳定 主要用来查询,不是用来删除和修改 反映历史变化 N年的记录,每个月、每个季度、每年的汇总记录 管理决策 分析数据 -> 指标 数据湖指的是所有的原始数据,数据仓库指经过处理的原始数据(四层) Read more »
Java 容器 Posted on 2020-12-09 Edited on 2020-12-12 In Java , Collection Views: Valine: Symbols count in article: 4.9k Reading time ≈ 4 mins. Java 容器 Collection List:可以重复 CopyOnWriteArrayList Vector ArrayList LinkedList Set:不可重复 HashSet & LinkedHashSet:HashSet无序,哈希表;LinkedHashSet 通过链表可以实现有序 SortedSet & TreeSet:有序,红黑树 EnumSet CopyOnWriteArraySet ConcurrentSkipListSet Read more »