布隆过滤器 Bloom Filter 发表于 2018-12-14 | 分类于 Algorithm , Bloom Filter | | 阅读次数: 布隆过滤 Bloom Filter 它主要用于解决判断一个元素是否在一个集合中,优势在于只需要占用很小的内存空间以及有着高效的查询效率。 1.原理 它是一个保存了很长的二级制向量,同时结合 Hash 函数实现的。 如上图所示: 首先需要初始化一个二进制的数组,长度设为 L(图中为 8),同时 ... 阅读全文 »
Google面试题(选自公众号) 发表于 2018-12-14 | 分类于 Algorithm , Topics | | 阅读次数: Google面试题(选自公众号)问题把你的手机拨号页想象成一个棋盘。棋子走只能走“L”形状,横着两步,竖着一步;或者竖着两步,横着一步。 现在,假设你拨号只能像棋子一样走“L”形状。每走完一个“L”形拨一次号,起始位置也算拨号一次。问题:从某点开始,在N步内,你可以拨到多少不同的数字? 讨论每次面 ... 阅读全文 »
Selenium 发表于 2018-12-14 | 分类于 Python | | 阅读次数: Selenium1.配置环境1.1 安装seleniumpip install selenium 1.2 安装webdriver安装Chrome的webdriver插件 https://sites.google.com/a/chromium.org/chromedriver/downloads 下载 ... 阅读全文 »
Python爬虫 发表于 2018-12-14 | 分类于 Python | | 阅读次数: Python爬虫 以爬取豆瓣电影评价为例 1.准备headerdef get_header(movie_id): UserAgent_List = [ "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTM ... 阅读全文 »
关系型和非关系型数据库对比 发表于 2018-12-11 | 分类于 DataBase | | 阅读次数: 关系型数据库 Structured Query Language1.优点 事务处理时保持数据的一致性 如果读取的过程中其他事务对数据有写入操作,查询出来的结果也依旧是读取开始前的状态,不会呈现修改后的结果。 以标准化为前提,数据更新的开销很小(相同字段基本上只有一处) 可以使用join等复杂 ... 阅读全文 »