nosql书籍知乎的简单介绍
NoSQL在少量数据的存储上,与传统关系型数据库相比有什么劣势吗?
个人不认为nosql在少量数据存储上有啥优势。nosql主要解决的是auto sharding的问题,你不需要sharding,搞啥nosql. 作者:方圆 链接:
为平泉等地区用户提供了全套网页设计制作服务,及平泉网站建设行业解决方案。主营业务为网站建设、成都网站设计、平泉网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!
现在最成熟的开源nosql是什么?分别有什么优缺点
Apache三剑客:HBase, Cassandra, CouchDB。HBase的前景最为看好,因为它的开发者众多并且都是顶尖高手。Cassandra目前有很多否定的声音。CouchDB的小而精悍,赞誉很多,将要正式发布的CouchBase融合了MemBase和CouchDB,很令人期待。
HBase和Cassandra都是效仿Google的BigTable的基于列的数据库,它们都是用Java写的。另外一类似的数据库是HyperTable,百度用在一些后台分析,因为它是C++写的,速度比较快。不过HyperTable有点边缘,不太流行。这些基于列的开源数据库目前都比Goolge的BigTable差之少一个数量级
CouchDB是一个文档数据库。其最大的竞争者是MongoDB。MongoDB和HBase都采用主从服务器设计。CouchDB的服务器分布设计和Cassandra类似,Peer to Peer类型的。主从服务器设计一般能更好的strong consistent,属于CAP理论中的CP类型。 CouchDB和Cassandra一般认为都是eventual consistent,属于CAP理论中的AP类型。但其实MongoDB和Cassandra都可以设置成strong consistent或者eventual consistent。
以上所提到的数据库都支持MapReduce。好像出了HyperTable都支持非主键索引。HBase和strong consistent配置的MongoDB都支持最基本的锁定(HBase单行锁定,MongoDB单文档锁定),因此可以实现transaction,但是实现有点复杂和低效。单就transaction这一点,目前开源NoSQL数据库没有做的比较好的。
MongoDB的最大卖点是不需构建非主键索引也能执行很多查询。但是MongoDB的服务器分布设计实在不能让人恭维,可以说是NoSQL数据库中最Ugly的实现。
K-V数据库比较多,而且上面提到的基于列的数据库和文档数据库其实也都是K-V数据库。比较流行的纯种K-V数据库有:
Memcached: 非常流行,不支持持久化
VMWare's Redis: 很流行,新浪和知乎都在用,CP类型。
MemBase: 由很多Memcached的开发者开发,使用sqlite作底层存储。在社交游戏中用的比较多, zynga在用,CP类型。
Riak, 分布式实现和CouchDB/Cassandra比较像,AP类型。支持MapReduce。
Linkin's Voldemort, 在K-V中少见的eventual consistent ,AP类型。
TT, TC
纯基于二维座标索引的是Neo4j。但是现在MongoDB和CouchDB都集成这一特性。
目前CouchDB的开发者成立的公司CouchOne收购了MemBase,将其底层sqlite换成CouchDB推出了CouchBase,从而引入MapReduce以支持非主键索引。CouchBase暂时还没有正式发布官方正式版,不过快了。虽然CouchDB是eventual consistent的,但是CouchBase的开发者宣称CouchBase保持了MemBase的strong consistent特性,具体实现有待以后研究。
如果从成熟的角度来看,比较成熟并且十分流行的的有CouchDB,Memcached,Redis。
HBase和MongonDB和Cassandra都比较新,处于频繁更新之中。最有前途的是HBase,但是Hadoop/HBase集群的维护常常需要很多专业人员并且需要构建一个比较大的集群才能最大化体现出威力,因此用户主要是Facebook, yahoo, 百度和阿里巴巴等大公司。
个人比较期待CouchBase。
转载仅供参考,版权属于原作者。祝你愉快,满意请采纳哦
如何使用redis做mysql的缓存
大方向两种方案:
1.脚本同步:
自己写脚本将数据库数据写入到redis/memcached。
这就涉及到实时数据变更的问题(mysql row binlog的实时分析),binlog增量订阅Alibaba 的canal ,以及缓存层数据 丢失/失效 后的数据同步恢复问题。
2.业务层实现:
先读取nosql缓存层,没有数据再读取mysql层,并写入数据到nosql。
nosql层做好多节点分布式(一致性hash),以及节点失效后替代方案(多层hash寻找相邻替代节点),和数据震荡恢复了。
作者:liu kelin
链接:
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
知乎:SQL、R语言、python对没有计算机背景的人来说先学习哪个比较好
你是想做数据分析对吧?
建议啊,先学R,R能应付很多统计问题了
再去学python,python语法当然了必须先掌握,这个很简单,然后就是python有两个
跟数据分析密切相关的包,如果你想做数据分析,请把重点放在两个包上
再学sql吧,毕竟单纯的学sql没有什么意义,因为什么也做不了
sql 建议先学sql server,有了python的语法基础学sqlserver很简单,当然没有基础也能学,只是有一门语言基础学起来更容易
学完sql server 再学oracle,oracle一定要学,其他数据库根据需求来学,比如Nosql就非常好
想学习数据分析,有哪些书籍或资料参考学习
入门数据分析类
师父领进门,修行在个人。下面这两本书是入门数据分析必看的书籍,也是检验自己是否真的喜欢数据分析。
从0到1:《深入浅出数据分析》
为什么是它?借用一位读者的评价“我家的猫都喜欢这本书!”
01 内容简介
以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术;正文以后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
02 推荐理由
书名已经很好地表现出了这本书的优点——“深入浅出”。忘记烦恼,这本书与现实世界紧密互动,让你不再只有枯燥的理论,并且将知识图形化,复杂的概念简单化。
经典小黄书:《谁说菜鸟不会数据分析》
是本很好的书,但看过之后,这本书就真一文不值了。
01 内容简介
很多人看到数据分析就望而却步,担心门槛高,无法迈入数据分析的门槛。《谁说菜鸟不会数据分析》努力将数据分析写成像小说一样通俗易懂,使读者可以在无形之中学会数据分析,按照数据分析工作的完整流程来讲解。
02 推荐理由
数据分析的入门极品,但真的很入门,优缺兼有。对于入门理解来说是绝佳选择,对之后的修炼还是不够的。建议之前全都是自己瞎摸瞎撞搞数据分析的同学进行阅读,颇有醍醐灌顶之感。
分析工具类
与数据分析相关的工具非常之多,我们常用的有Excel、PPT、SQL等。如果您想精通他们,直接在哔哩哔哩搜索聚数云海,即可找到相关优质课程。
1.Excel
大家常说的Excel,但是不要以为你很会Excel!Excel是所有职场人必备的办公软件。Excel功能非常强大,在数据量不是很大的情况下,基本上都能用Excel实现数据分析。推荐如下书籍:
《Excel高效办公数据处理与分析》
01 内容简介
根据现代企业决策和管理工作的主要特点,从实际应用出发,介绍了Excel强大的数据处理与分析功能在企业决策和管理工作中的具体应用。
02 推荐理由
本书同时提供了大量需要你做的实例,学而不练是不存在的!
《别怕,Excel函数其实很简单》
01 内容简介
《别怕,Excel 函数其实很简单》用浅显易懂的图文、生动形象的比喻以及大量实际工作中的经典案例,介绍了Excel最常用的一部分函数的计算原理和应用技巧,还介绍了数据的科学管理方法,以避免从数据源头就产生问题。
02 推荐理由
适合希望提高办公效率的职场人士,特别是经常需要处理分析大量数据并制作统计报表的相关人员,以及相关专业的高校师生阅读,小白需谨慎!
2. SQL
SQL是数据分析的基础,是想要学会数据分析能力的必备技能。那这里我只给大家介绍三本书,第一本书零基础入门,第二是进阶,第三本是SQL中的字典,话不多说,我们直接上架。
《SQL基础教程》
01 推荐理由
介绍了关系数据库以及用来操作关系数据库的SQL语言的使用方法。书中通过丰富的图示、大量示例程序和详实的操作步骤说明,让读者循序渐进地掌握SQL的基础知识和使用技巧,切实提高编程能力。每章结尾设置有练习题,帮助读者检验对各章内容的理解程度。另外,本书还将重要知识点总结为“法则”,方便读者随时查阅。
本书107张图表+209段代码+88个法则,是零基础进阶人士必备!
SQL进阶:《SQL进阶教程》
01 推荐理由
本书是为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两部分,第一部分介绍了SQL语言不同寻常的使用技巧,带领读者从SQL常见技术,去探索新发现。旨在帮助读者提升编程水平;第二部分着重介绍关系数据库的发展史,把实践与理论结合起来,旨在帮助读者加深对关系数据库和SQL语言的理解。
本书不适合小白!适合具有半年以上SQL使用经验、已掌握SQL基础知识和技能、希望提升自己编程水平的读者阅读。
SQL辅导书籍
01 推荐理由
本书是麻省理工学院、伊利诺伊大学等众多大学的参考教材,由浅入深地讲解了SQL的内容,实例丰富,便于查阅。本书没有过多阐述数据库基础理论,而是专门针对一线软件开发人员,直接从SQL SELECT开始,讲述实际工作环境中最常用和最必需的SQL知识,实用性极强。
有一定SQL基础的人士可以将它当做一本字典使用,遇到问题可以查找相应内用。
3.Python
“人生苦短,我用Python”。Python编程语言是最容易学习,并且功能强大的语言。但是很多人声称自己精通Python,自己却写不出Pythonic的代码,对很多常用的包不是很了解。万丈高楼平地起,咱们先从Python中最最基础的开始。
《Python编程,从入门到实践》
01 推荐理由
本书最大的特点就是零基础完全不懂编程的小白也能够学习,新手想学习选它绝对错不了。知识点由浅入深循循渐进,并配有视频教程手把手教学,同时所需的软件也是免费的。本书也配有相关辅导书籍,有兴趣的话可以去看看,但是请记住,这本书是最核心的。
《利用Python进行数据分析》
01 推荐理由
不像别的编程书一样,从盘古开天辟地开始讲起。这本书是直接应用到数据分析的,所以很多在数据分析上应用不那么频繁的模块也就没有讲。
本书第二版针对Python 3.6进行了更新,并增加实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到新版本的pandas、NumPy、IPython和Jupyter。
4.R语言
R是用于统计分析、绘图的语言和操作环境。但是R是有一定难度的,没有基础的话请谨慎尝试!推荐书籍:
《R语言入门与实践》
01 推荐理由
本书通过三个精心挑选的例子,深入浅出地讲解如何使用R语言玩转数据。将数据科学家必需的专业技能融合其中,教会读者如何将数据存储到计算机内存中,如何在必要的时候转换内存中的数据值,如何用R编写自己的程序并将其用于数据分析和模拟运行。
案例提升类
《活用数据:驱动业务的数据分析实战》
01 推荐理由
是一本用数据来帮助企业破解业务难题的实操书,有理论、有方法、有实战案例。具有业务驱动、案例闭环、思维先导、实战还原4大特色,同时在思路上清晰连贯,在表达上深入浅出,既能帮助数据分析从业者入门和提升,也能辅助企业各业务部门和各级管理人员做量化决策。
《精益数据分析》
01 推荐理由
本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。
数据分析师适合看什么书
数据分析是一门专业且跨越多个领域的学科,我整理了数据分析师看的书,希望对你有所帮助:
数据分析师的必读书单:Excel
《谁说菜鸟不会数据分析》
知名度比较高的一套书,适合新手,优点是它和数据分析结合,而不是单纯地学习函数。学会函数适用的场景和过程比它本身更重要。
是否需要学习VBA是仁者见仁的答案。我个人不建议。Excel VBA的最大优势是适用性广,哪怕去其他行业其他职位,都离不开Excel,这时候它就是一个工作加分的亮点。但是在互联网行业,对数据分析师,VBA的性价比就不高了。
这里只推荐一本,因为我就翻过上面这本,还没全看…
数据分析师的必读书单:数据可视化
数据可视化的书不多。市面上多以编程为主,面向新手和设计的教程寥寥无几。 如果只是了解图表,看Excel的书籍也管用。
内容很丰富,涉及可视化的方方面面,也囊括更类编程语言和设计软件:Python+JS+R+Excel。作者还有另外一本书《数据之美》。
可视化是一门侧重灵感的学科,有一种入门技巧是从他人设计中学习,从模仿开始,了解他人是如何设计的,这个网络上有大量的信息图可以参考。当然数据分析师更需要的是如何发现,别只学习展示。
英文足够好,可以看Edward Tufte的著作:《The Visual Display of Quantitative Information》、《Envisioning Information》、《Beautiful Evidence》。他是数据可视化的领军人物,他的理念是反对为艺术效果而混淆或者简化数据。暂时没有中文版。
数据分析师的必读书单:分析思维
《金字塔原理》
分析思维首推《金字塔原理》,金字塔原理有些人说它晦涩难懂,我认为是芭芭拉这个老太有骗稿费之嫌,本书包含了报告、写文、演讲等诸多内容。可以细看可以快看。另外还有一本同名案例集,有兴趣可以买。
另外麦肯锡相关的书籍还有《麦肯锡意识》《麦肯锡工具》《麦肯锡方法》等。
《深入浅出数据分析》
深入浅出系列是对新手非常友好的丛书,用生动但啰嗦的语言讲解案例。厚厚的一本书翻起来很快。本书涉及的基础概念比较广,包含一点统计学知识,学下来对数据分析思维会有一个大概了解。
《精益数据分析》
国外的精益系列一直以互联网创业作内容导向,本书也属于此类。如果是互联网行业相关,可以看看。它介绍了不同领域的指标,以及产品不同时期的侧重点。案例都是欧美,这部分做参考用。
接下来的几本,是兴趣向读物。《黑天鹅》能拓展思维,讲叙了不确定性。《思考的技术》,大前研一的著作,也是咨询类经典。如果对咨询向的分析感兴趣,还可以看BCG系列,或者刷CaseBook。《批判性思维》,则是教你如何形成理性思维。
数据分析师的必读书单:SQL
数据库有很多种,常见有Oracle,MySQL,SQL Server等。我推荐学习MySQL,这是互联网公司的主流数据库。以后学习Hadoop生态时,MySQL也是最接近Hive语法的语言。
MySQL不需要专门看书学习,因为数据分析师以查询为主,不需要考虑数据性能、数据安全和架构的问题。使用搜索引擎能解决90%的问题,我就是w3cschool学的。
《MySQL必知必会》
如果真想买书看,可以看这本,适合新手向的学习,看基础概念和查询相关的章节即可。网络上大部分MySQL都是偏DBA的'。
如果想深入,可以看《高性能MySQL》,对分析师没啥用。至于另外一个方向NoSQL,对入门者还是小众了些。
如果有余力,就学习正则表达式吧,清洗数据的工作就靠它了。
数据分析师的必读书单:统计学
统计学是比较大的范围,分析师往后还需要学线性代数和矩阵、关系代数等。初学者不需要掌握所有公式定理的数学推导,懂得如何应用就行用。
《深入浅出统计学》
大概是最啰嗦的深入浅出系列,从卖橡皮鸭到赌博机的案例,囊括了常用的统计分析如假设检验、概率分布、描述统计、贝叶斯等。书本注重应用和趣味性,数学推理一般。
《商务与经济统计》
国外的经典教材,已经出到第十二版了。国外教材都有丰富有趣的案例,所以读起来会比国内的轻松不少。如果你还在读书,不妨买这本看一看。
名字既然有商务与经济,所以书中辅以了大量的相关案例。书内容很多,看起来不会快,适合细读。
《The Elements of Statistical Learning》
稍微有一些难度的英文书籍,属于进阶版统计学,国外很推崇。如果要往机器学习发展,这本书可以打下很好的基础。
以上书籍的难度是逐步递增的。统计学是机器学习的基础,是概率、矩阵等实际应用。现在已经有很多统计工具,Excel的分析工具库、传统行业的SPSS、SAS以及R、Python等,使用过程都不用计算推导,大学考试才会考,现在都是计算机解决,轻松不少。
数据分析师的必读书单:业务知识
不同领域的业务知识都不一样,这里以互联网举例。
《增长黑客》
增长黑客的概念就是随着这本书的畅销传播开来。增长黑客在国内即是数据分析+运营/产品的复合型人才。这本书好的地方在于拓展思路,告诉我们数据能够做什么,尤其是连AB测试都不清楚的新人。
实际涉及的业务知识不多,我推荐,是希望新人能够了解数据驱动的概念,这本算是我走上数据化运营的启蒙读物了。
《从零开始做运营》
知乎亮哥的书籍,互联网所有的数据都是和运营相关的,如果是新手,就以此学习业务知识。如果已经工作很多,就略过吧。
名称栏目:nosql书籍知乎的简单介绍
分享链接:http://ybzwz.com/article/hcoicc.html