nosql面试上篇,nosql面试题

java面试中redis，mongodb类的，会问哪些问题，怎么回答

1、可能会问nosql和关系型数据库的区别：

公司主营业务：成都网站建设、做网站、移动网站开发等业务。帮助企业客户真正实现互联网宣传，提高企业的竞争能力。创新互联建站是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化，感谢他们对我们的高要求，感谢他们从不同领域给我们带来的挑战，让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。创新互联建站推出赣州免费做网站回馈大家。

优点：

1）成本：nosql数据库简单易部署，基本都是开源软件，不需要像使用Oracle那样花费大量成本购买使用，相比关系型数据库价格便宜

2）查询速度：nosql数据库将数据存储于缓存之中，关系型数据库将数据存储在硬盘中，自然查询速度远不及nosql数据库

3）存储数据的格式：nosql的存储格式是key,value形式、文档形式、图片形式等等，所以可以存储基础类型以及对象或者是集合等各种格式，而数据库则只支持基础类型

4）扩展性：关系型数据库有类似join这样的多表查询机制的限制导致扩展很艰难

缺点：

1）维护的工具和资料有限，因为nosql是属于新的技术，不能和关系型数据库10几年的技术同日而语。

2）不提供对sql的支持，如果不支持sql这样的工业标准，将产生一定用户的学习和使用成本

3）不提供关系型数据库对事物的处理

2、介绍下redis和mongodb：

自行google。

3、应用场景：

redis：

a.主要是做热点数据缓存。

b.数据过期处理。

c.消息队列等功能。

d.计数，例如投票等。

mongodb：

mongodb的主要目标是在键/值存储方式（提供了高性能和高度伸缩性）以及传统的RDBMS系统（丰富的功能）架起一座桥梁，集两者的优势于一身。mongo适用于以下场景：

a.网站数据：mongo非常适合实时的插入，更新与查询，并具备网站实时数据存储所需的复制及高度伸缩性。

b.缓存：由于性能很高，mongo也适合作为信息基础设施的缓存层。在系统重启之后，由mongo搭建的持久化缓存可以避免下层的数据源过载。

c.大尺寸、低价值的数据：使用传统的关系数据库存储一些数据时可能会比较贵，在此之前，很多程序员往往会选择传统的文件进行存储。

d.高伸缩性的场景：mongo非常适合由数十或者数百台服务器组成的数据库。

e.用于对象及JSON数据的存储：mongo的BSON数据格式非常适合文档格式化的存储及查询。

4、支持的数据类型:

内容比较多，自行将网上的信息整理一下。

Python后端开发工程师面试

第一步：自我介绍

第二步：公司介绍

第三步：技术基础

第四步：项目介绍

第五步：待遇

自我介绍，简单直接，姓名，籍贯，大学，工作经历

示例如下：

你好，面试官，我叫XX，来自XX，本科毕业于XX，主修XX专业，有X年工作经验，在上一家公司担任python后端开发工程师的职位。

公司名称是XX、公司主要做外包软件、都有软件定制/商城定制、前端2个后端2个运维1个

主要是根据你简历中填写的技术，根据我的简历中所写的，总结几点如下：

字典的查询流程：

不可变对象可哈希， str ， fronzenset ， tuple ，自己实现的类，要重载 __hash__ 方法。

dict内存花销大，但是查询速度快，自定义的对象或者python内部的对象都是dict包装的。

dict的存储顺序和元素添加顺序有关，添加顺序可能改变已有数据的顺序。

集合：是一个可以存放任意数据类型的可变无序的映射集合。

set和dict类似，set的核心也是散列表，但是表元只包含值的引用。由于散列表的特性，set的元素不能重复，且无序。内部由哈希实现，查找的时间复杂度为O(1)，所以性能很高，实现了魔法函数 __contains__ 可以使用in来查找。 set的去重是通过两个函数 __hash__ 和 __eq__ 实现的。

（1）浅拷贝

定义：浅拷贝只是对另外一个变量的内存地址的拷贝，这两个变量指向同一个内存地址的变量值。

浅拷贝的特点：

（2）深拷贝：

定义：一个变量对另外一个变量的值拷贝。

深拷贝的特点：

Python GC主要使用引用计数（reference counting）来跟踪和回收垃圾。在引用计数的基础上，通过“标记-清除”（mark and sweep）解决容器对象可能产生的循环引用问题，通过“分代回收”（generation collectio n）以空间换时间的方法提高垃圾回收效率。

GIL全称 Global Interpreter Lock ，中文解释为全局解释器锁。它并不是Python的特性，而是在实现python的主流Cpython解释器时所引入的一个概念，GIL本质上就是一把互斥锁，将并发运行变成串行，以此来控制同一时间内共享数据只能被一个任务所修改，从而保证数据的安全性。

GIL保护的是解释器级别的数据，但是用户自己的数据需要自己加锁处理。

既然有了GIL的存在，一个进程中同一时刻只有一个线程能够被执行，无法利用cpu的多核机制，导致多线程用于I/O密集型，多进程用于计算密集型，如金融分析等。

死锁：两个或两个以上的进程或者线程在执行过程中，因为争夺资源而造成的互相等待现象，若无外力的作用，都将一直处于阻塞状态，这些互相等待的进程或者线程就被称为死锁。

解决方法，使用递归锁（RLock）

这个RLock内部有一个Lock和一个counter变量，counter记录着acquire的次数，从而使得资源可以被多次require。直到一个线程所有的acquire都被release，其他的线程才能获得资源。上面的例子如果使用RLock代替Lock，则不会发生死锁

可以直接认为是linux，毕竟搞后端的多数是和linux打交道。

那么如何避免粘包问题呢? 归根结底就是一句话, 明确两个包之间的边界.

UDP不存在粘包问题，是由于UDP发送的时候，没有经过Negal算法优化，不会将多个小包合并一次发送出去。另外，在UDP协议的接收端，采用了链式结构来记录每一个到达的UDP包，这样接收端应用程序一次recv只能从socket接收缓冲区中读出一个数据包。也就是说，发送端send了几次，接收端必须recv几次（无论recv时指定了多大的缓冲区）。

存储可能包含rdbms，nosql以及缓存等，我以mysql,redis举例**

PHP面试有什么技巧么？

PHP程序员在面试的时候一般应该抓住以下几个点。

一、应该介绍自己掌握的开发一种，主要介绍PHP语言的独特语法以及如何使用，比如PHP语言会比CGI更快的执行动态页面。

二、必须熟悉Oracle、Mysql等数据库，并能简单的介绍自己掌握的程度。由于php做出的动态页面比用其他语言做出来的页面在执行效率以及CGI方面高得多，所以你还需要在面试中说出自己的文档撰写能力很强。

三、PHP程序员应该具备独立分析和解决问题的能力，可以在自我介绍中讲讲自己曾经遇到过的问题是如何解决的。让面试官看到你的能力，这将会直接影响到你自我介绍的成功与否。

四、一个PHP程序员必须有良好的职业道德和工作态度，所以在面试中应该尽量讲自己在做项目时的认真态度以及今后的工作规划，表现出自己的进取心。

五、还有关于沟通能力和理解能力的体现，这个在与HR的交谈中就可以表现出来，所以需要做的工作就是从容的有条理的把自我介绍说完，回答每一个问题时都应该简洁明了，关于自我介绍可以提前做个草稿，背一下。

六、团队合作能力也是企业非常看重的，在培训中老师一般都会带领大家做项目，大的项目一般会分小组，每个人都有相对应的任务，这就模拟了公司中的团队合作，在自我介绍过程中要把做项目的具体流程以及相互协作的过程说出来，让HR看到自己具备团队合作的能力。

七、最后就是执行力，每当任务分配下来的时候该如何执行，还有自己讲过职业规划后该如何执行，还有在学习的过程中是如何人字形的，遇到困难又是如何执行的，这些都可以体现出php程序员的执行力，回答的时候抓住发现及时寻找原因，快速展开行动的这个主线即可。

八、最重要的是你的能力、技术以及自己的项目

Python后端工程师面试题目有哪些

一.语言

1.推荐一本看过最好的python书籍？

2.谈谈python的装饰器，迭代器，yield？

3.标准库线程安全的队列是哪一个？不安全的是哪一个？logging是线程安全的吗？

4.python适合的场景有哪些？当遇到计算密集型任务怎么办？

5.python高并发解决方案？我希望听到twisted-tornado-gevent，能扯到golang,erlang更好

二.操作系统

可以直接认为是linux，毕竟搞后端的多数是和linux打交道。

1.tcp/udp的区别？tcp粘包是怎么回事，如何处理？udp有粘包吗？

2.time_wait是什么情况？出现过多的close_wait可能是什么原因？

3.epoll,select的区别？边缘触发，水平触发区别？

三.存储

存储可能包含rdbms，nosql以及缓存等，我以mysql,redis举例

mysql相关

1.谈谈mysql字符集和排序规则？

2.varchar与char的区别是什么？大小限制？utf8字符集下varchar最多能存多少个字符

3.primary key和unique的区别？

4.外键有什么用，是否该用外键？外键一定需要索引吗？

5.myisam与innodb的区别？innodb的两阶段锁定协议是什么情况？

6.索引有什么用，大致原理是什么？设计索引有什么注意点？

redis相关

1.什么场景用redis，为什么mysql不适合？

2.谈谈redis的事务？用事务模拟原子+1操作？原子操作还有其它解决方案吗？

3.redis内存满了会怎么样？

四.安全

web安全相关

1.sql注入是怎么产生的，如何防止？

2.xss如何预防？htmlescape后能否避免xss?

3.csrf是什么？django是如何防范的？

密码技术

1.什么是分组加密？加密模式有哪些？ecb和cbc模式有什么区别？为什么需要iv向量？

2.简单说说https的过程？

3.对称加密与非对称加密区别？

3.如何生成共享秘钥？如何防范中间人攻击？

五.杂

是否关注新技术啊？golang，rust是否了解？numpy,pandas是啥鸟？

是否紧跟时代潮流？逛不逛微博，刷不刷知乎？

可能你觉得我问的好细，但这好多都是平常经常遇到，并需要解决的，细节更能体现一个人。

如果你觉得小kiss，欢迎投简历给我yihaibo@longtugame.com，龙图游戏运营支持中心数据分析部招人；觉得有点问题，那还等什么，赶快来和我交流交流。

更新:讨论区挺热闹，有人说好简单，有人说好难，其实我觉得这只适合面试2~3年工作经验的后端工程师。真的没有问

很难的题目，只是可能你平时没有注意。

在这里我推荐几本书吧

python参考手册，绝对让你更上一层楼

图解密码技术，密码入门不二之选

mysql技术内幕第五版，有点厚当手册读读，要有耐心，高性能mysql也强烈建议读读

effective tcp/ip programming

为什么评论区有这么大差异？我想是个人经历不一样吧，如果是搞web的对操作系统这块和密码技术会偏弱，但如果是系统工程师或是游戏服务端这块会明显偏强。

六.后记

最近我也面试了不少童鞋，我发现能达到要求的真的少之又少，很多hr都说Python是最难招聘的岗位，我想是有道理的，这真的很值得我们去深思？

我想有一部分原因是Python这门语言造成的，会写Python的人很多，但写的好的人很少，大部分都把Python当做脚本来写，缺乏面向对象，模式的思想。想想Java，大家都习惯了接口，实现分离，设计模式在Java中也喊了很多年，尤其是ssh三大框架一出，用着用着就理所当然的认为就该这么做，虽然也有点坏处，但对企业级Java开发无疑是一大进步。

反观Python，尤其是生成器，协程，元类给Python注入了很大的灵活性，想写的Pythonic有不小难度，但其实Python高级特性就那么几个，干掉了也就没有了。

当你觉得Python遇到了瓶颈，不妨停下来好好想想。研究研究设计模式，想想重构，了解领域驱动设计，敏捷开发，再回来读读以前写的代码，当眼界变高了，代码也就美了。

当然思想的提高不是一朝一夕，模式，原则会经常让你纠结，纠结就会思索，思考就走出了自己的路，当然条条大路通罗马。

数据库等存储技术是研发工程师迈不过的坎，对关系数据库以mysql举例来说，你必须清楚的知道什么字段选择什么类型，类型字节大小，限制条件，这东西也很容易理解，多想想即可，比如set类型，要支持交并等操作，1个字节只能存8个类别。数据类型搞定了，下面就是索引了，mysql索引种类？主键，唯一索引，普通索引。索引类别，BTree索引，hash索引。索引的优缺点，mysql的索引查找原理，join原理(大部分都是nested loop)，以及一些特殊的情况，比如mysql子查询慢等。其实到这里研发工程师就差不多，当然你可以继续深入下去，比如读写分离，集群管理，甚至一些参数调优。

如何面试 PHP 工程师

问一些日常的正常的PHP问题，主要是考察应聘者的认知：

一个包含中英文的字符串如何获得它的自然长度（看看ta是否有encoding的知识和意识）

问一问什么是ORM，有时候会问这个词的英文全称是什么，问问ta对于ORM有什么个人的看法？（看看ta学习细不细，有没有技术判断，PHP开发人员应该知道什么时候使用ORM）

问一问假如ta要自己去实现一个framework，ta会怎么设计。（看看ta对代码架构的理解，对MVC的理解）

问一问framework设计里的url dispatcher他会怎么考虑。（HTTP知识）

问一问ta对框架本身的看法

了解一下ta对Design Pattern的认知，比如Singleton，Observer，Factory等常用的设计模式，问一问ta对设计模式本身的看法。

问两三个数据库设计的问题

问几个前端的问题，哪怕ta的职位是PHP开发人员，好的PHP人员不可能不了解前端，而且很可能很了解前端

问一问ta对noSQL的了解情况（对与noSQL的认识是和传统Relational DB的认知是分不开的）

问一问ta碰到问题时候会如何去寻找答案

问一问ta习惯使用哪一个搜索引擎（如果是就有加分）

问一问ta最近看的书

问一问ta的职业规划，喜欢做什么，对工作环境有什么要求

别出生僻的题，别为难人家，更不要变相的侮辱人家，正常交流为主，你要的是一个正常的人，优秀不优秀就看你的眼光和运气了。

很多公司的技术人员招聘会刻意追求刺激的问题，比如很著名的微软的“下水道的盖子为什么是圆的”，不是说这些考察毫无道理，但更多的是一种“marketing”的手段。

美国大数据工程师面试攻略

项目数据分析师分享：美国大数据工程师面试攻略

方法/步骤

先做一个自我介绍，本科南开后，加入了一个创业公司kuxun，做实时信息检索，后来进入百度基础架构组，搭建了Baidu App Engine的早期版本，随后去Duke大学留学，在攻读硕士期间，做跟Hadoop大数据相关的研究项目Starfish，之后在Amazon EC2部门实习，了解它们的内部架构，毕业后加入Linkedin，做广告组的架构，涉及Hadoop调优，Data Pipeline, Offline/Online, 实时系统。最新是在Coursera从事数据工程师工作。在多年工作中，除了对技术的不懈追求，也积累了大量的面试经验，从国内的一线互联网百度，阿里巴巴，奇虎，人人，到美国一线公司Facebook，Google，Linkedin，Twitter，Amazon，到热门Startup，Uber，Pinterest，Airbnb，Box，Dropbox，Snapchat，Houzz，拿到10+ offer，并且在Linkedin期间也面试过100+候选人，参与面试题制定，乐于分享并帮助很多人成功求职，实现目标。

我们看一下这张硅谷地图，它坐落于美国加州，从圣何塞到旧金山的狭长地带，中间是San francisco bay，简称湾区。它的由来是这边有计算机核心处理器中离不开的硅，30年来，硅谷就发展成为无数技术性创业公司的摇篮。在20多年前，就有很多硬件公司的辉煌Intel，Oracle，Apple，Cisco成功上市，10年前，互联网的兴起，造就了Yahoo，Google，Ebay的神奇，而如今Tesla，Facebook，Twitter，Linkedin正扶摇直上，成为美股高科技股的领头羊。这些公司的市值从几十billion到几百billion，PE从负数到上千。疯狂的估值背后也改变了世界。

如果说硅谷成功是有原因的，我觉得有两点。地理位置是得天独厚吸引大量人才，这里有Stanford和加州州立高校提供智力库的支持，在硅谷可以看到来自全世界的最聪明的人，中国人，印度人，犹太人构成这些Engineer的主力。虽然国内做技术自嘲为码农，但在硅谷成为一个优秀工程师还是收获颇丰。另一方面创业是一个永恒的话题，在Stanford有个说法空气中都飘扬中创业的味道，一些早期员工通过上市套现又积累经验成了天使投资，Y Combinator，各种技术forum，meetup，创业导师，都很活跃。资本的力量功不可没，早年VC通过投资，收购，上市放大形成一个雪球效应。大家总喜欢问什么是next big thing，哪一个是下一个facebook，下一个musk，根据统计10年能成就一个千亿以上的公司，目前这个进程正在缩短。

我就拿Linkedin作为例子，介绍高科技公司（FLG）是什么样子。它是成立2003年的职业社交网站。在10年的发展中，也不是一下子爆发的，目前有3亿的全球用户，虽然跟Facebook，Google 10亿＋用户没法比，但是它有很好的护城河，用户定位高端精准，单位价值高。这张照片中左边这位是创始人Reid Hoffman，是Paypal黑帮成员，在硅谷也是呼风唤雨的大佬，目前是董事和投资人。中间这位是CEO Jeff，2013年被Glassdoor评为最佳CEO，作为职业经理人，成功帮助linkedin高速成长，他最喜欢提到transformation，希望我们每个员工能挑战自我，在各自岗位上进化。Linkedin提供了员工很好的福利，有号称湾区最佳的免费食堂，每个月一次的in day，hack day, 帮助员工内部创业的incumbator计划。它特点是数据驱动的开发产品，比如 People you may know, Job you may be interested, 我做过Sponroed Ads 都是需要很强数据背景和data scientist的支持。它的Biz model也很独特，有3个line，面向公司的招聘服务，面向广告商的市场服务，面向个人的订阅服务，还有最新Sales Solution，因为这么多可能性，成为华尔街的宠儿。

说硅谷，除了那些已经成功的大公司，不得不说现在最新的创业动向，这些代表了未来下一个FLG。我总结了一些领域和代表公司：云计算(box, dropbox)，大数据(cloudera)，消费互联网(pinterest)，健康(fitbit)，通讯(snapchat)，支付(square)，生活(uber)。这里是华尔街网站更新的最新融资规模，比如Uber就达到18Billion的估值，我当时拿到offer没去，还是觉得很疯狂，如果细看这张表，大家可以看到硅谷（蓝色）尤其是旧金山它们的融资规模远远大于其他地区，还是地理决定论。而在国内的两家xiaomi，jingdong都是在北京，而最近大家看到一些泡沫论，说什么阿里巴巴上市是否美股到顶，经纬VC创始人也提醒我们泡沫的风险，我无法判断。如果能参与到下一波浪潮里面去是很过瘾的。我推荐大家去看看浪潮之巅，奇点临近，我还是很期待未来20年的技术革命。

我个人热爱大数据，在硅谷这也是大家津津乐道的，有个笑话，big data is like teenage talking about sex, nobody know how to do it. 其实大家还是兴趣驱动就好，不要那么功利，大数据技术涉及太多，平常工作中也是慢慢积累，有无数的坑和技术细节需要克服。并不是说那个技术最热就要用哪个，如果你用不好，你的压力很大的，举个例子，你用某个开源数据库，发现它偶尔有数据丢失怎么办，如果这是线上服务，你不断收到报警，这时候你当时选用它的优点 scalable，容错性都没意义了。接着说大数据，这里面Hadoop作为行业标准，我面过的除了Google，微软不用，几乎所有的公司都在用，建议大家利用这个机会。这里面有三巨头，cloudera是老牌Hadoop咨询公司，Hadoop的创始人做CTO，Hortonworks也是很多Hadoop的committee，MapR是提出hdfs的erasure 编码方式高效而著名，它们都是融了巨资，模式也很像，先推出社区免费版，但有个商业版提供更好的管理。而今年出现一匹黑马，Spark，简单说就是内存级别的计算，比Hadoop框架里能节约IO，利用缓存，能适应批处理，迭代，流式计算。

这里看一下它的生态系统，如何学Hadoop是个循序渐进过程，先要理解学习它的core系统，HDFS, MapReduce, Common，在外围有无数的系统工具方便开发，我个人用过的是 Avro作为数据格式，Zookeeper作为选主的高可靠性的组件，Solr作为搜索接口，Pig搭建工作流，Hive 数据仓库查询，Oozie管理工作流，HBase 作为KV 分布式存储，mahout数据挖掘的库，Cassandra nosql 数据库。我建议初学的考虑Chinahadoop的课程。

而Hadoop本身也是个进化过程，几年前0.19版本，到0.20, 0.23分流成Yarn架构最后进化成Hadoop2.0, Hadoop1.0 和 2.0 它们的接口和组件是完全不同的，但总体上Hadoop 2.0 是趋势，因为它有Yarn这样分离的资源管理平台，可以以插件的方式开发上面的Application，解放了生产力，而像Spark，Storm这些新型处理器也是支持Hadoop 2.0的。这里是Hortonworks它们提出来的社区版本架构，可以说标准的制定者，一流的公司制定标准，其他的公司一般用只能用它们提供的稳定版，没有多少话语权。但从事大数据，并不见得是要去这些制定标准的公司，大量的应用也是非常考验架构的灵活性。并且能看到实际的产品，很有成就感。

说到今年火的，还是要看Spark。从去年至今，已经开了2届Spark大会，上千人的规模，无数人对比Hadoop 100倍的性能提升而兴奋。这里说它的背景是诞生于Berkeley的Amplab，它们有个很有名的BDAS(Berkeley Data Analytics Stack)，目前Spark已经成为Apache的顶级项目。去年这个实验室的教授跟学生出去成立Databricks公司，拉到两轮上千万的风投，有人成Spark是Hadoop的终结者吗？我看今年Spark大会上，所有的Hadoop大佬公司都是鼎力支持，像Cloudrea甚至放弃impala的一线支持而转变成Spark。如果这么发展下去，星星之火可以燎原啊。它里面用到Scala是一种函数式语言。里面的组件也很多，有Shark支持SQL类似Hive，有Spark Streaming，MLlib，Graphx，SparkR，BlinkDB。它的核心数据结构是RDD，可以跑在各种分布式系统上。总体上是个包容性＋侵略性的系统。我个人也很看好它们的发展。

新闻标题：nosql面试上篇,nosql面试题
网页URL：http://ybzwz.com/article/dssesie.html