高性能mysql怎么样高性能mysql视频教程

高性能MySQL：一个诊断案例（3）

一个诊断案例（）

成都创新互联是一家专注网站建设、网络营销策划、小程序开发、电子商务建设、网络推广、移动互联开发、研究、服务为一体的技术型公司。公司成立十多年以来，已经为近千家食品包装袋各业的企业公司提供互联网服务。现在，服务的近千家客户与我们一路同行，见证我们的成长；未来，我们一起分享成功的喜悦。

我们看到了两种可能性要么是数据库导致了I/O（如果能找到源头的话那么可能就找到了问题的原因）要么不是数据库导致了所有的I/O 而是其他什么导致的而系统因为缺少I/O 资源影响了数据库性能我们也很小心地尽力避免引入另外一个隐式的假设磁盘很忙并不一定意味着MySQL 会有问题要记住这个服务器主要的压力是内存读取所以也很可能出现磁盘长时间无法响应但没有造成严重问题的现象

如果你一直跟随我们的推理逻辑就可以发现还需要回头检查一下另外一个假设我们已经知道磁盘设备很忙因为其等待时间很高对于固态硬盘来说其I/O 平均等待时间一般不会超过 / 秒实际上从iostat 的输出结果也可以发现磁盘本身的响应还是很快的但请求在块设备队列中等待很长的时间才能进入到磁盘设备但要记住这只是iostat 的输出结果也可能是错误的信息

究竟是什么导致了性能低下？

当一个资源变得效率低下时应该了解一下为什么会这样有如下可能的原因

资源被过度使用余量已经不足以正常工作

资源没有被正确配置

资源已经损坏或者失灵

回到上面的例子中 iostat 的输出显示可能是磁盘的工作负载太大也可能是配置不正确（在磁盘响应很快的情况下为什么I/O 请求需要排队这么长时间才能进入到磁盘？）然而比较系统的需求和现有容量对于确定问题在哪里是很重要的一部分大量的基准测试证明这个客户使用的这种SSD 是无法支撑几百MB/s 的写操作的所以尽管iostat 的结果表明磁盘的响应是正常的也不一定是完全正确的在这个案例中我们没有办法证明磁盘的响应比iostat 的结果中所说的要慢但这种情况还是有可能的所以这不能改变我们的看法可能是磁盘被滥用注或者是错误的配置或者两者兼而有之是性能低下的罪魁祸首

在检查过所有诊断数据之后接下来的任务就很明显了测量出什么导致了I/O 消耗不幸的是客户当前使用的GNU/Linux 版本对此的支持不力通过一些工作我们可以做一些相对准确的猜测但首先还是需要探索一下其他的可能性我们可以测量有多少I/O来自MySQL 但客户使用的MySQL 版本较低以致缺乏一些诊断功能所以也无法提供确切有利的支持

作为替代基于我们已经知道MySQL 如何使用磁盘我们来观察MySQL 的I/O 情况通常来说 MySQL 只会写数据日志排序文件和临时表到磁盘从前面的状态计数器和其他信息来看首先可以排除数据和日志的写入问题那么只能假设MySQL 突然写入大量数据到临时表或者排序文件如何来观察这种情况呢？有两个简单的方法一是观察磁盘的可用空间二是通过lsof 命令观察服务器打开的文件句柄这两个方法我们都采用了结果也足以满足我们的需求下面是问题期间每秒运行df–h 的结果

下面则是lsof 的数据因为某些原因我们每五秒才收集一次我们简单地将mysqld 在/tmp 中打开的文件大小做了加总并且把总大小和采样时的时间戳一起输出到结果文件中

$ awk

/mysqld *tmp/ {

total += $ ;

}

/^Sun Mar / total {

printf %s % f MB\n $ total/ / ;

total = ;

} lsof txt

: : MB

从这个数据可以看出在问题之初MySQL 大约写了 GB 的数据到临时表这和之前在SHOW PROCESSLIST 中有大量的 Copying to tmp table 相吻合这个证据表明可能是某些效率低下的查询风暴耗尽了磁盘资源根据我们的工作直觉出现这种情况比较普遍的一个原因是缓存失效当memcached 中所有缓存的条目同时失效而又有很多应用需要同时访问的时候就会出现这种情况我们给开发人员出示了部分采样到的查询并讨论这些查询的作用实际情况是缓存同时失效就是罪魁祸首（这验证了我们的直觉）一方面开发人员在应用层面解决缓存失效的问题另一方面我们也修改了查询避免使用磁盘临时表这两个方法的任何一个都可以解决问题当然最好是两个都实施

返回目录高性能MySQL

编辑推荐

ASP NET开发培训视频教程

数据仓库与数据挖掘培训视频教程

lishixinzhi/Article/program/MySQL/201311/29695

高性能MySQL：测量PHP 应用程序

测量PHP 应用程序

如果不使用New Relic 也有其他的选择尤其是对PHP 有好几款工具都可以帮助进行性能剖析其中一款叫做xhprof（//pecl php net/package/xhprof）这是Facebook开发给内部使用的在年开源了 xhprof 有很多高级特性并且易于安装和使用它很轻量级可扩展性也很好可以在生产环境大量部署并全天候使用它还能针对函数调用进行剖析并根据耗费的时间进行排序相比xhprof 还有一些更底层的工具比如xdebug Valgrind 和cachegrind 可以从多个角度对代码进行检测注有些工具会产生大量输出并且开销很大并不适合在生产环境运行但在开发环境却可以发挥很大的作用

下面要讨论的另外一个PHP 性能剖析工具是我们自己写的基于本书第二版的代码和原则扩展而来名叫IfP（instrumentation for php）代码托管在Goole Code 上（//code google /p/instrumentation for php/） Ifp 并不像xhprof 一样对PHP 做深入的测量而是更关注数据库调用所以当无法在数据库层面进行测量的时候 Ifp 可以很好地帮助应用剖析数据库的利用率 Ifp 是一个提供了计数器和计时器的单例类很容易部署到生产环境中因为不需要访问PHP 配置的权限（对很多开发人员来说都没有访问PHP配置的权限所以这一点很重要）

Ifp 不会自动剖析所有的PHP 函数而只是针对重要的函数例如对于某些需要剖析的地方要用到自定义的计数器就需要手工启动和停止但Ifp 可以自动对整个页面的执行进行计时这样对自动测量数据库和memcached 的调用就比较简单对于这种情况就无须手工启动或者停止这也意味着 Ifp 可以剖析三种情况应用程序的请求（如page view）数据库的查询和缓存的查询 Ifp 还可以将计数器和计时器输出到Apache 通过Apache 可以将结果写入到日志中这是一种方便且轻量的记录结果的方式 Ifp 不会保存其他数据所以也不需要有系统管理员的权限

使用Ifp 只需要简单地在页面的开始处调用start_request（）理想情况下在程序的一开始就应当调用

require_once（ Instrumentation php ）

Instrumentation::get_instance（） start_request（）

这段代码注册了一个shutdown函数所以在执行结束的地方不需要再做更多的处理

IFP会自动对SQL添加注释便于从数据库的查询日志中更灵活地分析应用的情况通过SHOW PROCESSLIST也可以更清楚地知道性能低的查询出自何处大多数情况下定位性能低下查询的来源都不容易尤其是那些通过字符串拼接出来的查询语句都没有办法在源代码中去搜索那么IFP的这个功能就可以帮助解决这个问题它可以很快定位到查询是从何处而来的即时应用和数据库中间加了代理或者负载均衡层也可以确认是哪个应用的用户是哪个页面请求是源代码中的哪个函数代码行号甚至是所创建的计数器的键值对下面是一个例子

File: index php Line: Function: fullCachePage request_id: ABC session_id: XYZ

SELECT * FROM …

如何测量MySQL 的调用取决于连接MySQL 的接口如果使用的是面向对象的mysqli接口则只需要修改一行代码将构造函数从mysqli 改为可以自动测量的mysqli_x 即可 mysqli_x 构造函数是由Ifp 提供的子类可以在后台测量并改写查询如果使用的不是面向对象的接口或者是其他的数据库访问层则需要修改更多的代码如果数据库调用不是分散在代码各处还好否则建议使用集成开发环境（IDE）如Eclipse 这样修改起来要容易些但不管从哪个方面来看将访问数据库的代码集中到一起都可以说是最佳实践

Ifp 的结果很容易分析 Percona Toolkit 中的pt query digest 能够很方便地从查询注释中抽取出键值对所以只需要简单的将查询记录到MySQL 的日志文件中再对日志文件进行处理即可 Apache 的mod_log_config 模块可以利用Ifp 输出的环境变量来定制日志输出其中的宏%D 还可以以微秒级记录请求时间

也可以通过LOAD DATA INFILE 将Apache 的日志载入到MySQL 数据库中然后通过SQL 进行查询在Ifp 的网站上有一个PDF 的幻灯片详细给出了使用示例包括查询和命令行参数都有

或许你会说不想或者没时间在代码中加入测量的功能其实这事比想象的要容易得多而且花在优化上的时间将会由于性能的优化而加倍地回报给你对应用的测量是不可替代的当然最好是直接使用New Relic xhprof Ifp 或者其他已有的优化工具而不必重新去发明轮子

MySQL 企业监控器的查询分析功能

MySQL 的企业监控器（Enterprise Monitor）也是值得考虑的工具之一这是Oracle 提供的MySQL 商业服务支持中的一部分它可以捕获发送给服务器的查询要么是通过应用程序连接MySQL 的库文件实现要么是在代理层实现（我们并不太建议使用代理层）该工具有设计良好的用户界面可以直观地显示查询的剖析结果并且可以根据时间段进行缩放例如可以选择某个异常的性能尖峰时间来查看状态图也可以查看EXPLAIN 出来的执行计划这在故障诊断时非常有用

返回目录高性能MySQL

编辑推荐

ASP NET开发培训视频教程

数据仓库与数据挖掘培训视频教程

lishixinzhi/Article/program/MySQL/201311/29717

高性能MySQL：测试何种指标

测试何种指标

在开始执行甚至是在设计基准测试之前需要先明确测试的目标测试目标决定了选择什么样的测试工具和技术以获得精确而有意义的测试结果可以将测试目标细化为一系列的问题比如这种CPU 是否比另外一种要快？或新索引是否比当前索引性能更好？

有时候需要用不同的方法测试不同的指标比如针对延迟（latency）和吞吐量（throughput）就需要采用不同的测试方法

请考虑以下指标看看如何满足测试的需求

吞吐量

吞吐量指的是单位时间内的事务处理数这一直是经典的数据库应用测试指标一些标准的基准测试被广泛地引用如TPC C（参考// tpc ）而且很多数据库厂商都努力争取在这些测试中取得好成绩这类基准测试主要针对在线事务处理（OLTP）的吞吐量非常适用于多用户的交互式应用常用的测试单位是每秒事务数（TPS）有些也采用每分钟事务数（TPM）

响应时间或者延迟

这个指标用于测试任务所需的整体时间根据具体的应用测试的时间单位可能是微秒毫秒秒或者分钟根据不同的时间单位可以计算出平均响应时间最小响应时间最大响应时间和所占百分比最大响应时间通常意义不大因为测试时间越长最大响应时间也可能越大而且其结果通常不可重复每次测试都可能得到不同的最大响应时间因此通常可以使用百分比响应时间（percentile responsetime）来替代最大响应时间例如如果 % 的响应时间都是毫秒则表示任务在 % 的时间段内都可以在毫秒之内完成

使用图表有助于理解测试结果可以将测试结果绘制成折线图（比如平均值折线或者 % 百分比折线）或者散点图直观地表现数据结果集的分布情况通过这些图可以发现长时间测试的趋势本章后面将更详细地讨论这一点

并发性

并发性是一个非常重要又经常被误解和误用的指标例如它经常被表示成多少用户在同一时间浏览一个Web 站点经常使用的指标是有多少个会话注然而 HTTP协议是无状态的大多数用户只是简单地读取浏览器上显示的信息这并不等同于Web 服务器的并发性而且 Web 服务器的并发性也不等同于数据库的并发性而仅仅只表示会话存储机制可以处理多少数据的能力 Web 服务器的并发性更准确的度量指标应该是在任意时间有多少同时发生的并发请求

在应用的不同环节都可以测量相应的并发性 Web 服务器的高并发一般也会导致数据库的高并发但服务器采用的语言和工具集对此都会有影响注意不要将创建数据库连接和并发性搞混淆一个设计良好的应用同时可以打开成百上千个MySQL 数据库服务器连接但可能同时只有少数连接在执行查询所以说一个Web 站点同时有个用户访问却可能只有～个并发请求到MySQL 数据库

换句话说并发性基准测试需要关注的是正在工作中的并发操作或者是同时工作中的线程数或者连接数当并发性增加时需要测量吞吐量是否下降响应时间是否变长如果是这样应用可能就无法处理峰值压力

并发性的测量完全不同于响应时间和吞吐量它不像是一个结果而更像是设置基准测试的一种属性并发性测试通常不是为了测试应用能达到的并发度而是为了测试应用在不同并发下的性能当然数据库的并发性还是需要测量的可以通过sy *** ench 指定或者个线程的测试然后在测试期间记录MySQL 数据库的Threads_running 状态值在第章将讨论这个指标对容量规划的影响

可扩展性

在系统的业务压力可能发生变化的情况下测试可扩展性就非常必要了第章将更进一步讨论可扩展性的话题简单地说可扩展性指的是给系统增加一倍的工作在理想情况下就能获得两倍的结果（即吞吐量增加一倍）或者说给系统增加一倍的资源（比如两倍的CPU 数）就可以获得两倍的吞吐量当然同时性能（响应时间）也必须在可以接受的范围内大多数系统是无法做到如此理想的线性扩展的随着压力的变化吞吐量和性能都可能越来越差

可扩展性指标对于容量规范非常有用它可以提供其他测试无法提供的信息来帮助发现应用的瓶颈比如如果系统是基于单个用户的响应时间测试（这是一个很糟糕的测试策略）设计的虽然测试的结果很好但当并发度增加时系统的性能有可能变得非常糟糕而一个基于不断增加用户连接的情况下的响应时间测试则可以发现这个问题

一些任务比如从细粒度数据创建汇总表的批量工作需要的是周期性的快速响应时间当然也可以测试这些任务纯粹的响应时间但要注意考虑这些任务之间的相互影响批量工作可能导致相互之间有影响的查询性能变差反之亦然

归根结底应该测试那些对用户来说最重要的指标因此应该尽可能地去收集一些需求比如什么样的响应时间是可以接受的期待多少的并发性等等然后基于这些需求来设计基准测试避免目光短浅地只关注部分指标而忽略其他指标

返回目录高性能MySQL

编辑推荐

ASP NET开发培训视频教程

数据仓库与数据挖掘培训视频教程

lishixinzhi/Article/program/MySQL/201311/29741

新闻标题：高性能mysql怎么样高性能mysql视频教程
链接分享：http://ybzwz.com/article/dogdohd.html

高性能mysql怎么样 高性能mysql视频教程

高性能MySQL：一个诊断案例（3）

高性能MySQL：测量PHP 应用程序

高性能MySQL：测试何种指标

其他资讯

高性能mysql怎么样高性能mysql视频教程