Linux网络设计之协程原理-创新互联
- 一、协程的意义
- 二、异步的执行流程
- 三、协程的基本操作
- 3.1、“切换”的方式--switch
- 3.2、create:创建协程
- 3.3、yield:让出CPU
- 3.4、resume:恢复协程运行权
- 四、协程的定义
- 五、调度器的定义
- 总结
- 后言
协程可以看作一个轻量级的线程,能自己实现调度。有一些轻量的场景,如网络刷新、网络加载、UI刷新、IO读写操作等,可以不需要开启一个线程去执行;线程或进程的调度较重,只需要一个轻量级的线程来维护业务代码,使业务代码更加的轻便灵活;这就是协程的意义。协程,简单的说,就是一个具有异步的性能,却使用同步编程方式的组件。使用者调用协程可以很好的管理业务代码,整个执行过程清晰明了。
二、异步的执行流程多线程异步操作,就是将不同的操作放到不同的线程中进行。异步带来的好处是子模块好规划、程序性能高;缺点是模块间的数据管理异常麻烦。
多线程异步简单示例代码:
#include#include#include#include#include#include#include#include#include#include#include#include#include#define ASYNC_EVENT_LENGTH 1024
struct context {int epfd;
pthread_t thid;
};
void *asyn_callback(void * arg)
{struct context *ctx=(struct context*)arg;
while(1)
{struct epoll_event events[ASYNC_EVENT_LENGTH] = {0 };
int nready=epoll_wait(ctx->epfd,events,ASYNC_EVENT_LENGTH,-1);
if (nready< 0)
{ if (errno == EINTR || errno == EAGAIN)
continue;
else
break;
}
else if (nready == 0)
continue;
int i = 0;
for (i = 0; i< nready;i++)
{ int clientfd = events[i].data.fd;
if (events[i].events &EPOLLIN)
{ char buffer[1024] = {0 };
struct sockaddr_in addr;
size_t addr_len = sizeof(struct sockaddr_in);
// 从读缓冲区中读取数据
int n = recvfrom(clientfd, buffer, sizeof(buffer), 0, (struct sockaddr*)&addr, (socklen_t*)&addr_len);
printf("recvfrom n : %d\n", n);
// 解析数据
parse_response(buffer);
// 删除事件监听
epoll_ctl(ctx->epfd, EPOLL_CTL_DEL, clientfd, NULL);
// 关闭fd
close(clientfd);
}
}
}
return NULL;
}
int asyn_commit(struct context *ctx)
{// 创建 socket
int sockfd = socket(AF_INET, SOCK_DGRAM, 0);
if (sockfd< 0) {perror("create socket failed\n");
exit(-1);
}
// 配置socket相关信息
struct sockaddr_in dest;
bzero(&dest, sizeof(dest));
dest.sin_family = AF_INET;
dest.sin_port = htons(53);
dest.sin_addr.s_addr = inet_addr(DNS_SVR);
// connect目标,探路
int ret = connect(sockfd, (struct sockaddr*)&dest, sizeof(dest));
printf("connect :%d\n", ret);
// 准备协议
//......
// 发送数据
int slen = sendto(sockfd, request, req_len, 0, (struct sockaddr*)&dest, sizeof(struct sockaddr));
// 加入epoll中,监测结果返回
struct epoll_event ev;
ev.events = EPOLLIN;
ev.data.fd = sockfd;
return epoll_ctl(ctx->epfd, EPOLL_CTL_ADD, sockfd, &ev);
}
int asyn_init(struct context *ctx)
{ctx->epfd=epoll_create(1);
pthread_create(&ctx->thid,NULL,asyn_callback,ctx);
}
int main(int argc;char *argv[])
{struct context ctx;
asyn_init(&ctx);
for(int i=0;i<100;i++)
{ asyn_commit();
}
getchar();
return 0;
}
协程就是要在一个线程中实现异步操作。
三、协程的基本操作协程主要有几个操作:创建(create)、让出(yield)和恢复(resume)。这后两个操作使用一个关键的动作,switch,即切换。
(1)将socketfd添加到epoll中管理。
(2)然后切换上下文,由协程上下文切换到调度器上下文,这个过程称为让出(yield)。
(3)调度器获取下一个协程上下文,恢复(resume)新的协程。
如此达到异步的操作。
调度器与协程的上下文切换如下图:
epoll_ctl() add和del动作能够保证 sockfd 只在一个上下文中能够操作 IO ;不会出现在多个上下文同时对一个 IO 进行操作。
IO异步操作上下文切换时序图:
执行切换有三种方式:
(1)longjmp / setjmp
(2)ucontext
(3)汇编
”切换“不能使用goto。goto只能在栈内跳转,只能在函数内,不能跨函数。
汇编实现switch可以参考Linux kernel的任务调度方式,在“切换”前保存当前的上下文信息再加载要执行的上下文信息。x86_64 的寄存器有 16 个 64 位寄存器:rax,rbx,rdi,rsi,rdx,rcx,r8,r9,r10,r11,r12,r13,r14,r15,rbp,rsp。
其中:
rax:存储函数的返回值;
rdi,rsi,rdx,rcx,r8,r9:函数的六个参数,如果函数的参数超过六个,那么六个以后的参数会入栈。
rbp:栈指针寄存器,指向栈底;
rsp:栈指针寄存器,指向栈顶。
其余的用作数据存储。
eip:指令指针寄存器,指向CPU要执行的下一个指令。
例如,对于X86-64的汇编切换代码:
__asm__ (
" .text \n"
" .p2align 4,,15 \n"
".globl _switch \n"
".globl __switch \n"
"_switch: \n"
"__switch: \n"
" movq %rsp, 0(%rsi) # save stack_pointer \n"
" movq %rbp, 8(%rsi) # save frame_pointer \n"
" movq (%rsp), %rax # save insn_pointer \n"
" movq %rax, 16(%rsi) \n"
" movq %rbx, 24(%rsi) # save rbx,r12-r15 \n"
" movq %r12, 32(%rsi) \n"
" movq %r13, 40(%rsi) \n"
" movq %r14, 48(%rsi) \n"
" movq %r15, 56(%rsi) \n"
" movq 56(%rdi), %r15 \n"
" movq 48(%rdi), %r14 \n"
" movq 40(%rdi), %r13 # restore rbx,r12-r15 \n"
" movq 32(%rdi), %r12 \n"
" movq 24(%rdi), %rbx \n"
" movq 8(%rdi), %rbp # restore frame_pointer \n"
" movq 0(%rdi), %rsp # restore stack_pointer \n"
" movq 16(%rdi), %rax # restore insn_pointer \n"
" movq %rax, (%rsp) \n"
" ret \n"
);
3.2、create:创建协程(1)如果调度器不存在,则创建调度器。调度器作为全局实例。
(2)分配协程内存空间,并设置协程的数据项。如协程的栈空间、栈大小、子过程回调函数、子过程回调参数等等。
(3)将新创建的协程添加到就绪队列中。
切换到最近执行 resume 的上下文。
3.4、resume:恢复协程运行权切换到运行协程实例的 yield 的位置。
resume 与 yield 是两个可逆过程的原子操作。
协程一般包含几个内容:
(1)协程ID
(2)协程上下文
(3)协程入口函数
(4)协程的状态
(5)协程的栈空间
(6)返回值
(7)状态集合
struct coroutine{uint64_t birth;//创建时间
uint64_t id;//协程ID
struct context ctx;//上下文
void *(*func) (void*);//子过程回调函数
void *arg;//回调函数参数
struct nty_coroutine_status status;// 协程的状态
void *stack;// 栈
size_t stack_length;//栈大小
nty_schedule *sched;//调度器
//状态集合
struct rbtree_node wait;
struct queue_node ready;
struct rbtree_node sleep;
}
五、调度器的定义typedef struct _nty_coroutine_queue nty_coroutine_queue;
typedef struct _nty_coroutine_rbtree_sleep nty_coroutine_rbtree_sleep;
typedef struct _nty_coroutine_rbtree_wait nty_coroutine_rbtree_wait;
typedef struct _nty_schedule {uint64_t birth;//创建时间
nty_cpu_ctx ctx;//上下文
struct _nty_coroutine *curr_thread;//当前运行的协程
int page_size;
// epoll 管理
int poller_fd;
int eventfd;
struct epoll_event eventlist[NTY_CO_MAX_EVENTS];
int nevents;
int num_new_events;
//状态集合
nty_coroutine_queue ready;
nty_coroutine_rbtree_sleep sleeping;
nty_coroutine_rbtree_wait waiting;
} nty_schedule;
总结协程可以让业务代码易于管理,整个流程清晰;自己实现调度器,在单线程中实现异步调度。协程的底层还是使用epoll等IO多路复用器,性能上只能趋近reactor。
协程的单核运行过程:
本专栏知识点是通过<零声教育>的系统学习,进行梳理总结写下文章,对c/c++linux系统提升感兴趣的读者,可以点击链接,详细查看详细的服务:C/C++服务器课程
你是否还在寻找稳定的海外服务器提供商?创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源,准确流量调度确保服务器高可用性,企业级服务器适合批量采购,新人活动首月15元起,快前往官网查看详情吧
当前标题:Linux网络设计之协程原理-创新互联
新闻来源:http://ybzwz.com/article/ccsehs.html