最近看各大技术社区,无论是知乎,掘金,博客园,csdn基本上看不到有小伙伴分享sqlserver类的文章,看样子这些年sqlserver没落了,已经后继无人了,再写sqlserver是不可能再写了,这辈子都不会写了,只能靠技术输出mysql维持生活这样子。mysql
mysql最大的好处就是开源, 手握百万源码,有什么问题搞不定呢? 这一点要比sqlserver爽多了,不用再dbcc捣来捣去。c++
你们都知道作/装修房子都要有一张图纸,其实软件也是同样,只要有了这么一张图纸,大方向就定下来了,再深刻到细节也不会乱了方向,而后给你们看一下我本身画的架构图,画的不对请轻拍。sql
其实SqlServer,Oracle,MySql架构都大同小异,MySql的鲜明特色就是存储引擎作成了插拔式,这就牛逼了,现行最经常使用的是InnoDB,这就让我有了一个想法,有一套业务准备用 InMemory 模式跑一下,厉害了~~~缓存
MySql其实就两大块,一块是MySql Server层,一块就是Storage Engines层。架构
不一样语言的sdk遵照mysql协议就能够与mysqld进行互通。socket
MySql使用C++编写,Connection是很是宝贵的,在初始化的时候维护一个池。函数
对sql处理,解析,优化,缓存等处理和过滤模块,了解了解便可。sqlserver
负责存储的模块,官方,第三方,甚至是你本身均可以自定义实现这个数据存储,这就把生态作起来了,🐮👃。源码分析
关于怎么去下载mysql源码,这里就不说了,你们本身去官网捣鼓捣鼓哈,本系列使用经典的 mysql 5.7.14
版本。post
手握百万行源码,怎么找入口函数呢??? 😁😁😁,其实很简单,在mysqld进程上生成一个dump文件,而后看它的托管堆不就好啦。。。
从图中能够看到,入口函数就是 mysqld!mysqld_main+0x227
中的 mysqld_main
, 接下来就能够在源码中全文检索下。
extern int mysqld_main(int argc, char **argv); int main(int argc, char **argv) { return mysqld_main(argc, argv); }
这里你们能够用visualstudio打开C++源码,使用查看定义功能,很是好用。
int mysqld_main(int argc, char **argv) { //建立服务监听线程 handle_connections_sockets(); } void handle_connections_sockets() { //监听链接 new_sock= mysql_socket_accept(key_socket_client_connection, sock, (struct sockaddr *)(&cAddr), &length); if (mysql_socket_getfd(sock) == mysql_socket_getfd(unix_sock)) thd->security_ctx->set_host((char*) my_localhost); //建立链接 create_new_thread(thd); } //建立新线程处理处理用户链接 static void create_new_thread(THD *thd){ thd->thread_id= thd->variables.pseudo_thread_id= thread_id++; //线程进了线程调度器 MYSQL_CALLBACK(thread_scheduler, add_connection, (thd)); }
至此mysql就开启了一个线程对 3306
端口进行监控,等待客户端请求触发 add_connection
回调。
这里我以Insert操做为例稍微解剖下处理流程:
当用户有请求sql过来以后,就会触发 thread_scheduler
的回调函数add_connection
。
static scheduler_functions one_thread_per_connection_scheduler_functions= { 0, // max_threads NULL, // init init_new_connection_handler_thread, // init_new_connection_thread create_thread_to_handle_connection, // add_connection NULL, // thd_wait_begin NULL, // thd_wait_end NULL, // post_kill_notification one_thread_per_connection_end, // end_thread NULL, // end };
从 scheduler_functions
中能够看到,add_connection 对应了 create_thread_to_handle_connection
,也就是请求来了会触发这个函数,从名字也能够看出,用一个线程处理一个用户链接。
void create_thread_to_handle_connection(THD *thd) { if ((error= mysql_thread_create(key_thread_one_connection, &thd->real_id, &connection_attrib, handle_one_connection,(void*) thd))){} } //触发回调函数 handle_one_connection pthread_handler_t handle_one_connection(void *arg) { do_handle_one_connection(thd); } //继续处理 void do_handle_one_connection(THD *thd_arg){ while (thd_is_connection_alive(thd)) { mysql_audit_release(thd); if (do_command(thd)) break; //这里的 do_command 继续处理 } } //继续分发 bool do_command(THD *thd) { return_value= dispatch_command(command, thd, packet+1, (uint) (packet_length-1)); } bool dispatch_command(enum enum_server_command command, THD *thd, char* packet, uint packet_length) { switch (command) { case COM_INIT_DB: .... break; ... case COM_QUERY: //查询语句: insert xxxx mysql_parse(thd, thd->query(), thd->query_length(), &parser_state); //sql解析 break; } } //sql解析模块 void mysql_parse(THD *thd, char *rawbuf, uint length, Parser_state *parser_state) { error= mysql_execute_command(thd); }
//继续执行 int mysql_execute_command(THD *thd) { switch (lex->sql_command) { case SQLCOM_SELECT: res= execute_sqlcom_select(thd, all_tables); break; //这个 insert 就是我要追的 case SQLCOM_INSERT: res= mysql_insert(thd, all_tables, lex->field_list, lex->many_values, lex->update_list, lex->value_list, lex->duplicates, lex->ignore); } } //insert插入操做处理 bool mysql_insert(THD *thd,TABLE_LIST *table_list,List<Item> &fields, List<List_item> &values_list, List<Item> &update_fields, List<Item> &update_values, enum_duplicates duplic, bool ignore) { while ((values= its++)) { error= write_record(thd, table, &info, &update); } } //写入记录 int write_record(THD *thd, TABLE *table, COPY_INFO *info, COPY_INFO *update) { if (duplicate_handling == DUP_REPLACE || duplicate_handling == DUP_UPDATE) { // ha_write_row 重点是这个函数 while ((error=table->file->ha_write_row(table->record[0]))) { .... } } }
能够看到,调用链仍是挺深的,追到 ha_write_row
方法基本上算是追到头了,再往下的话就是 MySql Server
给 Storage Engine
提供的接口实现了,不信的话继续看呗。。。
int handler::ha_write_row(uchar *buf) { MYSQL_TABLE_IO_WAIT(m_psi, PSI_TABLE_WRITE_ROW, MAX_KEY, 0,{ error= write_row(buf); }) } //这是一个虚方法 virtual int write_row(uchar *buf __attribute__((unused))) { return HA_ERR_WRONG_COMMAND; }
看到没有,write_row
是个虚方法,也就是给底层方法实现的,在这里就是给各大Storage Engines
的哈。😁😁😁
这么多方法,看起来有点懵懵的吧,我来画一张图,帮助你们理解下这个调用堆栈。
你们必定要熟读架构图,有了架构图从源码中找信息就方便多了,总之学习mysql成就感仍是满满的😁。