Swoole
项目从 2012 年推出到如今已经有 5 年的历史,如今愈来愈多的互联网企业使用Swoole
来开发各种后台应用。受限于 PHP 的ZendVM
实现,PHP 程序没法使用多线程进行编程开发。应用程序中实现并行处理只能使用多进程模式。php
作过多进程开发的 PHPer 都知道进程的内存隔离性。在程序中声明的global
全局数组,实际上并非数据共享的,在一个进程内修改数组的值,在另一个进程中是无效的。编程
$array = array(); function process1() { global $array; $array['test'] = 'hello world'; } function process2() { global $array; //这里读取不到test的值 var_dump($array['test']); }
这个进程隔离性给程序的开发带来的不少烦恼。好比实现一个聊天室程序,用户A
在进程1中处理,用户B
在进程2中处理,A
和B
若是在同一个group
,这个group
在多线程环境中直接用set
表示,A
和B
加到对应group
的set
中便可。但多进程环境中,用 PHP 的array
没法实现。通常能够有2个思路解决问题:数组
Redis
、MySQL
、文件
这2个方案虽然能够实现,但都存在明显的缺点。方案一实现较为复杂,开发困难。方案二实现简单,但存在额外的IO
消耗,不是纯内存
操做,有性能瓶颈。基于/dev/shm
实现内存文件读写的方案,是一个不错的方案,但须要注意锁的操做,读写时须要额外的系统调用开销。服务器
想要解决这个问题,必须实现一个基于共享内存的数据结构。在 PHP 中也有一些扩展模块能够使用。如APCu
、Yac
、shm_put_var/shm_get_var
swoole
Yac
:性能高,但因为底层实现的限制,没法保证一致性。只能做为Cache
来使用APCu
:支持Key-Value
式数据的读写,缺点是实现简单粗暴,锁的粒度太粗。高并发时存在大量锁的争抢,性能较差shm 系列函数
:这个方案虽然能实现共享内存操做,但实际上底层实现很是简陋。一方面底层根本没有加锁,若是你要在并发环境中使用,须要自行实现锁的操做。另外,底层其实是一个链表结构,数据较多时,查询性能很是差为了解决多进程程序中数据共享的难题,Swoole
扩展提供了swoole_table
数据结构。Table
的实现很是精巧,使用最方便,同时性能也是最好的。数据结构
$table = new swoole_table(1024); $table->column('id', swoole_table::TYPE_INT, 4); $table->column('name', swoole_table::TYPE_STRING, 64); $table->column('num', swoole_table::TYPE_FLOAT); $table->create(); $table->set('tianfenghan@qq.com', array('id' => 145, 'name' => 'rango', 'num' => 3.1415)); $table->set('350749960@qq.com', array('id' => 358, 'name' => "Rango1234", 'num' => 3.1415)); $table->set('hello@qq.com', array('id' => 189, 'name' => 'rango3', 'num' => 3.1415)); $ret1 = $table->get('350749960@qq.com'); $ret2 = $table->get('tianfenghan@qq.com'); $table->del('350749960@qq.com');
Table
实现了一个二维Map
结构,有点像 PHP 的二维数组,简单易用。在最新的1.9.19
中还能够使用ArrayAccess
接口以array
的方式操做Table
:多线程
$table = new swoole_table(1024); $table->column('id', swoole_table::TYPE_INT); $table->column('name', swoole_table::TYPE_STRING, 64); $table->column('num', swoole_table::TYPE_FLOAT); $table->create(); $table['apple'] = array('id' => 145, 'name' => 'iPhone', 'num' => 3.1415); $table['google'] = array('id' => 358, 'name' => "AlphaGo", 'num' => 3.1415); $table['microsoft']['name'] = "Windows"; $table['microsoft']['num'] = '1997.03'; var_dump($table['apple']); var_dump($table['microsoft']); $table['google']['num'] = 500.90; var_dump($table['google']);
Table
的优点酷睿I5
机器上测试,Table
单进程单线程每秒可完成写操做300万
次,读操做每秒可完成150万
次。在24
核服务器上,理论上每秒可实现数千万次读写操做。key
不存在锁的争抢问题。只有同一CPU
时间读写同一个Key
才须要进行加锁操做。并且Table
自己锁的粒度很是小,get
、set
操做内部只有少许内存读写的指令,能够在数百纳秒内完成操做。Table
的局限性Key
最大长度不得超过64
字节set
新的数据会出现内存分配致使失败,没法实现动态扩容所以使用Table
时尽量地设置较大的内存尺寸,这样虽然会带来必定的内存浪费,但实际上现代服务器内存很是廉价,这个局限性在实际项目中的问题并不大。并发
Table
底层基于共享内存实现,所占内存取决于表格的尺寸size
、冲突率(默认20%
)、column
的设置(如上面的示例中每行须要8 + 64 + 8
字节)、64
字节KEY
的存储空间、管理结构的内存消耗。app
size_t row_num = table->size * (1 + table->conflict_proportion); size_t row_memory_size = sizeof(swTableRow) + table->item_size; size_t memory_size = row_num * row_memory_size; memory_size += sizeof(swMemoryPool) + sizeof(swFixedPool) + ((row_num - table->size) * sizeof(swFixedPool_slice)); memory_size += table->size * sizeof(swTableRow *); void *memory = sw_shm_malloc(memory_size);
swoole_table
自己是一个HashTable
结构,Key
会计算为hash
值,来散列到每一行。HashTable
结构会遇到Hash冲突
问题,两个彻底不一样的Key
可能计算的hash
值是同一个,这时须要使用链表来解决Hash冲突
。Swoole
底层会建立一个浮动的内存池swFixedPool
结构来管理这些冲突Key
的内存。默认会建立size * 20%
数量的浮动内存池。在1.9.19
中能够自行定义冲突率。函数
$table = new swoole_table(65536, 0.9);
假如你的场景中Hash冲突
较多,能够调高冲突率,以申请一块较大的浮动内存池。
static swTableRow* swTable_hash(swTable *table, char *key, int keylen) { #ifdef SW_TABLE_USE_PHP_HASH uint64_t hashv = swoole_hash_php(key, keylen); #else uint64_t hashv = swoole_hash_austin(key, keylen); #endif uint64_t index = hashv & table->mask; assert(index < table->size); return table->rows[index]; } swTableRow* swTableRow_set(swTable *table, char *key, int keylen, swTableRow **rowlock) { if (keylen > SW_TABLE_KEY_SIZE) { keylen = SW_TABLE_KEY_SIZE; } swTableRow *row = swTable_hash(table, key, keylen); *rowlock = row; swTableRow_lock(row); #ifdef SW_TABLE_DEBUG int _conflict_level = 0; #endif if (row->active) { for (;;) { if (strncmp(row->key, key, keylen) == 0) { break; } else if (row->next == NULL) { table->lock.lock(&table->lock); swTableRow *new_row = table->pool->alloc(table->pool, 0); #ifdef SW_TABLE_DEBUG conflict_count ++; if (_conflict_level > conflict_max_level) { conflict_max_level = _conflict_level; } #endif table->lock.unlock(&table->lock); if (!new_row) { return NULL; } //add row_num bzero(new_row, sizeof(swTableRow)); sw_atomic_fetch_add(&(table->row_num), 1); row->next = new_row; row = new_row; break; } else { row = row->next; #ifdef SW_TABLE_DEBUG _conflict_level++; #endif } } } else { #ifdef SW_TABLE_DEBUG insert_count ++; #endif sw_atomic_fetch_add(&(table->row_num), 1); } memcpy(row->key, key, keylen); row->active = 1; return row; }
swTable_hash
计算hash
值,散列到对应的行Key
发生冲突时,须要调用table->pool->alloc
从浮动内存池中分配内存alloc
失败,这时没法写入数据到Table
当同一CPU
时间,多个进程同时读取某一行时,须要锁的争抢。
swTableRow_lock(row); //内存操做 swTableRow_unlock(_rowlock);
swTableRow_lock
自己是一个自选锁,这里使用了gcc
编译器提供的__sync_bool_compare_and_swap
函数进行CPU
原子操做。多个进程同时读写某一行数据时,先获得锁的进程会执行内存读写操做,未获得锁的进程会进行CPU
自旋等待进程释放锁。
static sw_inline void sw_spinlock(sw_atomic_t *lock) { uint32_t i, n; while (1) { if (*lock == 0 && sw_atomic_cmp_set(lock, 0, 1)) { return; } if (SW_CPU_NUM > 1) { for (n = 1; n < SW_SPINLOCK_LOOP_N; n <<= 1) { for (i = 0; i < n; i++) { sw_atomic_cpu_pause(); } if (*lock == 0 && sw_atomic_cmp_set(lock, 0, 1)) { return; } } } swYield(); } }
使用table::get
方法时,从Table
共享内存中,读取数据写入到PHP
本地内存数组中。底层会根据列信息table->columns
,计算内存指针的偏移量,获得对应字段的值。
static inline void php_swoole_table_row2array(swTable *table, swTableRow *row, zval *return_value) { array_init(return_value); swTableColumn *col = NULL; swTable_string_length_t vlen = 0; double dval = 0; int64_t lval = 0; char *k; while(1) { col = swHashMap_each(table->columns, &k); if (col == NULL) { break; } if (col->type == SW_TABLE_STRING) { memcpy(&vlen, row->data + col->index, sizeof(swTable_string_length_t)); sw_add_assoc_stringl_ex(return_value, col->name->str, col->name->length + 1, row->data + col->index + sizeof(swTable_string_length_t), vlen, 1); } else if (col->type == SW_TABLE_FLOAT) { memcpy(&dval, row->data + col->index, sizeof(dval)); sw_add_assoc_double_ex(return_value, col->name->str, col->name->length + 1, dval); } else { switch (col->type) { case SW_TABLE_INT8: memcpy(&lval, row->data + col->index, 1); sw_add_assoc_long_ex(return_value, col->name->str, col->name->length + 1, (int8_t) lval); break; case SW_TABLE_INT16: memcpy(&lval, row->data + col->index, 2); sw_add_assoc_long_ex(return_value, col->name->str, col->name->length + 1, (int16_t) lval); break; case SW_TABLE_INT32: memcpy(&lval, row->data + col->index, 4); sw_add_assoc_long_ex(return_value, col->name->str, col->name->length + 1, (int32_t) lval); break; default: memcpy(&lval, row->data + col->index, 8); sw_add_assoc_long_ex(return_value, col->name->str, col->name->length + 1, lval); break; } } } }