一步一步在Windows中使用MyCat负载均衡上篇

时间 2019-11-05

标签一步 windows 使用 mycat 负载均衡上篇栏目 Windows 繁體版

原文原文链接

　　传统关系型数据库的分布式开发一般须要本身作，不只耗时耗力并且效果不是很理想，当想快速搭建时，最初想到的是看有没有第三方，网上牛人仍是不少的，作得比较好的其中之一Mycat，它是开源的分布式数据库系统，解决数据库的负载均衡，主备复制，读写分离，简单来讲就是你只管直接与mycat通信，至于分离什么的交给它里面本身作，其它啥都不用操心。前端

　　至于什么是MyCat有什么优点，能够看看官网介绍 Mycat 数据库分库分表中间件。java

上图是MyCat架构图。node

　　MyCat能够与HAProxy使用实现高可用数据库集群，更深刻的内容本身去查，本章只详讲从0开始使用MyCat 基础篇，至少能先跑起来。mysql

1、下载

　　本次运行环境为windows，Linux下更好吧，而后数据库用mysql，须要java环境，下载jdk8sql

　　jdk安装配置
1. 首先去oracle官网下载并安装jdk8,添加环境变量，JAVA_HOME设置为D:\Java\jdk1.8
2. CLASSPATH设置为.;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar
3. path系统变量追加%JAVA_HOME%\bin;数据库

　　安装Mysql，须要注意的是数据库，表，字段的编码都采用utf8吧，不然插入的中文显示为乱码，具体解决方法网上查一查，去试一试。express

　　下载MyCat，http://dl.mycat.io/ 选择最新的版本下载。（下图能够看到还有其它前面须要的资源均可以从这里下载）apache

2、配置

　　下载解压后就要先配置MyCat了，（这里不是exe文件，没有安装，配置好后直接运行startup_nowrap.bat）windows

　　打开mycat\conf里面的startup_nowrap.bat 为了下降资源占用，mycat的jvm设置在startup_nowrap.bat 能够清楚看到以下配置：
“%JAVA_CMD%” -server -Xms1G -Xmx2G -XX:MaxPermSize=64M -XX:+AggressiveOpts -XX:MaxDirectMemorySize=1G -DMYCAT_HOME=%MYCAT_HOME% -cp “..\conf;..\lib*” io.mycat.MycatStartup
这里将-Xms1G改为-Xms512M，-Xmx2G改为-Xmx1024M，保存后从新启动便可。后端

　　添加Windows环境变量，MYCAT_HOME设置为安装目录D:\MycatServer1.5

　　修改wrapper.conf文件里的改为wrapper.java.command=D:\jdk1.8\bin\java.exe

3、链接MySQL

　　Mycat绑定MySQL 启动的配置

　　conf 配置文件存放配置文件：

 --server.xml：是Mycat服务器参数调整和用户受权的配置文件。

  --schema.xml：是逻辑库定义和表以及分片定义的配置文件。

  --rule.xml：  是分片规则的配置文件，分片规则的具体一些参数信息单独存放为文件，也在这个目录下，配置文件修改须要重启MyCAT。

  --log4j.xml： 日志存放在logs/log中，天天一个文件，日志的配置是在conf/log4j.xml中，根据本身的须要能够调整输出级别为debug                           debug级别下，会输出更多的信息，方便排查问题。

  --autopartition-long.txt,partition-hash-int.txt,sequence_conf.properties， sequence_db_conf.properties 分片相关的id分片规则配置文件

  --lib     MyCAT自身的jar包或依赖的jar包的存放目录。

  --logs        MyCAT日志的存放目录。日志存放在logs/log中，天天一个文件

具体什么意思后面慢慢看。

　　先解决主配置，server.xml配置文件配置访问用户及权限, 修改高亮处信息，其中mycat、user为访问mycat的用户，TESTDB为mycat虚拟的数据库，供上层应用访问。

<user name="mycat">
        <property name="password">123456</property>
        <property name="schemas">TESTDB</property>
        <!-- 表级 DML 权限设置 -->
        <!--         
        <privileges check="false">
            <schema name="TESTDB" dml="0110" >
                <table name="tb01" dml="0000"></table>
                <table name="tb02" dml="1111"></table>
            </schema>
        </privileges>        
         -->
    </user>
    <user name="user">
        <property name="password">123456</property>
        <property name="schemas">TESTDB</property>
        <property name="readOnly">true</property>
    </user>

　　mycat的数据库配置是在schema.xml中配置,这部分不太好理解，精简了一下，主要分schema、dataNode、dataHost三个主要配置。

　　<scheme>节点定义了mycat的虚拟数据库为TESTDB，下面借用园友的说明：

<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://org.opencloudb/" >
<!--在这一行参数里面,schema name定义了能够在MyCAT前端显示的逻辑数据库的名字,checkSQLschema这个参数为False的时候,代表MyCAT会自动忽略掉表名前的数据库名,好比说mydatabase1.test1,会被当作test1;sqlMaxLimit指定了SQL语句返回的行数限制-->
    <schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100">
        <!-- 主键范围规则 -->
        <!-- 这一行表明在MyCAT前端会显示哪些表名,相似几行都表明同样的意思,这里强调的是表,而MyCAT并不会在配置文件里面定义表结构，若是在前端使用show create table ,MyCAT会显示正常的表结构信息,观察Debug日志,能够看到,MyCAT把命令分发给了dn1表明的数据库,而后把dn1的查询结果返回给了前端 能够判断,相似的数据库级别的一些查询指令,有多是单独分发给某个节点,而后再把某个节点的信息返回给前端。
        dataNode的意义很简单,这个逻辑表的数据存储在后端的哪几个数据库里面rule表明的是这个逻辑表students的具体切分策略,目前MyCAT只支持按照某一个特殊列,遵循一些特殊的规则来切分,如取模,枚举等,具体的留给以后细说                  
            --> 
        <table name="travelrecord" dataNode="dn1,dn2,dn3" rule="auto-sharding-long" />
        <table name="company" primaryKey="ID" dataNode="dn3,dn2,dn1" rule="mod-long"/>
        <table name="goods" primaryKey="ID" type="global" dataNode="dn1,dn2" />
        <!--求模分片随机规则 -->
        <table name="hotnews" primaryKey="ID" dataNode="dn1,dn2,dn3"
            rule="mod-long" />
        <table name="employee" primaryKey="ID" dataNode="dn1,dn2"
            rule="sharding-by-intfile" />
        <table name="customer" primaryKey="ID" dataNode="dn1,dn2"
            rule="sharding-by-intfile">
             <!-- 
                childtable我在测试中并无实际用起来不过在MyCAT的设计文档里面有提到，childtable是一种依赖于父表的结构，
                这意味着，childtable的joinkey会按照父表的parentKey的策略一块儿切分，当父表与子表进行链接，
                且链接条件是childtable.joinKey=parenttable.parentKey时,不会进行跨库的链接.
                --> 
            <childTable name="orders" primaryKey="ID" joinKey="customer_id"
                parentKey="id">
                <childTable name="order_items" joinKey="order_id"
                    parentKey="id" />
            </childTable>
            <childTable name="customer_addr" primaryKey="ID" joinKey="customer_id"
                parentKey="id" />
        </table>

        <!-- 全局表是自动克隆到全部定义的数据节点，这样能够与拆分节点的任何表链接查询，是在同一个数据节点-->
        <table name="news_table" primaryKey="ID" type="global" dataNode="dn1,dn2,dn3" />
    </schema>

    <dataNode name="dn1" dataHost="localhost1" database="TESTDB1" />
    <dataNode name="dn2" dataHost="localhost1" database="TESTDB2" />
    <dataNode name="dn3" dataHost="localhost1" database="TESTDB3" />

    <!--
          dataHost配置的是实际的后端数据库集群,大部分参数简单易懂,这里就不一个个介绍了,只介绍比较重要的两个参数,writeType和balance.
         --> 
        <!-- writeType和balance是用来控制后端集群的读写分离的关键参数，这里我用了双主双从的集群配置
            这里的测试过程比较麻烦，因此直接贴结论：
           1.balance=0时,读操做都在localhost上(localhost失败时,后端直接失败)
           2.balance=1时,读操做会随机分散在localhost1和两个readhost上面(localhost失败时,写操做会在localhost1,若是localhost1再失败,则没法进行写操做)
           3.balance=2时,写操做会在localhost上，读操做会随机分散在localhost1,localhost1和两个readhost上面(同上)
           4.writeType=0时,写操做会在localhost上,若是localhost失败,会自动切换到localhost1,localhost恢复之后并不会切换回localhost进行写操做
           5.writeType=1时,写操做会随机分布在localhost和localhost1上,单点失败并不会影响集群的写操做,可是后端的从库会没法从挂掉的主库获取更新,会在读数据的时候出现数据不一致
           举例:localhost失败了,写操做会在localhost1上面进行,localhost1的主从正常运行,可是localhost的从库没法从localhost获取更新,localhost的从库于其余库出现数据不一致
         --> 
    <dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
        writeType="0" dbType="mysql" dbDriver="native" switchType="1"  slaveThreshold="100">
        <heartbeat>select user()</heartbeat>
        <!-- can have multi write hosts -->
        <writeHost host="hostM1" url="localhost:3306" user="root"
            password="123456">
            <!-- can have multi read hosts -->
            <!--<readHost host="hostS2" url="192.168.1.200:3306" user="root" password="xxx" />-->
        </writeHost>
    </dataHost>

</mycat:schema>

　　以上配置注意高亮部分，配置的是每一个dn对应哪一个实体服务器里面哪一个实体库（此处只有本机，因此都绑定到本机localhost，再添加3个不一样的数据库TESTDB1\TESTDB2\TESTDB3，手动都添加要测试的表，如有多余的服务器能够将ip替换掉测试），详细的内容参考文中的注释。

　　通过实验 goods表：在mycat的TESTDB的虚拟表goods中添加一行记录会在 TESTDB1和TESTDB2中的表goods同步添加一行记录。

　　hotnews表：在mycat的TESTDB的虚拟表hotnews中添加的一行记录会随机插入 TESTDB一、TESTDB二、TESTDB3的其中一个库中的hotnews表。

　　其它表的测试大家本身试试。

　　这就是分片，靠的是分片规则，下面就来看rule。

　　（每一个数据库中相同的表要手工提早生成表结构，不然会提示找不到此表，操做mycat时它并不能自动同步实体数据库生成，可能有方法，如今还没深刻了解）

rule.xml配置文件，能够先无论。

<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License"); 
    - you may not use this file except in compliance with the License. - You 
    may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0 
    - - Unless required by applicable law or agreed to in writing, software - 
    distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT 
    WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the 
    License for the specific language governing permissions and - limitations 
    under the License. -->
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://org.opencloudb/">
    <tableRule name="rule1">
        <rule>
            <columns>id</columns>
            <algorithm>func1</algorithm>
        </rule>
    </tableRule>

    <tableRule name="rule2">
        <rule>
            <columns>user_id</columns>
            <algorithm>func1</algorithm>
        </rule>
    </tableRule>

    <tableRule name="sharding-by-intfile">
        <rule>
            <columns>sharding_id</columns>
            <algorithm>hash-int</algorithm>
        </rule>
    </tableRule>
    <tableRule name="auto-sharding-long">
        <rule>
            <columns>id</columns>
            <algorithm>rang-long</algorithm>
        </rule>
    </tableRule>
    <tableRule name="mod-long">
        <rule>
            <columns>id</columns>
            <algorithm>mod-long</algorithm>
        </rule>
    </tableRule>
    <tableRule name="sharding-by-murmur">
        <rule>
            <columns>id</columns>
            <algorithm>murmur</algorithm>
        </rule>
    </tableRule>
    <tableRule name="sharding-by-month">
        <rule>
            <columns>create_date</columns>
            <algorithm>partbymonth</algorithm>
        </rule>
    </tableRule>
    <tableRule name="latest-month-calldate">
        <rule>
            <columns>calldate</columns>
            <algorithm>latestMonth</algorithm>
        </rule>
    </tableRule>

    <tableRule name="auto-sharding-rang-mod">
        <rule>
            <columns>id</columns>
            <algorithm>rang-mod</algorithm>
        </rule>
    </tableRule>

    <tableRule name="jch">
        <rule>
            <columns>id</columns>
            <algorithm>jump-consistent-hash</algorithm>
        </rule>
    </tableRule>

    <function name="murmur"
        class="org.opencloudb.route.function.PartitionByMurmurHash">
        <property name="seed">0</property><!-- 默认是0 -->
        <property name="count">2</property><!-- 要分片的数据库节点数量，必须指定，不然无法分片 -->
        <property name="virtualBucketTimes">160</property><!-- 一个实际的数据库节点被映射为这么多虚拟节点，默认是160倍，也就是虚拟节点数是物理节点数的160倍 -->
        <!-- <property name="weightMapFile">weightMapFile</property> 节点的权重，没有指定权重的节点默认是1。以properties文件的格式填写，以从0开始到count-1的整数值也就是节点索引为key，以节点权重值为值。全部权重值必须是正整数，不然以1代替 -->
        <!-- <property name="bucketMapPath">/etc/mycat/bucketMapPath</property> 
            用于测试时观察各物理节点与虚拟节点的分布状况，若是指定了这个属性，会把虚拟节点的murmur hash值与物理节点的映射按行输出到这个文件，没有默认值，若是不指定，就不会输出任何东西 -->
    </function>
    <function name="hash-int"
        class="org.opencloudb.route.function.PartitionByFileMap">
        <property name="mapFile">partition-hash-int.txt</property>
    </function>
    <function name="rang-long"
        class="org.opencloudb.route.function.AutoPartitionByLong">
        <property name="mapFile">autopartition-long.txt</property>
    </function>
    <function name="mod-long" class="org.opencloudb.route.function.PartitionByMod">
        <!-- how many data nodes -->
        <property name="count">3</property>
    </function>

    <function name="func1" class="org.opencloudb.route.function.PartitionByLong">
        <property name="partitionCount">8</property>
        <property name="partitionLength">128</property>
    </function>
    <function name="latestMonth"
        class="org.opencloudb.route.function.LatestMonthPartion">
        <property name="splitOneDay">24</property>
    </function>
    <function name="partbymonth"
        class="org.opencloudb.route.function.PartitionByMonth">
        <property name="dateFormat">yyyy-MM-dd</property>
        <property name="sBeginDate">2015-01-01</property>
    </function>

    <function name="rang-mod" class="org.opencloudb.route.function.PartitionByRangeMod">
            <property name="mapFile">partition-range-mod.txt</property>
    </function>

    <function name="jump-consistent-hash" class="org.opencloudb.route.function.PartitionByJumpConsistentHash">
        <property name="totalBuckets">3</property>
    </function>
</mycat:rule>

4、运行

　　用管理员权限运行startup_nowrap.bat启动MyCat。

　　若出现上面的问题，检查java的环境是否正确和mycat的环境配置。

启动成功后会出现：

　　#若是启动失败，请修改D:\mycat\bin\startup_nowrap.bat文件中的如下参数。默认占用内存为2G
D:\dev-bin\mycat\bin>"C:\Program Files (x86)\Java\jdk1.7.0_13/bin/java" -server -Xms512m -Xmx512m -XX:MaxPermSize=64M -XX:+AggressiveOpts -XX:MaxDirectMemorySize=768m -DMYCAT_HOME=D:\
p "..\conf;..\lib\*" io.mycat.MycatStartup

　　而后dos中会不停的出现心跳检测，有错误信息可去mycat\logs中查看日志。

　　注意：如日志中出现192.168.xxx not connected 等信息，请容许对应的mysql远程访问，且先提早独自检查mysql都能正确访问。

　　使用navicat链接mycat，操做方式和链接物理mysql库一致，用户mycat，密码123456，端口8066
　　链接成功后，将看到TESTDB数据库和hotnews等数据表
　　在hotnews表中添加一些数据，保存
　　执行select * from hotnews 查看操做，而后去TESTDB一、TESTDB二、TESTDB3中查询hotnews表

　　MyCat中TESTDB是中间件逻辑数据库，MySQL中的testdb、testdb二、testdb3是真实的数据库。

　　在mycat中添加数据时若提示testdb2.hotnews不存在，则要手动在testdb2中添加相同表结构。

　　添加完后，能够看到hotnews记录在三个testdb、testdb二、testdb3中是均衡随机插入的。

　　而goods在testdb、testdb2中是同样的。

一步一步在Windows中使用MyCat负载均衡 上篇

1、下载

2、配置

3、链接MySQL

4、运行

至此能够配置出MyCat了，敬请期待下篇 net下如何使用。

一步一步在Windows中使用MyCat负载均衡上篇