CDC:Change Data Capturehtml
转载自:web
1 --步骤:本文中以GPOSDB为例 2 3 --第一步、对目标库显式启用CDC: 4 --在当前库使用sys.sp_cdc_enable_db。返回0(成功)或1(失败)。 5 --注意,没法对系统数据库和分发数据库启用该功能。且执行者须要用sysadmin角色权限。 6 --该存储过程的做用域是整个目标库。包含元数据、DDL触发器、cdc架构和cdc用户。 7 --使用如下代码启用: 8 USE GPOSDB --要启用CDC的数据库 9 GO 10 EXECUTE sys.sp_cdc_enable_db; 11 GO 12 --在一开始直接执行时,出现了报错信息: 13 --消息22830,级别16,状态1,过程sp_cdc_enable_db_internal,第193 行 14 --没法更新元数据来指示已对数据库AdventureWorks 启用了变动数据捕获。 15 --执行命令'SetCDCTracked(Value = 1)' 时失败。 16 --返回的错误为15517: '没法做为数据库主体执行,由于主体"dbo" 17 --不存在、没法模拟这种类型的主体,或您没有所需的权限。'。请使用此操做和错误来肯定失败的缘由并从新提交请求。 18 --这里引出了另一个知识点:错误号 15517 的错误 19 --这种错误会在不少地方出现,如还原数据库的时候也会有可能出现。 20 --共同点是:某个/些存储过程使用了具备WITHEXECUTE AS 的选项。 21 --使其在当前库具备了某个架构,可是当在别的地方执行时,因为没有这个架构,因此就报错,解决方法: 22 ALTER AUTHORIZATION ON DATABASE::[GPOSDB] TO [sa] 23 24 --通过检查,uspUpdateEmployeeHireInfo这个存储过程的确有:WITH EXECUTE AS CALLER 25 --使用sa的缘由是即便sa被禁用,sa仍是存在的。因此不会报错。 26 --如今从新执行: 27 USE GPOSDB 28 GO 29 EXECUTE sys.sp_cdc_enable_db; 30 GO 31 --启用成功,而后经过如下语句检查是否成功: 32 SELECT 33 is_cdc_enabled, 34 CASE WHEN is_cdc_enabled=0 THEN 'CDC功能禁用' ELSE 'CDC功能启用' END 描述 35 FROM sys.databases 36 WHERE NAME = 'GPOSDB' 37 38 --建立成功后,将自动添加CDC用户和CDC架构。 39 --在用户和架构下面能够看到cdc用户和cdc架构 40 41 --建立这两个用户、架构的缘由是由于CDC要求独占方式使用这两个架构,因此要单首创建。 42 --若是存在了非CDC功能建立的CDC用户、架构的话,则须要先删除该cdc命名的架构,才能开启。 43 44 --第二步、对目标表启用CDC: 45 --使用db_owner角色的成员执行sys.sp_cdc_enable_table为每一个须要跟踪的表建立捕获实例。 46 --而后经过sys.tables目录视图中的is_tracked_by_cdc列来判断是否建立成功。 47 --默认状况下会对表的所有列作捕获。若是只须要对某些列作捕获, 48 --可使用@captured_column_list参数指定这些列。 49 --若是要把更改表放到文件组里的话,最好建立单独的文件组(最起码与源表独立)。 50 51 --若是不想控制访问角色,则@role_name必须显式设置为null。 52 sys.sp_cdc_enable_table 53 [ @source_schema = ] 'source_schema', 54 [ @source_name = ] 'source_name' , 55 [ @role_name = ] 'role_name' 56 [,[ @capture_instance = ] 'capture_instance' ] 57 [,[ @supports_net_changes = ] supports_net_changes ] 58 [,[ @index_name = ] 'index_name' ] 59 [,[ @captured_column_list = ] 'captured_column_list' ] 60 [,[ @filegroup_name = ] 'filegroup_name' ] 61 [,[ @partition_switch = ] 'partition_switch' ] 62 63 --例子: 64 --把SYSTEMPARA 这个表开启变动捕获。 65 USE GPOSDB 66 GO 67 EXEC sys.sp_cdc_enable_table @source_schema = 'DBO', 68 @source_name = 'SYSTEMPARA',@role_name = NULL 69 70 --而后查询是否成功: 71 SELECT name , 72 is_tracked_by_cdc , 73 CASE WHEN is_tracked_by_cdc = 0 THEN 'CDC功能禁用' 74 ELSE 'CDC功能启用' 75 END 描述 76 FROM sys.tables 77 WHERE OBJECT_ID = OBJECT_ID('dbo.systempara') 78 --对表开启之后,能够在下图中看到多了不少cdc架构开头的表: 79 --刷新一下GPOSDB数据库,在系统表下面能够看到多了下面几张表 80 [cdc].[DBO_SYSTEMPARA_CT] 81 [cdc].[change_tables] 82 [cdc].[captured_columns] 83 [cdc].[ddl_history] 84 [cdc].[index_columns] 85 [cdc].[lsn_time_mapping] 86 [dbo].[systranschemas] 87 [dbo].[dtproperties] 88 89 --启动以后,能够看到SQLServer代理里面的做业,也出现了这两个做业: 90 [cdc.GPOSDB_capture] 91 [cdc.GPOSDB_cleanup] 92 93 --在可编程性-》函数-》表值函数里,也多了两个函数 94 [cdc].[fn_cdc_get_all_changes_DBO_SYSTEMPARA] 95 [cdc].[fn_cdc_get_net_changes_DBO_SYSTEMPARA] 96 97 --下面列出相关的存储过程: 98 --Sys.sp_cdc_add_job 99 --说明及例子 100 --Sys.sp_cdc_generate_wrapper_function 101 --说明及例子 102 --Sys.sp_cdc_change_job 103 --说明及例子 104 --Sys.sp_cdc_get_captured_columns 105 --说明及例子 106 --Sys.sp_cdc_cleanup_change_table 107 --说明及例子 108 --Sys.sp_cdc_get_ddl_history 109 --说明及例子 110 --Sys.sp_cdc_disable_db 111 --说明及例子 建议先禁用表,再禁用库 112 --Sys.sp_cdc_help_change_data_capture 113 --说明及例子 114 --Sys.sp_cdc_disable_table 115 --说明及例子 116 --Sys.sp_cdc_help_jobs 117 --说明及例子 118 --Sys.sp_cdc_drop_job 119 --说明及例子 120 --Sys.sp_cdc_scan 121 --说明及例子 122 --Sys.sp_cdc_enable_db 123 --说明及例子 124 --Sys.sp_cdc_start_job 125 --说明及例子 126 --Sys.sp_cdc_enable_table 127 --说明及例子 128 --Sys.sp_cdc_stop_job 129 --说明及例子 130 131 --函数: 132 --Cdc.fn_cdc_get_all_changes_<capture_instance> 133 --说明及例子 134 --Sys.fn_cdc_has_column_changed 135 --说明及例子 136 --Cdc.fn_cdc_get_net_changes_<capture_instance> 137 --说明及例子 138 --Sys.fn_cdc_increment_lsn 139 --说明及例子 140 --Sys.fn_cdc_decrement_lsn 141 --说明及例子 142 --Sys.fn_cdc_is_bit_set 143 --说明及例子 144 --Sys.fn_cdc_get_column_ordinal 145 --说明及例子 146 --Sys.fn_cdc_map_lsn_to_time 147 --说明及例子 148 --Sys.fn_cdc_get_max_lsn 149 --说明及例子 150 --Sys.fn_cdc_map_time_to_lsn 151 --说明及例子 152 --Sys.fn_cdc_get_min_lsn 153 --说明及例子 154 155 --------------------下面开始从头至尾作一个实际案例------------------------- 156 --下面开始从头至尾作一个实际案例 157 158 --步骤一:对目标库显式启用CDC 159 USE GPOSDB --要启用CDC的数据库 160 GO 161 EXECUTE sys.sp_cdc_enable_db; 162 GO 163 164 165 --某些数据库可能存在一些存储过程包含有:execute as 等语句,此时会报错: 166 167 168 --文字描述: 169 --消息22830,级别16,状态1,过程sp_cdc_enable_db_internal,第186 行 170 --没法更新元数据来指示已对数据库AdventureWorks 启用了变动数据捕获。执行命令'SetCDCTracked(Value = 1)' 时失败。返回的错误为15517: '没法做为数据库主体执行,由于主体"dbo" 不存在、没法模拟这种类型的主体,或您没有所需的权限。'。请使用此操做和错误来肯定失败的缘由并从新提交请求。 171 --消息266,级别16,状态2,过程sp_cdc_enable_db_internal,第0 行 172 --EXECUTE 后的事务计数指示BEGIN 和COMMIT 语句的数目不匹配。上一计数= 0,当前计数= 1。 173 --消息266,级别16,状态2,过程sp_cdc_enable_db,第0 行 174 --EXECUTE 后的事务计数指示BEGIN 和COMMIT 语句的数目不匹配。上一计数= 0,当前计数= 1。 175 --消息3998,级别16,状态1,第1 行 176 --在批处理结束时检测到不可提交的事务。该事务将回滚。 177 --若是出现这个错误,目前的解决方法是执行下面语句,缘由已在开头说明,对于没有使用EXECUTE AS的库,通常不会有这样的问题: 178 179 180 ALTER AUTHORIZATION ON DATABASE::[GPOSDB] TO [sa] 181 182 --如今从新执行: 183 USE GPOSDB 184 GO 185 EXECUTE sys.sp_cdc_enable_db; 186 GO 187 --经过如下语句检查是否成功: 188 SELECT 189 is_cdc_enabled, 190 CASE WHEN is_cdc_enabled=0 THEN 'CDC功能禁用' ELSE 'CDC功能启用' END 描述 191 FROM sys.databases 192 WHERE NAME = 'GPOSDB' 193 194 --步骤二:对表启用CDC 195 USE GPOSDB 196 GO 197 EXEC sys.sp_cdc_enable_table 198 @source_schema = 'DBO', 199 @source_name = 'SYSTEMPARA', 200 @role_name = NULL, 201 @capture_instance=DEFAULT 202 GO 203 204 --而后查询是否成功: 205 SELECT name , 206 is_tracked_by_cdc , 207 CASE WHEN is_tracked_by_cdc = 0 THEN 'CDC功能禁用' 208 ELSE 'CDC功能启用' 209 END 描述 210 FROM sys.tables 211 WHERE OBJECT_ID = OBJECT_ID('dbo.systempara') 212 213 --能够看到GPOSDB数据库里的系统表里新增了[cdc].[DBO_SYSTEMPARA_CT]表 214 215 216 217 218 219 --步骤三:检验,下面来改动数据 220 --先查询一下DBO_SYSTEMPARA_CT表 221 SELECT * FROM cdc.[DBO_SYSTEMPARA_CT] 222 223 --能够看到一条记录都没有,由于刚刚建立,并无对原表systempara作任何增删改操做 224 225 --向[SystemPara]表插入一条记录 226 INSERT INTO [dbo].[SystemPara] 227 ( [ParaValue] , 228 [Name] , 229 [Description] 230 ) 231 VALUES ( '中国' , -- ParaValue - varchar(50) 232 '中国' , -- Name - varchar(50) 233 '中国' -- Description - varchar(50) 234 ) 235 236 --查询一下DBO_SYSTEMPARA_CT表,能够看到多了一条记录 237 SELECT * FROM cdc.[DBO_SYSTEMPARA_CT] 238 239 240 --更新[SystemPara]表的一条记录 241 UPDATE [dbo].[SystemPara] SET [ParaValue]='德国' WHERE [Description]='中国' 242 243 --查询一下DBO_SYSTEMPARA_CT表,能够看到多了两条记录 244 SELECT * FROM cdc.[DBO_SYSTEMPARA_CT] 245 246 --删除[SystemPara]表的一条记录 247 DELETE FROM [dbo].[SystemPara] WHERE [Description]='中国' 248 249 --查询一下DBO_SYSTEMPARA_CT表,能够看到多了一条记录 250 SELECT * FROM cdc.[DBO_SYSTEMPARA_CT] 251 252 --如今来分析一下DBO_SYSTEMPARA_CT表 253 --能够在联机丛书上查看: 254 --cdc.<capture_instance>_CT 255 --能够看到,这样命名的表,是用于记录源表作过更改操做的表。 256 --对于insert/delete操做,会有对应的一行记录,而对于update,会有两行记录。 257 --对于__$operation列:1 = 删除、2= 插入、3= 更新(旧值)、4= 更新(新值) 258 --update语句的__$operation列的值是3和4,因此一条update语句对应两条记录 259 260 --对于__$start_lsn列:因为更改是来源与数据库的事务日志,因此这里会保存其事务日志的开始序列号(LSN) 261 --可是微软不检查直接查询这类表,建议使用 262 --cdc.fn_cdc_get_all_changes_<捕获实例> 263 --cdc.fn_cdc_get_net_changes_<capture_instance> 264 -- 来查询 265 266 ---------------------------------------------------------- 267 268 --下文开始,来熟悉各类函数、存储过程的使用,并尝试一些不正常的操做。 269 270 271 272 --平常使用情景: 273 --一、查询已经开启的捕获实例: 274 --返回全部表的变动捕获配置信息 275 USE [GPOSDB] 276 GO 277 EXECUTE sys.sp_cdc_help_change_data_capture; 278 GO 279 280 281 282 --查看对某个实例(即表)的哪些列作了捕获监控 283 USE [GPOSDB] 284 GO 285 EXEC sys.sp_cdc_get_captured_columns 286 @capture_instance = 'systempara' -- sysname 287 288 289 290 --也能够从下面中查找配置信息 291 SELECT * FROM msdb.dbo.cdc_jobs 292 293 294 295 296 297 298 --二、查看当前配置使用sp_cdc_help_jobs: 299 --从上文能够看到,启用cdc以后会自动建立了两个做业,能够先使用如下语句来查看: 300 sp_cdc_help_jobs 301 302 303 304 --对于一个大型的OLTP系统,因为数据更改会很是频繁,变动表中的数据会很是多, 305 --若是存放太久(最久能够存放100年),那对数据库空间是很是大的挑战。 306 --此时能够调整上图中cdc.AdventureWorks_cleanup 中retention(单位:分钟)。 307 308 --三、修改配置:sp_cdc_change_job 309 --显示原有配置 310 EXEC sp_cdc_help_jobs 311 GO 312 --更改数据保留时间为100分钟 313 EXECUTE sys.sp_cdc_change_job 314 @job_type = N'cleanup', 315 @retention=100 316 GO 317 318 --重启一下做业,以使设置生效 319 --停用做业 320 EXEC sys.sp_cdc_stop_job N'cleanup' 321 GO 322 --启用做业 323 EXEC sys.sp_cdc_start_job N'cleanup' 324 GO 325 --再次查看 326 EXEC sp_cdc_help_jobs 327 GO 328 --能够看到retention(单位:分钟)的值变为100了 329 330 --四、中止/启用、删除/建立做业 331 332 --停用做业 333 EXEC sys.sp_cdc_stop_job N'cleanup' 334 GO 335 --启用做业 336 EXEC sys.sp_cdc_start_job N'cleanup' 337 GO 338 339 --删除做业 340 EXEC sys.sp_cdc_drop_job @job_type = N'cleanup' -- nvarchar(20) 341 GO 342 --查看做业 343 EXEC sys.sp_cdc_help_jobs 344 GO 345 --能够看到如今只剩下一个做业了:cdc.GPOSDB_capture 346 347 348 --建立做业 349 EXEC sys.sp_cdc_add_job 350 @job_type = N'cleanup', 351 @start_job = 0, 352 @retention = 5760 353 354 --查看做业 355 EXEC sys.sp_cdc_help_jobs 356 GO 357 358 359 360 --五、DDL变动捕获: 361 --CDC除了捕获数据变动以外,还能捕获DDL操做的变化。 362 --前提是先要确保SQLServer 代理的启用,其实CDC功能都须要确保sql 代理正常运行 363 --由于全部操做都经过代理中的两个做业来实现的。 364 --如今先来对SYSTEMPARA 表修改一下,把PARAVALUE的长度加长 365 USE [GPOSDB] 366 GO 367 ALTER TABLE [dbo].[SystemPara] ALTER COLUMN PARAVALUE VARCHAR(120) ; 368 GO 369 370 --而后查询ddl记录表 371 SELECT * FROM cdc.ddl_history 372 373 374 --六、使用CDC的函数来获取更改 375 --A、使用 [cdc].[fn_cdc_get_all_changes_DBO_SYSTEMPARA] 376 --函数报告捕获实例的当前全部可用更改 377 DECLARE @from_lsn BINARY(10) , 378 @to_lsn BINARY(10) 379 SET @from_lsn = sys.fn_cdc_get_min_lsn('SYSTEMPARA') 380 SET @to_lsn = sys.fn_cdc_get_max_lsn() 381 SELECT * 382 FROM cdc.fn_cdc_get_all_changes_DBO_SYSTEMPARA(@from_lsn, @to_lsn,N'all update old'); 383 GO 384 385 386 387 388 --B、获取某个时间段的更改信息: 389 --先根据日志序列号(logsequence number ,LSN)来获取跟踪变动数据 390 --Sys.fn_cdc_map_time_to_lsn获取变动范围内的最大、最小LSN值。可使用 391 Smallest greater than; 392 smallest greater than orequal; 393 largest less than; 394 largest less than or equal; 395 396 --如查询某个时间段插入的数据 397 INSERT INTO [dbo].[SystemPara] 398 ( [ParaValue] , 399 [Name] , 400 [Description] 401 ) 402 VALUES ( '中国' , -- ParaValue - varchar(50) 403 '中国' , -- Name - varchar(50) 404 '中国' -- Description - varchar(50) 405 ) 406 407 GO 408 409 --检查数据 410 --1删除 411 --2插入 412 --三、4更改 413 --曾经插入过的记录就算delete了也能够查询出来 414 DECLARE @bglsn VARBINARY(10)= sys.fn_cdc_map_time_to_lsn('smallest greater than or equal', 415 '2013-10-21 12:00:00.997') 416 DECLARE @edlsn VARBINARY(10)= sys.fn_cdc_map_time_to_lsn('largest less than or equal', 417 GETDATE()) 418 SELECT * 419 FROM [cdc].[DBO_SYSTEMPARA_CT] 420 WHERE [__$operation] = 2 421 AND [__$start_lsn] BETWEEN @bglsn AND @edlsn 422 423 424 425 --C、sys.fn_cdc_map_lsn_to_time 查询变动时间: 426 SELECT [__$operation] , 427 CASE [__$operation] 428 WHEN 1 THEN '删除' 429 WHEN 2 THEN '插入' 430 WHEN 3 THEN '更新(捕获的列值是执行更新操做前的值)' 431 WHEN 4 THEN '更新(捕获的列值是执行更新操做后的值)' 432 END [类型] , 433 sys.fn_cdc_map_lsn_to_time([__$start_lsn]) [更改时间] , 434 * 435 FROM [cdc].[DBO_SYSTEMPARA_CT] 436 437 438 439 --D、获取LSN边界 440 SELECT sys.fn_cdc_get_max_lsn() [数据库级别的最大LSN] , 441 sys.fn_cdc_get_min_lsn('cdc.DBO_SYSTEMPARA_CT') [捕获实例的lsn] 442 443 444 这两个值能够用于上面提到的函数里面用于筛选数据之用。 445 446 447 ---------------------------------------------------------- 448 --1. CDC的目的是什么? 449 450 --CDC就是极大地方便了咱们获取某个表数据更新状况的一个机制。它经过一个独立的进程, 451 --异步读取日志文件,而不是触发器的方式工做。并且它的数据是会持久化保存到一个系统表的。 452 --2. CDC是否是SQL Server 2008特有的功能,对别的数据库或者早期版本是否起做用? 453 454 --CDC是SQL Server 2008特有的功能,并且是企业版特有的功能。开发版也有该功能,但仅用于测试场合。 455 456 457 458 --3. CDC读取日志,那么若是日志被截断了会怎么样? 459 460 --若是某部分日志,CDC的进程尚未读取,那么在截断日志时就会忽略这个部分,不能截断!! 461 462 --捕获进程是一个独立的,它随着代理服务启动而启动。两次扫描之间间隔5分钟。 463 464 465 466 --4. 系统表中的数据是否会永久存在? 467 468 --不会,它会被保留3天。会有一个清理的做业,天天晚上2点进行扫描。 469 470 471 472 --最后,补充一点的是,CDC功能依赖Agent服务,由于它有两个操做都是经过做业来启动的。
删除cdcsql
--删除CDC步骤 --要删除哪一个库的cdc 先use哪一个库 use [store_xinye] go --查询每一个CDC表的配置 填写@capture_instance须要用到 EXEC sys.sp_cdc_help_change_data_capture --备份CDC表 将CDC系统表相关数据导出来 select * into cdc_captured_columns from cdc.captured_columns select * into cdc_change_tables from cdc.change_tables select * into cdc_dbo_Logistics_CT from cdc.dbo_Logistics_CT select * into cdc_ddl_history from cdc.ddl_history select * into cdc_index_columns from cdc.index_columns select * into cdc_lsn_time_mapping from cdc.lsn_time_mapping --禁用 这个操做会直接删除CDC系统表 EXECUTE sys.sp_cdc_disable_table @source_schema = N'dbo', @source_name = N'Logistics', @capture_instance = N'dbo_Logistics'; --全部CDC相关对象都会删除 包括 cdc的capture和cleanup 做业 EXECUTE sys.sp_cdc_disable_db;
change tracking和CDC,当分区切换的时候,这期间的数据都不能同步/记录,因此要分区切换最好仍是用自增ID数据库
做业 'cdc.MGLog_capture' 已成功启动。
做业 'cdc.MGLog_cleanup' 已成功启动。
警告: @allow_partition_switch 参数设置为 1。变动数据捕获功能将不跟踪在表中因分区切换而引入的变动,这样,在使用变动时,将致使数据不一致。有关在使用变动数据捕获时分区切换行为的详细信息,请参阅联机丛书。编程
f架构