须要将旧的阿里云帐号里的OSS资源迁移至新的阿里云主帐号内的OSS。html
OssImport工具能够将本地、其它云存储的数据迁移到OSS,它有如下特色: 支持的丰富的数据源,有本地、七牛、百度BOS、AWS S三、Azure Blob、又拍云、腾讯云COS、金山KS三、HTTP、OSS等,并可根据须要扩展; 支持断点续传; 支持流量控制; 支持迁移指定时间后的文件、特定前缀的文件; 支持并行数据下载、上传; 支持单机模式和分布式模式,单机模式部署简单使用方便,分布式模式适合大规模数据迁移。 OssImport有 单机模式 和 分布式模式 两种部署方式。 对于小于 30TB 的小规模数据迁移,单机模式便可完成。 对于大规模的数据迁移,请使用分布式模式。
java version "1.8.0_162" CentOS Linux release 7.4.1708 (Core) 内核版本 3.10.0-693.2.2.el7.x86_64
# wget http://gosspublic.alicdn.com/ossimport/standalone/ossimport-2.3.1.zip?spm=a2c4g.11186623.2.4.Y7BlCt&file=ossimport-2.3.1.zip # cd /usr/local && mkdir ossimport # unzip ossimport-2.3.1.zip -d ossimport/
ossimport ├── bin │ └── ossimport2.jar # 包括Master、Worker、Tracker、Console四个模块的总jar ├── conf │ ├── local_job.cfg # 单机Job配置文件 │ └── sys.properties # 系统运行参数配置文件 ├── console.bat # Windows命令行,能够分布执行调入任务 ├── console.sh # Linux命令行,能够分布执行调入任务 ├── import.bat # Windows一键导入,执行配置文件为conf/local_job.cfg配置的数据迁移任务,包括启动、迁移、校验、重试 ├── import.sh # Linux一键导入,执行配置文件为conf/local_job.cfg配置的数据迁移任务,包括启动、迁移、校验、重试 ├── logs # 日志目录 └── README.md # 说明文档,强烈建议使用前仔细阅读 其中: Job:用户经过提交的数据迁移任务,对用户来讲一个任务对应一个配置文件job.cfg。 Task:Job按照 “数据大小” 和 “文件个数” 能够分红多个 Task ,每一个 Task 迁移部分文件。Job切分红Task的最小单位是文件,同一个文件不会切分到多个Task中。 注意: 执行命令时请保证工做目录为 `import.sh` 的同级目录,即直接执行 bash import.sh
/usr/local/ossimport/conf/sys.propertiesjava
参照 官方文档七牛云存储
/usr/local/ossimport/conf/sys.propertiesbash
参照 官方文档网络
根据实际项目选择对应的job.cfg 官方文档并发
这里仅仅以源OSS为例,目标OSS刚须要受权读写OSS权限。分布式
迁移具体场景
从A帐号迁入B帐号ide
A 帐号下的OSS Bucket为wdbox >> B 帐号下的OSS Bucket为sili-pr工具
#是否打开增量模式 isIncremental=false #同步源类型 srcType=oss #源access key,能够在阿里云-访问控制-用户管理 新创建一个用户并建立AccessKey,并受权对OSS只读便可。这里填写AccessKey ID srcAccessKey=L**********m #源secrect key,这里填写AccessKeySecret srcSecretKey=9****************7 #源endpoint #1.oss: 从控制台获取域名(非带bucket前缀的二级域名),域名列表参考https://help.aliyun.com/document_detail/31834.html; 例:"srcDomain=http://oss-cn-hangzhou-internal.aliyuncs.com"; 若是用阿里云ecs虚拟机作迁移的,请使用internal域名,不计费且不受虚拟机带宽限制(非虚拟机没法使用);例:http://oss-cn-hangzhou-internal.aliyuncs.com #内网流量不计费。 srcDomain=http://oss-cn-shenzhen-internal.aliyuncs.com #源bucket名字,不须要加上"/" srcBucket=wdbox #源前缀,默认为空,若是srcType=local,则此目录是本地目录,若是是其余类型,则是源Bucket里须要同步的Object的前缀,注意若是是本地目录,须要完整目录路径(以'/'进行分割而且以'/'结尾,例: c:/example/) destPrefix= ##############################################################同步目的端设置################################################################ #目的 access key destAccessKey=L*************P #目的 AccessKeySecret destSecretKey=n***********************e #目的endpoint,请根据您的实际oss区域填写,默认为杭州的域名,若是用阿里云ecs虚拟机作迁移的,请使用internal域名,不计费且不受虚拟机带宽限制(非虚拟机没法使用);例:http://oss-cn-hangzhou-internal.aliyuncs.com #注意:域名里不要带上bucket前缀,oss域名帮助页面:https://help.aliyun.com/document_detail/31837.html 这里是采用了目标OSS所在的VPC网络内的ECS主机,因此,采用内部地址则免流量。 destDomain=http://oss-cn-shenzhen-internal.aliyuncs.com #目的bucket,不须要加上"/" destBucket=sili-pr #目标前缀,默认为空,直接放在bucket下(若是要将数据同步到oss的某个目录下,请以'/'结尾),注意:oss不支持以 '/' 做为文件的开头,因此destPrefix请不要配置以'/'作为开头 #一个本地文件路径为 srcPrefix + relativePath的文件,迁移到oss的路径为destDomain/destBucket/destPrefix + relativePath #一个云端文件路径为 srcDomain/srcBucket/srcPrefix + relativePath的文件,迁移到oss的路径为destDomain/destBucket/destPrefix + relativePath destPrefix= ##############################################################任务配置,没有特殊需求不须要修改################################################# #job名字,每一个任务惟一,单机模式下请不要修改此项 jobName=local_test #job类型(import/audit),import为同步数据到oss,audit为校验源端数据和oss数据是否一致 jobType=import #只导入源文件最后修改时间大于该时间的数据,默认为0,这个时间为unix时间戳(秒数) importSince=0 #在校验时,若是文件的最后修改时间大于该值,则跳过此文件的校验,默认值0为关闭该功能,全部文件都须要校验,这个时间为unix时间戳(秒数),jobType为audit时此项不生效 lastModify=0 #数据迁移时,是否跳过已经存在的文件。当设置为true时,根据文件的size和LastModifedTime判断是否跳过;为false时,老是覆盖OSS上已有文件。jobType为audit时此项不生效。 isSkipExistFile=false # 每一个子任务最大的文件个数限制,这个会影响到任务执行的并行度,通常配置为总的文件数/120 taskObjectCountLimit=4 #每一个子任务下载的最大文件大小限制(bytes) taskObjectSizeLimit=1000000000 #并行扫描文件列表的线程数,只影响扫描文件的效率,没有特殊需求不要修改 scanThreadCount=1 #最大容许并行扫描目录的深度,默认为1就是只能在顶级目录间并行扫描,没有特殊需求不要修改,随意配置的过大会致使任务没法正常运行 maxMultiThreadScanDepth=1 #单个大文件分片上传并发数,默认超过150MB为大文件,分片为50MB,srcType=local时有效,其它状况该配置项无效 uploadThreadNumPerLargeFile=3 #大于该值的文件使用分片上传,不然使用普通上传,请配置大于1MB以上;有效配置值如:50m/1024m/5g multipartUploadThreshold=150m #分配上传时分片大小,请配置大于100k的数据,不然无效,采用默认值50MB;有效配置值如:500k/50m/2g multipartUploadPartSize=50m #存储在OSS上的数据否加密,默认不加密 isServerSideEncryption=false #local模式时,连接文件是否上传,默认不上传 isAllowSymbolicLink=false # 七牛云存储获取Meta的方式,有效值head和stat,默认使用stat;head经过HTTP HEAD请求获取,stat经过BucketManager.stat getObjectMetaMode=stat #数据迁移后是否进行数据的正确性校验,默认校验 isAuditAfterImport=true #数据校验方式,有效值为simple/general/detailed,默认值general;simple只校验文件的size,general校验文件的size/lastModify/header,detailed检验文件的CRC或MD5,开发中 auditMode=general
# bash import.sh
https://help.aliyun.com/document_detail/59636.html?spm=a2c4g.11186623.2.3.vXRqXS