Hadoop学习--seek重定位流--day04

import java.io.ByteArrayOutputStream;java

import java.io.FileInputStream;apache

import java.io.FileOutputStream;分布式

import java.io.InputStream;ide

import java.net.URL;oop


import org.apache.hadoop.conf.Configuration;spa

import org.apache.hadoop.fs.FSDataInputStream;.net

import org.apache.hadoop.fs.FSDataOutputStream;xml

import org.apache.hadoop.fs.FileSystem;对象

import org.apache.hadoop.fs.FsUrlStreamHandlerFactory;接口

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

import org.junit.Test;


public class seek {


/**

* 经过API实现seek操做

* @author Administrator

* [hadoop@hadoop01 ~]$ hdfs dfs -chmod -R a+w /user/hadoop

* [hadoop@hadoop01 ~]$ hdfs dfs -ls -R /

*

*/

@Test

public void seekfile() throws Exception {

//建立configuration对象,有个默认的加载顺序,先从core-default.xml,再到src目录中的文件,这里

//咱们给定了

        Configuration conf = new Configuration();

//经过conf的configuration对象建立了该分布式文件系统fs,默认若是不指定文件的话为本地文件系统

        FileSystem fs = FileSystem.get(conf);

        //定义一个URL的字符串

        String file = "hdfs://hadoop01:9000/user/hadoop/data2/kaola.jpg";

        //经过一个URL的字符串构建一个path对象

        Path path = new Path(file);

        FSDataInputStream in = fs.open(path);

        //流对拷

        IOUtils.copyBytes(in, new FileOutputStream("E:/kaola1.jpg"), 1024, false);

//从新定位到文件起始点,只有FSDataInputStream才有实现seek接口,FSDataOutputStream没有

        in.seek(0);

        IOUtils.copyBytes(in, new FileOutputStream("E:/kaola2.jpg"), 1024, true);  

   }

}

相关文章
相关标签/搜索