上传本地文件到HDFS_如何上传文件到hdfs-程序员宅基地

技术标签: hdfs  hadoop  文件系统  

1. 根据配置文件得到三个待用目录

   本地文件目录 (待上传目录)

  hdfs远程文件备份目录(hdfs备用目录)

  hdfs远程文件归档目录(hdfs正式路径)

  hdfs的文件操作封装成工具类,随时供调用

public class HDFSUtil {

	protected static Configuration conf;
	protected FileSystem hdfs;
	private Comparator<? super LocatedFileStatus> fileCompare;

	public HDFSUtil() {
		try {
			if (conf == null) {
		      conf = new Configuration();
			}
            //获取配置的文件系统
			hdfs = FileSystem.get(conf);
		} catch (IOException e) {
			throw new BaseException("HDFS读取配置文件获取连接操作异常!");
		}
        //文件比较器定义,即修改时间不同的文件,即为“不同的”文件
		fileCompare = new Comparator<LocatedFileStatus>() {
			@Override
			public int compare(LocatedFileStatus o1, LocatedFileStatus o2) {
				int rs = 0;
				long l1 = o1.getModificationTime();
				long l2 = o2.getModificationTime();
				if (l1 > l2) {
					rs = 1;
				} else if (l1 < l2) {
					rs = -1;
				}
				return rs;
			}
		};
	}

/**
	 * 是否存在目录或文件 .
	 * 
	 */
	public boolean existFile(String hdfsPath) throws IOException {
		Path path = new Path(hdfsPath);
		return hdfs.exists(path);
	}
	/**
	 * 删除目录或文件
	 * 
	 * @param dir
	 *            目录名
	 */
	public boolean deleteFileOrDir(String dir) {
		boolean flag = false;
		try {
			flag = hdfs.delete(new Path(dir), true);
			if (!flag) {
				throw new BaseException("删除目录或文件失败,请检查'" + dir + "'目录或文件是否存在!");
			}
		} catch (IOException e) {
					throw new BaseException("HDFS删除目录或文件失败!");
		}
		return flag;
	}
/**
	 * 将本地文件上传到HDFS服务器上
	 * 
	 * @param source
	 *            源文件路径
	 * @param dest
	 *            目标文件路径
	 */
	public boolean uploadLocalFile2HDFS(String source, String dest) {
		boolean flag = false;
		Path src = new Path(source);
		try {
			Path dst = new Path(dest);
			if (hdfs.exists(dst)) { // 如果目标文件已存在,则先删除再上传
				deleteFileOrDir(dest);
			}
			hdfs.copyFromLocalFile(src, dst);
			// 设置上传者本身有删除权限
			hdfs.setPermission(dst, FsPermission.valueOf("-rwxrwxr-x"));
			flag = true;
		} catch (Exception e) {
		
				throw new BaseException(dest, e.getMessage());
			}
			throw new BaseException("HDFS上传文件失败.");
		}
		return flag;
	}
	/**
	 * 新建目录
	 * 
	 * @param dir
	 *            目录名
	 */
	public boolean makeDir(String dir) {
		boolean flag = false;
		try {
			Path path = new Path(dir);
			if (hdfs.exists(path)) {
				flag = true; // 如果路径存在,直接返回true
			} else {
				flag = hdfs.mkdirs(new Path(dir));
			}
		} catch (IOException e) {
			throw new BaseException("创建目录失败!");
		}
		return flag;
	}

}

2.扫描本地文件目录中存在的文件名

//获取本地路径, pathName不可为null,否则会抛空指针异常

File file=new File(pathName);

/**

将此路径下的所有文件和目录名(当前名称,不包含此目录或文件的父目录名称)以数组形式列出,如果pathName放入的不是目录,而是文件名,则此函数返回null,如果该目录下无文件则返回空。

**/
String filename[]=file.list();

3. 本地文件目录+文件名 即为完整的需要上传的文件整体目录信息。

4. 新建对列以存储文件目录信息,将文件信息放入队列,等待上传

    private static ConcurrentLinkedQueue<String> upLoadHdfsqueue = new ConcurrentLinkedQueue<>();
    public static void add(String pathName) {
        upLoadHdfsqueue.add(pathName);
        logger.info(ILoggerBusiness.LOGTYPE_BUSINESS, ILoggerBusiness.ERRORCODE_NULL, "hdfs队列增加一个元素:" + str);
    }
    
    public static int GetQueueSize() {
        return upLoadHdfsqueue.size();
    }

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/zzooeefly/article/details/88634234

智能推荐

第三十六篇、基于Arduino uno,获取红外寻迹传感器的原始值——结果导向_怎么检测红外寻迹模块返回值-程序员宅基地

文章浏览阅读385次。基于Arduino uno,获取红外寻迹传感器的原始值_怎么检测红外寻迹模块返回值

基于单片机的无线投票显示系统设计-程序员宅基地

文章浏览阅读494次,点赞5次,收藏9次。单片机(Microcontroller)是一种集成了微处理器核心、存储器、输入/输出接口和定时器等功能模块的集成电路芯片,具有体积小、功耗低、性价比高等特点,被广泛应用于各个领域。单片机的发展历史可以追溯到20世纪70年代,当时的单片机功能有限,主要用于简单的控制任务。

生成对抗网络GAN_生成对抗网络 python代码-程序员宅基地

文章浏览阅读412次。https://zhuanlan.zhihu.com/p/54096381_生成对抗网络 python代码

html——网页上添加表格_怎样在网站中添加表格别人可以下载-程序员宅基地

文章浏览阅读5.2k次,点赞7次,收藏18次。有时候我们需要在网页上展示一些数据,如某公司想在网页上展示公司的库存清单。如下表:想在网页上展示上述表格效果可以使用以下代码:创建表格的四个元素:table、tbody、tr、th、td1、…:整个表格以标记开始、标记结束。2、…:当表格内容非常多时,表格会下载一点显示一点,但如果加上标签后,这个表格就要等表格内容全部下载完才会显示。如右侧代码编辑器中的代码。3、…_怎样在网站中添加表格别人可以下载

《Qt MOOC系列教程》第五章第三节:创建新的QML类型_qmlregisteruncreatabletype-程序员宅基地

文章浏览阅读770次。到目前为止,我们已经讨论了如何将对象实例公开给QML上下文。有时我们还希望在QML中可以使用注册类本身。注册允许将类当作QML中的数据类型来使用。此外,注册还可以提供其他功能,比如允许在QML中将类用作可实例化的QML对象类型,或者允许在QML中导入和使用类的单例实例。通常我们使用Q_OBJECT宏注册从QObject派生的类,也可以用Q_GADGET宏声明一个比QObject“更轻”的版本。在这些更轻的类中,我们可以访问它们的属性、枚举和可调用的方法,但不能使用信号槽系统,我们稍后会进行介绍。1. 注_qmlregisteruncreatabletype

头文件与命名空间的关系_c#中命名空间和c语言中头文件之间的关系-程序员宅基地

文章浏览阅读2.1k次,点赞7次,收藏15次。头文件与命名空间的关系 Q:有些书说有些头文件不在std里是什么意思?std里包含些什么?为什么不用std就不能使用cout?头文件中声明的东西为什么在使用的时候需要先using namespace std;一下?如果我不用#include和其他头文件。只用using namespace std 的话,是不能用cout的。这说明cout是在iostream里声明_c#中命名空间和c语言中头文件之间的关系

随便推点

python实现矩阵乘法(实现文件读写操作)_python 读取csv矩阵乘法-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏8次。注释dtype=np.int代表导入数据的格式为整数delimiter=’,'代表原始数据的存储格式为以‘,’为间隔原始文件中以‘#’开头的行代表被注释,不会被np.loadtxt读取通过[[0] * b for i in range(a)]的方式初始化一个x[a][b]的二维数组np.savetxt()函数可以用来保存数据,第一个参数为保存数据的路径,其中C是自定义的文件名,如果该文..._python 读取csv矩阵乘法

《军团要塞2》绘画渲染_军团要塞画师-程序员宅基地

文章浏览阅读1.4k次。军团要塞2绘画渲染(a)美术概念 (b)游戏内玩家看到的角色摘要在《军团要塞2》中我们提出了一整套美术方案和新的实时渲染技术,这种技术能实现出一种独一无二的渲染风格。《军团要塞2》由美术和程序基于20世纪初时商业插画中的传统风格合作完成。在这篇论文中,我们会结合美术方向与技术选择,来讨论如何支持美术目标和玩法限制。除了实现一种有冲击力的风格外,我们也设计了边缘光照和亮度与色调变化的着色器技..._军团要塞画师

【数字图像处理实验二】:RGB图3个通道的提取、RGB图转灰度图、图片反转、图片亮度调整、直方图显示_jupter rgb灰度直方图提取-程序员宅基地

文章浏览阅读9.6k次,点赞8次,收藏65次。这里介绍:RGB图3个通道的提取、RGB图转灰度图、图片反转、图片亮度调整具体操作,需导入的库如下:原图如下:结果如下,从左到右分别是:Red,Green,Blue这里借助skimage库中的exposure函数来进行图像亮度的调整结果如下:........._jupter rgb灰度直方图提取

2023年地级、省级、县级、国界、九段线的shp数据_九段线shp数据-程序员宅基地

文章浏览阅读931次。2023年地级、省级、县级、国界、九段线的shp数据_九段线shp数据

python高校本科生学习成长记录系统的设计与实现flask-django-php-nodejs-程序员宅基地

文章浏览阅读797次,点赞16次,收藏19次。二十一世纪我们的社会进入了信息时代,信息管理系统的建立,大大提高了人们信息化水平。传统的管理方式对时间、地点的限制太多,而在线管理系统刚好能满足这些需求,在线管理系统突破了传统管理方式的局限性。于是本文针对这一需求设计并实现了一个基于django高校本科生学习成长记录系统,为了简捷并有效的解决学习各方面的问题。

redis实现分布式session共享_redis分布式session共享-程序员宅基地

文章浏览阅读7.7k次。为什么要共享session?我们使用单台Tomcat的时候不会有共享sesssion的疑虑,只要使用Tomcat的默认配置即可,session即可存储在Tomcat上。但是随着业务的扩大,增加Tomcat节点构成Tomcat集群大势所趋,分布式带来了增加更大规模并发请求的优势,但是也随之到来了一个问题,每个Tomcat只存储来访问自己的请求产生的session,如果Tomcat-A已经为客..._redis分布式session共享

推荐文章

热门文章

相关标签