技术标签: maven依赖 spark sql
I have created a Maven Project for SparkSql and Hive connectivity and written the following example code:
SparkSession spark = SparkSession
.builder()
.appName("Java Spark Hive Example")
.master("local[*]")
.config("hive.metastore.uris", "thrift://localhost:9083")
.enableHiveSupport()
.getOrCreate();
try{
spark.sql("select * from health").show();
} catch(Exception AnalysisException) {
System.out.println("table not found");
}
I am using Spark 2.1.0 and Hive 1.2.1
For running the above code, I import the Jar files from the Spark folder and included it in the project. I haven't used Maven Pom.xml for this particular job. But when I am moving to the bigger clusters like on AWS, I need to run my JAR file.
I am not able to run as the Maven is not able to find the dependencies. So I thought of adding the dependencies. I tried this:
org.apache.spark
spark-core_2.10
2.1.0
org.apache.spark
spark-sql_2.10
1.2.1
org.apache.spark
spark-hive_2.10
1.2.1
But it didn't work and I am not able to see the output what previously I was getting through adding JAR files.
I want to know whether I did anything wrong, if yes then please suggest me what to do? Even as per Spark instructions from the documentation, how I can add the hive-site.xml and hdfs-site.xml with my project in pom.xml? Currently using IntelliJ.
Please let me know what I can do to resolve my issue?
解决方案
I see there is a mis-configuration of depencies.
In your maven dependency your spark-sql & spark-hive are of version 1.2.1 but spark-core is of version 2.1.0
Change all the dependencies to same version number and that should work
org.apache.spark
spark-core_2.10
2.1.0
org.apache.spark
spark-sql_2.10
2.1.0
org.apache.spark
spark-hive_2.10
2.1.0
Bulk APIJava High Level REST Client提供了Bulk处理器来帮助处理批量请求。Bulk请求BulkRequest可以使用一个请求执行多个索引、更新和/或删除操作。它需要在批量请求中添加至少一个操作:BulkRequest request = new BulkRequest();request.add(new IndexRequest("posts").id("1")...
Fleury (弗罗莱) 算法通俗解释1.定义2.举例说明图2为连通图G,现利用Fleury算法求它的欧拉通路。(注意区分:欧拉通路、欧拉回路)其中一种欧拉通路如下:4 5 8 7 6 8 9 1 5 3 2 4 6,其搜索路径如下图所示:现在让我们来分析算法实现过程: 假设我们这样走:4,6,8,5,此时在5处有三种选择(3,4,1
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>table_add.html</title> <script type="text/javascript"
若要判断一个输入的QQ号是否有效,你会如何处呢?首先你得分析一下其对应规则,依次列出:长度大于5,小于等于11; 首位不能为0; 是否为纯数字?规则既列,接着就该尝试实现了,那么用什么来表示字符串呢?在C++中,最容易想到的就是string了,其中提供了许多成员函数可以处理字符串,所以有了如下实现:std::string qq;std::cin >> qq;// 1. 判断位数是否合法if (qq.length() >= 5 && qq.leng
java的mqtt生产者和消费者的代码
@apinote 如果您已经在使用Java 8,则可能会看到一些新的Javadoc标签: @apiNote , @implSpec和@implNote 。 他们怎么了? 如果要使用它们,该怎么办?总览该帖子将快速查看标签的来源和当前状态。 然后,它将解释它们的含义并详细说明如何将它们与IDE,Javadoc工具一起使用,以及如何通过Maven的Javadoc插件使用。 我在GitHub上创...
SSH整合项目(crud、分页、模糊查询…)前一段时间学了SSH框架,所以花了几天时间, 用这个DEMO告别SSH的学习吧!先看看主要效果图:别看我截图有这么多数据,但是这个项目根本没有考虑性能,所以数据太多,操作起来就特别慢功能介绍从这个页面上可以看出我几乎所有的功能 ,先从最基本的crud操作说起吧:①查询:基本上是两表关联查询,分页模糊条件查询;②添加:就是普通的添加,通过下拉框和单选按钮传递数据,当然我为了测试数据,还做了个一次性添加一万条数据的方法出来,看看添加页面:③删除
感觉hibernate容易报 DuplicateMappingException:,其实很多时候并没有重复映射,也没有重复的class文件和hbm文件。一些其它的错误,hibernate也报出这样的错误,非常的误导人。真正原因是:第一次:hibernate.cfg.xml没有同步更新。没有将必要的类配置加导这个文件里。第二次: <composite-id name="id" class...
qDebug用于在控制台输出调试信息,主要有以下几种用法。1、类似c++的cout函数QString str=“world”;qDebug()<<“hello “<<str<<”!”<<endl;注:此处endl起到的作用有两个:a、等同于\n换行b、刷新缓冲区,将缓冲区数据写入文件或屏幕,因此会影响程序效率。endl等价于"/n"+f...
转载自:https://blog.csdn.net/sloanqin/article/details/51545125【前面5层】:作者RPN网络前面的5层借用的是ZF网络,这个网络的结构图我截个图放在下面,并分析下为什么是这样子的;1、首先,输入图片大小是 224*224*3(这个3是三个通道,也就是RGB三种)2、然后第一层的卷积核维度是 7*7*3*96 (所以大家要认识到卷积核都是4维的,...
问题描述:使用org.eclipse.paho.client.mqttv3 连接emqx , 运行一段时间后出现掉线,而且不会自动重连(已设置自动重连,亲测有效),查看日志发现报以下错误:[Timer-1] ERROR o.e.p.c.mqttv3.internal.ClientState - 445:Timed out as no activity, keepAlive=120...
时间:2018.3.25 作者:Tom 工作:HWE 说明:如需转载,请注明出处。VERSION = 1 //主版本号PATCHLEVEL = 3 //次版本号SUBLEVEL = 4 //再次版本号EXTRAVERSION = //另外附加的版本信息U_BOOT_VERSION = $(VERSION)...