问题1:WARN TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient memoryspa
此时程序会一直loading,running,loading,running…的循环,并持续出现上面的警告。
出现这个错误颇有多是你启动spark的方式有问题。ip
不少人启动spark直接用start-all.sh,可是若是你在env配置文件里没有指定master的ip,这样启动就会报上面这个问题。若是没有配置能够在启动的时候指定:ci
在maser上用it
./start-master.sh -h “ip地址”spark
在worker上用ast
./start-slave.sh spark://"master的ip":7077配置
其它参数在启动的时候也能够指定,端口号也能够改动。循环