data locality

Haopu Wang Fri, 18 Jul 2014 00:33:08 -0700

I have a standalone spark cluster and a HDFS cluster which share some of nodes.


 

When reading HDFS file, how does spark assign tasks to nodes? Will it ask HDFS 
the location for each file block in order to get a right worker node?

 

How about a spark cluster on Yarn?

 

Thank you very much!

data locality

Reply via email to