Tag: Spark
-
Spark: Compreendendo RDDs e Operações
O Spark é um framework de código aberto para processamento distribuído de grandes conjuntos de dados em clusters de computadores. Ele oferece uma API mais fácil de usar do que o Hadoop MapReduce e pode ser usado para uma variedade mais ampla de tarefas. Resilient Distributed Datasets (RDDs) Os RDDs são a base do Spark.…