Tag: Spark

  • Spark: Compreendendo RDDs e Operações

    Spark: Compreendendo RDDs e Operações

    O Spark é um framework de código aberto para processamento distribuído de grandes conjuntos de dados em clusters de computadores. Ele oferece uma API mais fácil de usar do que o Hadoop MapReduce e pode ser usado para uma variedade mais ampla de tarefas. Resilient Distributed Datasets (RDDs) Os RDDs são a base do Spark.…