informatica
Cosa sono gli RDD (Resilient Distributed Dataset)
Gli RDD (Resilient Distributed Dataset) rappresentano una delle astrazioni fondamentali offerte da Apache Spark per la gestione e l’elaborazione dei dati in modalità distribuita. Gli RDD sono progettati per essere una collezione di elementi distribuiti su diversi nodi di calcolo, Leggi tutto…