Apache Spark (RDD/DataFrame, partitions, shuffle, PySpark)

Расскажите, как Spark обрабатывает **fault tolerance** для **RDD** и **DataFrame**. В каких случаях данные могут быть потеряны, и как Spark гарантирует восстановление? Какие механизмы используются для восстановления данных после сбоя узла или потери партиции?