Дедупликация
Система резервного копирования RuBackup позволяет использовать режим дедупликации при создании резервных копий данных.
В режиме дедупликации данные, которые должны попасть в резервную копию, разделяются на блоки равного размера, и для каждого блока вычисляется хеш-сумма по алгоритму sha1
, sha2
, blake2b
, skein
или streebog
. Перед выполнением резервного копирования сервер передаёт клиенту хеш-таблицу блоков, уже расположенных в дедуплицированном хранилище и которые с высокой степенью вероятности могут содержаться в источнике данных, резервное копирование которых будет выполняться. Серверу передаются только уникальные блоки резервной копии, которые размещаются в дедуплицированном хранилище резервных копий, представляющее собой блочное устройство в операционной системе (это может быть одиночный диск, RAID
массив или LUN
система хранения данных).
Таким образом, при первом резервном копировании источника данных серверу резервного копирования будет передан полный уникальный набор блоков. При повторном резервном копировании будут переданы только изменившиеся блоки данных. Это позволяет уменьшить окно резервного копирования, снизить нагрузку на сеть передачи данных и сэкономить место в хранилище резервных копий.
При восстановлении сервер передаёт клиенту метафайл, содержащий всю необходимую информацию о резервной копии и целевом ресурсе, который требует восстановления. Если восстановление информации происходит непосредственно в источник данных, где были утеряны или изменены какие-либо блоки данных, и требуется восстановить целостность источника данных, то сервер передаст клиенту только те блоки данных, которые были изменены и требуют восстановления. Это позволяет значительно уменьшить время восстановления.
Система резервного копирования RuBackup позволяет объединять дедуплицированные блочные устройства в пулы типа Блочное устройство. Любой сервер в серверной группировке RuBackup может управлять несколькими пулами типа Блочное устройство. Это может быть полезно для использования пула только для определённых данных. Например, вы можете использовать один пул для хранения резервных копий виртуальных машин с гостевой операционной системой MS Windows, и другой пул для резервных копий ВМ с ОС Astra Linux. Параметры пула определяют размер блока дедупликации, алгоритм хеш-функции длину хеша.