Особенности
При использовании дедупликации следует учитывать следующие нюансы:
-
Для использования дедупликации при выполнении резервного копирования каких-либо данных, необходимо убедиться, что модуль резервного копирования этих данных поддерживает дедупликацию. Показателем этого является поддержка модулем параметра вызова
-D
. При его вызове с этим параметром будет возвращён0
, например:/opt/rubackup/modules/rb_module_filesystem -D echo $? 0
-
Перемещение и копирование резервных копий, созданных с применением дедупликации, возможно только в пулы типа Блочное устройство. При этом параметры пула назначения (размер блока дедупликации, алгоритм хеш-функции и длина хеш-функции) должны совпадать с параметрами пула хранения резервной копии.
-
При создании дедуплицированной резервной копии создаётся метафайл, который размещается в пуле типа Файловая система сервера резервного копирования. В репозитории RuBackup этот файл указывается одновременно как
archive
иsnapshot
резервной копии. При этом сами данные резервной копии располагаются в блочном устройстве. -
При удалении резервной копии из репозитория происходит удаление только метафайла резервной копии и записи в базе данных RuBackup. Непосредственно блоки данных из хранилища не удаляются. Для освобождения хранилища от неиспользуемых блоков можно периодически выполнять операцию очистки. Настройка этой операции осуществляется в окне настроек глобальной конфигурации системы на вкладке Дедупликация.
-
При выполнении операции электронной подписи резервной копии будет подписан только метафайл резервной копии, но не сами дедуплицированные блоки данных. При проверке резервной копии будет проверен метафайл. В окне настроек глобальной конфигурации системы на вкладке Дедупликация вы можете установить для параметра Проверять только метаданные значение
no
. В таком случае на соответствие хеша будут проверены все используемые резервной копией блоки данных в блочном устройстве. -
Если в пул добавлено несколько блочных устройств, то хеш-таблица уникальных блоков будет создана для каждого из устройств. Это означает, что дедупликация работает в рамках одного блочного устройства. Разные устройства могут содержать одинаковые блоки данных.
-
Хеш-таблица блочного устройства загружается в оперативную память сервера резервного копирования. Это означает, что при большом объёме блочного устройства потребуется учесть необходимость в большем объёме оперативной памяти.
-
Максимально возможный объём памяти для отдельной операции резервного копирования или восстановления определяется в конфигурационном файле
/opt/rubackup/etc/config.file
значением параметраdeduplication-task-memory
. Если на сервере резервного копирования предполагается выполнение большого количества одновременных операций с использованием дедупликации, необходимо учесть это в требованиях к объёму оперативной памяти сервера. -
В репозитории резервного копирования в качестве объёма дедуплицированной резервной копии указывается объём её метафайла.
-
При выполнении дедуплицированного резервного копирования файловой системы с файлами разного размера, файл размером больше, чем размер дедуплицированного блока данных, займёт несколько блоков в блочном устройстве (по возможности, последовательно). Файл размером меньше, чем размер дедуплицированного блока данных, займёт один блок.
-
В случае выполнения полной резервной копии на сервер передаются только те блоки данных, которых нет в дедуплицированном хранилище. Это фактически означает, что исчезает практический смысл выполнения инкрементального и дифференциального резервного копирования, и вместо разностного резервного копирования можно всегда выполнять полное резервное копирование. Несмотря на это, модули резервного копирования могут поддерживать разностное резервное копирование и для дедупликационного режима работы.