Особенности

При использовании дедупликации следует учитывать следующие нюансы:

  • Для использования дедупликации при выполнении резервного копирования каких-либо данных, необходимо убедиться, что модуль резервного копирования этих данных поддерживает дедупликацию. Показателем этого является поддержка модулем параметра вызова -D. При его вызове с этим параметром будет возвращён 0, например:

    /opt/rubackup/modules/rb_module_filesystem -D
    echo $?
    0
  • Перемещение и копирование резервных копий, созданных с применением дедупликации, возможно только в пулы типа Блочное устройство. При этом параметры пула назначения (размер блока дедупликации, алгоритм хеш-функции и длина хеш-функции) должны совпадать с параметрами пула хранения резервной копии.

  • При создании дедуплицированной резервной копии создаётся метафайл, который размещается в пуле типа Файловая система сервера резервного копирования. В репозитории RuBackup этот файл указывается одновременно как archive и snapshot резервной копии. При этом сами данные резервной копии располагаются в блочном устройстве.

  • При удалении резервной копии из репозитория происходит удаление только метафайла резервной копии и записи в базе данных RuBackup. Непосредственно блоки данных из хранилища не удаляются. Для освобождения хранилища от неиспользуемых блоков можно периодически выполнять операцию очистки. Настройка этой операции осуществляется в окне настроек глобальной конфигурации системы на вкладке Дедупликация.

  • При выполнении операции электронной подписи резервной копии будет подписан только метафайл резервной копии, но не сами дедуплицированные блоки данных. При проверке резервной копии будет проверен метафайл. В окне настроек глобальной конфигурации системы на вкладке Дедупликация вы можете установить для параметра Проверять только метаданные значение no. В таком случае на соответствие хеша будут проверены все используемые резервной копией блоки данных в блочном устройстве.

  • Если в пул добавлено несколько блочных устройств, то хеш-таблица уникальных блоков будет создана для каждого из устройств. Это означает, что дедупликация работает в рамках одного блочного устройства. Разные устройства могут содержать одинаковые блоки данных.

  • Хеш-таблица блочного устройства загружается в оперативную память сервера резервного копирования. Это означает, что при большом объёме блочного устройства потребуется учесть необходимость в большем объёме оперативной памяти.

  • Максимально возможный объём памяти для отдельной операции резервного копирования или восстановления определяется в конфигурационном файле /opt/rubackup/etc/config.file значением параметра deduplication-task-memory. Если на сервере резервного копирования предполагается выполнение большого количества одновременных операций с использованием дедупликации, необходимо учесть это в требованиях к объёму оперативной памяти сервера.

  • В репозитории резервного копирования в качестве объёма дедуплицированной резервной копии указывается объём её метафайла.

  • При выполнении дедуплицированного резервного копирования файловой системы с файлами разного размера, файл размером больше, чем размер дедуплицированного блока данных, займёт несколько блоков в блочном устройстве (по возможности, последовательно). Файл размером меньше, чем размер дедуплицированного блока данных, займёт один блок.

  • В случае выполнения полной резервной копии на сервер передаются только те блоки данных, которых нет в дедуплицированном хранилище. Это фактически означает, что исчезает практический смысл выполнения инкрементального и дифференциального резервного копирования, и вместо разностного резервного копирования можно всегда выполнять полное резервное копирование. Несмотря на это, модули резервного копирования могут поддерживать разностное резервное копирование и для дедупликационного режима работы.