<?xml version="1.0" encoding="windows-1251"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>defann's place</title><link>http://defann.cyberflash.ru</link><description></description><language>ru</language><managingEditor>defann+place@gmail.com</managingEditor><generator>e2 (http://e2.ilyabirman.ru)</generator><item>
<title><![CDATA[Беззащитные данные]]></title>
<guid isPermaLink="true">http://defann.cyberflash.ru/2007/02/24/1</guid>
<link>http://defann.cyberflash.ru/2007/02/24/1</link>
<comments>http://defann.cyberflash.ru/2007/02/24/1/comments</comments>
<description><![CDATA[В голове крупных бизнес-потребителей ИТ произошло наконец-то смещение акцента с бизнес-приложений на данные, обрабатываемые этими приложениями. А в словосочетании «центр обработки данных» теперь заслуженно выделяют третье слово, а не второе. Вместе с пониманием главной роли данных в бизнесе пришёл и панический страх их утери. Ведь по статистике IDC, в случае продолжительного отсутствия доступа к оперативным данным большинство компаний ожидает банкротство.<br />
<br />
Существует два принципиально разных подхода к обеспечению надёжности хранения данных. Первый – это резервное копирование. С резервированием связаны два главных понятия – RPO (recovery point objective) и RTO (recovery time objective). RPO – это момент времени, в который система содержала данные, соответствующие резервной копии. RTO – это время, занимаемое процессом резервирования/восстановления. Естественно, что с ростом объёма корпоративных данных, RTO растёт пропорционально объёму данных, а RPO возникают всё реже и реже. А значит, самые свежие, самые ценные данные становятся наиболее уязвимыми, и их объём при этом возрастает.<br />
<br />
Второй подход – это «data is&nbsp;always there», то есть защита данных непосредственно в системе хранения, в момент их попадания туда. А это означает real time RPO и стремящееся к нулю RTO. Этот подход усиленно продвигается грандами систем хранения данных (в частности, компанией EMC). Самый популярный способ обеспечения защиты по предложенной концепции – RAID (redundant array of&nbsp;independent disk; кстати, ранее вместо слова «independent» фигурировало «inexpensive», что для современных fibre channel дисков вряд ли применимо). Принцип действия заключается в объединении нескольких дисков в группу и хранении в ней данных и избыточной информации. Думаю, нет особого смысла рассказывать про уровни RAID, поскольку нас сейчас интересует самый популярный уровень – 5. <br />
<br />
В RAID5 группе данные сохраняются «размазанными» по всем дискам, также «размазанными» сохраняются и коды коррекции – информация, требующаяся для восстановления данных. Её избыточность для RAID5 составляет менее 25% от общего объёма группы (и падает с увеличением количества дисков в группе). RAID5 построен таким образом, что группа выдерживает отказ одного диска единовременно.<br />
<br />
Казалось бы, при такой технологии хранения, данные действительно always there. Давайте посмотрим насколько «always». Тонкий момент здесь заключается в том, что группа выдерживает отказ только одного диска в один момент времени. Даже если вы моментально заменяете этот диск, группе требуется определённое время для того, чтобы восстановить на этот диск данные и коды коррекции (rebuild). Данные, естественно, при этом доступны, но если во время проведения процедуры rebuild произойдёт отказ ещё одного диска, то группа будет разрушена. Чем больше дисков в группе и чем больше объём каждого диска, тем более частым будет отказ одного из них, и тем больше времени требуется на rebuild. Вплоть до того, что RAID5 группа из большого количества недорогих объёмных дисков может полностью разрушаться несколько (3-4 раза) раз за год!<br />
<br />
Решение этой проблемы во введении двойной коррекции, RAID6 или RAID5&nbsp;DP. Такая группа выдерживает отказ уже двух дисков в один момент времени (как мы выяснили выше, «момент» для больших групп довольно продолжительное время процедуры rebuild). Отказ двух дисков подряд событие не частое. Теоретически, для групп менее 20 ТБ уровень RAID6 обеспечивает на 2 порядка лучшую защиту данных (время до потери данных) для дисков со средними параметрами, чем RAID5.<br />
<br />
Практика заставляет усомниться в теории вероятности: выход из строя второго диска в момент rebuild <b>весьма</b> вероятен. Особенно это касается систем, находящихся под серьёзной рабочей нагрузкой. Влияют на это два фактора. Во-первых, процедура rebuild на продуктивной системе серьёзно нагружает диски, количество операций чтения/записи значительно увеличивается на уже сильно нагруженной системе. Во-вторых, при современном уровне микроэлектроники, диски выходят с конвейера похожими друг на друга как клоны; соответственно, и такой важный параметр, как время наработки на отказ (MTBF), у них практически одинаков. Таким образом, один из дисков, достигший предельного времени работы, приводит к повышенной нагрузке на всю группу, более быстрому, чем в обычных условиях, исчерпанию ресурса остальных дисков и, как следствие, повышенной вероятности отказа ещё одного диска. Этакое веерное отключение.<br />
<br />
Производители систем хранения борются с этим как могут. Например, IBM при заказе системы хранения поставляет диски различных производителей и различных партий, для того чтобы внести неоднородность в MTBF дисков и уменьшить вероятность одновременного отказа двух дисков в группе. Однако, концепцию data is&nbsp;always there это не спасает. И наряду с защитой данных in-place продолжает использоваться и резервное копирование. Что, кстати, также не обеспечивает 100% защиты данных от аппаратного сбоя&hellip;<br />
<br />
Держите это в уме: ваш бизнес уязвим, как и ваши данные. Абсолютная защита данных невозможна, но используя комбинированный подход к защите данных, надёжные устройств и полным резервированием систем хранения вероятность потери корпоративных данных можно минимизировать.<br /><br /><a href="http://defann.cyberflash.ru/keywords/ilm">ILM</a><br /><a href="http://defann.cyberflash.ru/keywords/storage">storage</a>]]></description>
<pubDate>Sat, 24 Feb 2007 12:53:42 +0500</pubDate>
<author>Алексей &lt;defann+place@gmail.com&gt;</author>
</item>
<item>
<title><![CDATA[Ваши данные "задыхаются"]]></title>
<guid isPermaLink="true">http://defann.cyberflash.ru/2006/12/26/1</guid>
<link>http://defann.cyberflash.ru/2006/12/26/1</link>
<comments>http://defann.cyberflash.ru/2006/12/26/1/comments</comments>
<description><![CDATA[(источник <img class="e2_extlink" src="http://defann.cyberflash.ru/images/extlink.gif" alt="" /><a href="http://www.connect.ru/article.asp?id=7367">Connect!</a>)<br />
<br />
<b><i>Как обеспечить эффективное хранение растущего объема корпоративных данных</i></b><br />
<br />
<i>Алексей Назарбаев<br />
системный архитектор TopS BI</i><br />
<br />
Современный центр обработки данных (ЦОД) состоит из тысяч взаимодействующих компонентов – серверов, элементов систем хранения (дисков, контроллеров, ленточных накопителей и т. д.), сетевых элементов (маршрутизаторов, хост-контроллеров, адаптеров) и пр. Для управления сложной инфраструктурой data-центра применяются специальные инструменты, и чем больше в нем разнородных компонентов, тем больше таких инструментов приходится использовать. <br />
<br />
По оценкам компании IDC, увеличение объемов хранимых и обрабатываемых данных составляет более 70% в год. Как действовать в такой ситуации? Наращивать и усложнять инфраструктуру data-центра, вводя дополнительные инструменты управления? Однако в условиях лавинообразно нарастающего объема корпоративных данных это приведет к повышению расходов на системы хранения и обслуживание ИТ-инфраструктуры, к увеличению времени резервирования и восстановления информации, усложнению процессов управления инфраструктурой и размещения данных.<br />
<br />
Альтернативный подход основан на простой идее: <i>не все данные имеют одинаковую ценность для бизнеса</i>. Кроме того, ценность информации изменяется с течением времени (см. рисунок).<br />
<br />
<img src="http://defann.cyberflash.ru/files/ilm_value.JPG/normal" alt="http://defann.cyberflash.ru/files/ilm_value.JPG/normal" /><br />
<b><small>Рисунок. Изменение ценности информации с течением времени</small></b><br />
<br />
Размещением данных в хранилище можно управлять, выбирая параметры хранения, адекватные ценности информации. Решение этой задачи – цель концепции управления жизненным циклом информации – ILM (Information Lifecycle Management). ILM-ориентированный data-центр автоматически размещает данные, исходя из требований бизнеса к защищенности и доступности информации, с учетом ее ценности и актуальности, а также минимизации расходов на хранение.<br />
<br />
<b>Как управлять информацией</b><br />
<br />
Прежде всего, необходимо осознать, что <i>главное в data-центре – информация</i>. <br />
<br />
Второй важный момент: <i>данные &amp;#8800; информация</i>. Информация имеет определенный смысл и бизнес-ценность. Данные – это набор байтов, сами по себе они не несут никакой семантической нагрузки. Акцент должен быть смещен<br />
 с управления данными на управление информацией. Это даст возможность учитывать роль тех или иных категорий информации в бизнесе компании и обеспечивать соответствующий уровень сервиса хранения.<br />
<br />
Для этого в концепции ILM предлагается использовать дополнительные процессы и сущности:<ul><li><i>процесс классификации информации</i>, который призван снабдить данные адекватной семантикой перед их размещением в системе хранения;</li><li><i>процесс размещения информации</i> в системе хранения в соответствии с ее ценностью, направленный на минимизацию стоимости хранения;</li><li><i>целевой показатель уровня сервиса</i> (Service Level Objective, SLO), определяющий уровень ключевых характеристик (надежности, доступности и др.), который должен обеспечиваться инфраструктурой хранения. SLO связывают с категориями (классами) информации в соответствии с их ценностью;</li><li><i>политики (policies)</i> – набор правил, задающих необходимые действия по размещению информации в течение ее жизненного цикла.</li></ul>Как это должно работать?<br />
<br />
Поступающая информация классифицируется, с классами информации связываются определенные SLO, на основании которых интегрированный в инфраструктуру хранения механизм управления размещает информацию согласно заданным политикам. Таким образом, информация, которая должна быть легко доступна, попадет в высокопроизводительные системы хранения, а та, что не является критически важной для бизнеса, разместится в недорогих хранилищах. При этом инструменты управления постоянно отслеживают ценность и статус информации и перемещают ее в адекватные системы хранения согласно политикам и SLO. На определенном этапе жизненного цикла информация может стать ссылочной, устареть или повторно использоваться. В первом случае механизм управления передаст ее в архив, во втором – просто удалит, а в третьем – заново классифицирует и свяжет с другим SLO.<br />
<br />
<b>Пусть данные «вздохнут свободнее»</b><br />
<br />
Полная реализация концепции ILM в data-центре – длительный, сложный и в чем-то даже болезненный процесс. Поэтому начинать следует с частных решений, которые максимально быстро дадут ощутить выгоду от применяемого похода. Кроме того, успешные частные решения позволят легче реализовать переход на ILM-стратегию в будущем.<br />
<br />
Внедрение подходов ILM стоит начинать с формирования <i>ярусной инфраструктуры хранения</i> (tiered storage infrastructure), которая строится из систем хранения нескольких типов, существенно различающихся, по крайней мере, по одному из следующих критериев: стоимость, производительность, емкость и функциональность. Разные категории данных, с разными требованиями к характеристикам хранения, связывают с разными, наиболее адекватными для каждой категории, хранилищами. Таким образом, минимизируется стоимость хранения информации при обеспечении требуемого уровня сервиса.<br />
<br />
Создание ярусной инфраструктуры не предполагает большого количества уровней систем хранения. Иногда достаточно трех уровней: высокопроизводительной системы хранения, недорогой емкой системы и системы для резервирования данных.<br />
<br />
С созданием ярусной инфраструктуры связана потребность в средствах управления структурированной информацией. Это программные продукты, осуществляющие миграцию данных по уровням хранения. Например, продукт EMC DiskXtender способен автоматически переносить часть файловой системы на другую систему хранения, осуществляя ее связь с «родительской» файловой системой. Приложение, работающее с этими данными, продолжает функционировать в обычном режиме. <br />
<br />
Другой продукт – HP&nbsp;RIM for Databases (а также семейство продуктов EMC DatabaseXtender) осуществляет аналогичные действия с таблицами баз данных, что позволяет минимизировать стоимость хранения, снизить нагрузку на СУБД, сократить время резервирования/восстановления, улучшив при этом показатели непрерывности бизнеса.<br />
<br />
Существуют также средства для управления неструктурированной информацией, такой, например, как электронная почта. Продукт EMC EmailXtender обеспечивает адекватное размещение в системах хранения почтовых сообщений Microsoft Exchange и Lotus Notes/Domino. <br />
<br />
Аналогичные задачи решаются и при управлении ссылочной информацией. Ссылочная информация – это документы, электронные сообщения и пр., используемые для подготовки других документов, отчетов либо в качестве справочных данных. Главное отличие такой информации – статичность: ссылочная информация не изменяется. Кроме того, множество нормативных актов, как государственных, так и внутрикорпоративных, могут регламентировать сроки хранения подобной информации (например, для документов финансовой отчетности или данных биллинга).<br />
<br />
Идеальным решением для управления ссылочной информации является электронный архив, выполненный в виде программно-аппаратного комплекса (Content Addressed Storage, CAS) и интегрированный с необходимыми бизнес-приложениями. Одно из таких решений – продукт EMC Centera. CAS-системы позволяют находить документы по содержимому, индексируя их при размещении в хранилище. Можно организовать архив документов, удовлетворяющий нормативные требования по срокам хранения, обеспечивающий защиту информации, устраняющий дублирование документов и соответствующий концепции ILM. Архивация неактивной информации может существенно сократить время резервирования/восстановления данных.<br />
<br />
Начав с частных решений, можно подготовить почву для дальнейшего развития ILM в организации и превращения data-центра в информационно-центричный, обеспечив при этом снижение стоимости хранения данных, строгое соблюдение нормативных актов, исключение дублирования информации, достижение необходимых характеристик сервиса хранения.<br /><br /><a href="http://defann.cyberflash.ru/keywords/ilm">ILM</a><br /><a href="http://defann.cyberflash.ru/keywords/publikatsii">публикации</a>]]></description>
<pubDate>Tue, 26 Dec 2006 17:19:49 +0500</pubDate>
<author>Алексей &lt;defann+place@gmail.com&gt;</author>
</item>
<item>
<title><![CDATA[Погружение в ILM]]></title>
<guid isPermaLink="true">http://defann.cyberflash.ru/2006/10/12/2</guid>
<link>http://defann.cyberflash.ru/2006/10/12/2</link>
<comments>http://defann.cyberflash.ru/2006/10/12/2/comments</comments>
<description><![CDATA[(источник <img class="e2_extlink" src="http://defann.cyberflash.ru/images/extlink.gif" alt="" /><a href="http://iemag.ru/?ID=616906">Intelligent Enterprise</a>)<br />
<br />
<i>Алексей Назарбаев</i><br />
<i>ведущий технический эксперт ТopS BI</i><br />
<br />
В статье «От данных&nbsp;&mdash; к информации» мы рассмотрели, что представляет собой ILM концептуально. Обдумав проблему стремительного роста данных, вы наверняка согласитесь с положением, выдвигаемым ILM: <i><b>решение проблемы постоянно растущих данных возможно только при смене парадигмы их хранения</b></i>. <br />
<br />
Можно ли реализовать в датацентре управление жизненным циклом информации уже сейчас? К сожалению, только частично. На текущий момент не существует полной реализации концепции ILM, но есть хорошие частные решения – программные продукты, устройства хранения и методологии. Для того чтобы понять, какие инструменты можно начать использовать сегодня, нам нужно рассмотреть общую стратегию и этапы внедрения ILM в датацентре и оценить предполагаемый результат реализации этой стратегии.<br />
<br />
<b>Этапы реализации ILM по версии EMC</b><br />
<br />
Компания EMC – одна из крупнейших на рынке систем хранения данных, и именно она стала флагманом в развитии ILM, предлагая решения для создания информационной инфраструктуры и фокусируясь на ключевых технологиях – консолидации данных, виртуализации систем хранения и вычислений, управлении неструктурированной информацией, организации электронных архивов.<br />
<br />
План реализации стратегии ILM, разработанный EMC, базируется на подходе, предложенном Storage Networking Industry Association (SNIA) в 2004 году. Этот подход подразумевает пять фаз внедрения ILM, причём каждая такая фаза означает шаг к созданию интегрированной ILM-среды:<ol><li>консолидация данных и сети хранения;</li><li>стандартизация данных и сервисов хранения;</li><li>создание «островков» ILM и фокусирование на отдельных корпоративных приложениях;</li><li>введение автоматизации в процесс управления размещением данных;</li><li>объединение «островков» в единую гетерогенную ILM-среду.</li></ol>Однако рекомендации SNIA являются скорее общими. EMC более конкретна и выделяет всего три этапа в создании ILM-инфраструктуры, каждый из которых носит законченный характер и может быть задействован для решения наиболее острых в данный момент проблем организации. Естественно, что этапы эти последовательны, и каждый следующий не может осуществляться без реализации предыдущих.<br />
<br />
Первый этап предполагает построение иерархической архитектуры для инфраструктуры хранения (tiered storage infrastructure). <br />
<br />
<img src="http://defann.cyberflash.ru/files/ilm_stage1.PNG/normal" alt="http://defann.cyberflash.ru/files/ilm_stage1.PNG/normal" /><br />
<br />
Единая многоярусная инфраструктура хранения позволяет разместить приложения и обрабатываемую ими информацию в наиболее подходящем месте (по параметрам доступности, защищённости, надёжности хранения и пр.) в соответствии с её ценностью для бизнеса. Такой подход облегчит управление инфраструктурой и решение оперативных задач (например, создание резервных копий). А организация, реализовав этот этап, получит такие выгоды, как удешевление хранения информации, повышение эффективности управления инфраструктурой и оптимизация автоматизированного размещения данных в системах хранения.<br />
<br />
Следующий этап заключается в применении стратегии ILM к одному из ключевых приложений (это может быть ERP-решение, почтовая система или СУБД). <br />
<br />
<img src="http://defann.cyberflash.ru/files/ilm_stage2.PNG/normal" alt="http://defann.cyberflash.ru/files/ilm_stage2.PNG/normal" /><br />
<br />
В качестве такого ключевого приложения целесообразно выбрать систему с серьёзными требованиями к ресурсам хранения. Это позволит сразу ощутить эффект от реализации ILM-стратегии и возврат сделанных инвестиций. На втором этапе ключевое приложение и его данные классифицируются и связываются с политиками, задающими правила размещения информации в инфраструктуре хранения. <br />
<br />
Классификация данных&nbsp;&mdash; очень важный и сложный процесс. Здесь нужно учитывать как уже имеющиеся типы, так и будущее их появление при планируемом расширении системы. С классификацией непосредственно связано и задание целевых показателей уровня сервиса (SLO), на основе которых впоследствии будет осуществляться автоматическое размещение информации в инфраструктуре хранения датацентра. Детализированная классификация и точные политики позволят сделать управление размещением данных более адекватным.<br />
<br />
Наконец, завершающий этап – интеграция в ILM-инфраструктуру множества приложений. <br />
<br />
<img src="http://defann.cyberflash.ru/files/ilm_stage3.PNG/normal" alt="http://defann.cyberflash.ru/files/ilm_stage3.PNG/normal" /><br />
<br />
На этом этапе проводится классификация всех корпоративных приложений и обрабатываемых данных и связывание их с новыми или существующими политиками. Отныне приложения совместно используют инфраструктуру хранения, а механизм управления автоматически размещает информацию в наиболее подходящих хранилищах. Происходит виртуализация инфраструктуры хранения всей корпоративной информации, и ILM начитает работать в полную силу.<br />
<br />
<b>Какие ILM-технологии актуальны сегодня?</b><br />
<br />
Как уже было сказано выше, полной реализации управления жизненным циклом информации на данный момент не существует. Но некоторые технологии применимы уже сегодня. Они обеспечат вполне осязаемые преимущества и позволят легче реализовать переход на ILM-стратегию в будущем.<br />
<br />
<i><b>Ярусная инфраструктура хранения</b></i> – ключевое звено первого этапа реализации ILM-стратегии по версии EMC – устанавливает иерархию систем хранения на основе требований к качеству сервиса, таких как производительность, непрерывность бизнеса, защита данных, безопасность хранимой информации, соответствие нормативным актам (в том числе по времени хранения), стоимость. Физически инфраструктура представляет собой несколько объединённых в сеть систем хранения, различающихся по стоимости и уровню предоставляемого сервиса. Для каждого типа информации и соответствующего приложения выбирается наиболее адекватное хранилище.<br />
<br />
Поскольку полная реализация ILM в гетерогенной среде приложений (третий этап по версии EMC) трудно осуществима, стоит подробнее остановиться на частных решениях. Ведущие поставщики систем хранения предлагают инструменты для управления хранением <i><b>структурированной</b></i> и <i><b>неструктурированной информацией</b></i>. Разработаны специализированные решения для управления <i><b>ссылочной информацией</b></i>.<br />
<br />
Средства управления <i><b>структурированной информацией</b></i> представляют собой программные продукты, осуществляющие перенос данных в инфраструктуре хранения согласно правилам. В роли структурированной информации может выступать, например, файловая система серверов или таблицы баз данных. В первом случае инструмент управления будет перемещать часть файловой системы в адекватные на данный момент системы хранения в ярусной инфраструктуре (пример такого инструмента&nbsp;&mdash; продукт EMC DiskXtender). Во втором случае будет осуществляться перенос данных из таблиц в другую СУБД или в архив (например, так действует решение HP&nbsp;RIM for Databases). <br />
<br />
Инструменты управления <i><b>неструктурированной информацией</b></i> используются для перемещения данных, не имеющих выраженной структуры (например, почтовых архивов), и также требуют интеграции на уровне приложений. Программные продукты для управления почтовыми архивами уже представлены на рынке. Например, EMC EmailXtender позволяет организовать архивы почтовых сообщений Microsoft Exchange и Lotus Notes/Domino.<br />
<br />
Управление <i><b>ссылочной информацией</b></i> осуществляется с помощью либо программных, либо, что предпочтительно, программно-аппаратных средств – Content Addressed Storage (CAS). Особенность таких систем состоит в том, что они позволяют находить документы по содержимому, индексируя их в момент размещения в хранилище. Предназначены они в первую очередь для архивов неструктурированной информации. Включив CAS-систему в сеть хранения датацентра, вы можете организовать архив документов, удовлетворяющий нормативным требованиям по срокам хранения (эта возможность реализуется непосредственно инструментами CAS), обеспечивающий защиту и безопасность хранимой информации, устраняющий дублирование документов и соответствующий концепции ILM. На сегодняшнем рынке решения CAS представлены несколькими вендорами. Среди них – Hewlett-Packard (продукт HP&nbsp;StorageWorks RISS) и EMC (Centera).<br />
<br />
В целом, реализация концепции управления жизненным циклом информации в инфраструктуре датацентра – сложный и длительный процесс, но начать его и получить выгоду от внедрения можно уже сейчас.<br /><br /><a href="http://defann.cyberflash.ru/keywords/ilm">ILM</a><br /><a href="http://defann.cyberflash.ru/keywords/publikatsii">публикации</a>]]></description>
<pubDate>Thu, 12 Oct 2006 09:14:27 +0500</pubDate>
<author>Алексей &lt;defann+place@gmail.com&gt;</author>
</item>
<item>
<title><![CDATA[От данных -- к информации]]></title>
<guid isPermaLink="true">http://defann.cyberflash.ru/2006/10/12/1</guid>
<link>http://defann.cyberflash.ru/2006/10/12/1</link>
<comments>http://defann.cyberflash.ru/2006/10/12/1/comments</comments>
<description><![CDATA[(источник <img class="e2_extlink" src="http://defann.cyberflash.ru/images/extlink.gif" alt="" /><a href="http://iemag.ru/?ID=616902">Intelligent Enterprise</a>)<br />
<br />
<i>Алексей Назарбаев</i><br />
<i>ведущий технический эксперт TopS BI</i><br />
<br />
В последнее время в специализированной прессе все чаще появляется «загадочная» аббревиатура ILM – Information Lifecycle Management. Ведущие разработчики один за другим предлагают решения для той или иной части ILM, красиво расписывая общую схему хранения данных в реорганизованном соответствующим образом датацентре. Однако ясного понимания, что же такое ILM, у российских заказчиков, на наш взгляд, пока не сложилось. <br />
<br />
Первое, что стоит отметить: ILM – не панацея, не технология, не решение и не руководство к действию. Это концепция, отражающая современный взгляд на корпоративные данные; набор практик управления, нацеленных на достижение оптимального соотношения ценности информации для бизнеса и стоимости инфраструктуры её хранения. <br />
<br />
ILM, согласно SNIA (Storage Networking Industry Association, www.snia.org), это политики, процессы, практики, сервисы и инструменты, используемые для того, чтобы соотнести ценность информации с точки зрения бизнеса с наиболее подходящей и эффективной по стоимости инфраструктурой, начиная с момента создания информации и заканчивая ее размещением. Информация сопоставляется с бизнес-требованиями через политики управления и уровни предоставления сервиса, связанные с приложениями, данными и метаданными.<br />
<br />
Говоря проще, это концепция автоматического размещения данных в инфраструктуре датацентра на основании требований бизнеса к параметрам защищенности, доступности информации и с учетом ее ценности для бизнеса, актуальности и минимизации расходов на хранение. Какие же проблемы хранения помогает решить ILM? <br />
<br />
<b>Не захлебнуться в океане данных</b><br />
<br />
Ни для кого не секрет, что объем корпоративной информации с каждым годом увеличивается, и очень серьезно. В соответствии с отчетами IDC рост объемов хранимых и обрабатываемых данных составляет более 70% в год. В среднестатистической современной компании три тысячи сотрудников ежедневно передают по электронной почте терабайт данных. Всего в мире, по подсчётам Gartner, в 2005 году отправлялось 36 миллиардов электронных сообщений в день&nbsp;&mdash; в три раза больше, чем в 2001-м. В некоторых специфичных отраслях, например в медицине, наблюдается экспоненциальный рост информационных объёмов.<br />
<br />
Ситуация осложняется требованиями нормативных актов и внутрикорпоративныхстандартов, предписывающих длительное хранение некоторых видов информации&nbsp;&mdash; иногда в течение 5--10 лет. А это значит, что компания, имеющая корпоративные данные скромного объема в 1 Тбайт и показывающая рост этих объёмов 60% в год (не самый большой по современным меркам), через 10 лет будет хранить уже 110 Тбайт информации. Увеличение более чем в 100 раз!<br />
<br />
Проблема взрывного роста объемов данных тесно связана с другой проблемой: постоянно усложняются процессы управления распределенной инфраструктурой датацентров. Современный центр обработки данных состоит из тысяч взаимодействующих компонентов – серверов, элементов систем хранения (логических единиц, дисков, контроллеров, управляющих серверов, ленточных накопителей и т. д.), элементов сетей хранения и локальных сетей (маршрутизаторов, хост-контроллеров, адаптеров и пр.). Для управления сложной инфраструктурой применяются специальные инструменты, причём для каждого вида инфраструктурных элементов&nbsp;&mdash; свои. И чем больше в датацентре разнородных компонентов, тем больше инструментов управления вы вынуждены использовать. Что ещё больше увеличивает сложность системы.<br />
<br />
Кроме того, использование специализированных инструментов управления инфраструктурой не решает основной задачи – управлять лавинообразно растущим потоком данных. Компании продолжают хранить информацию в дорогих высокопроизводительных системах и, несмотря на снижение стоимости оборудования, с каждым годом расходуют всё больше средств на её хранение. Процесс резервного копирования становится всё сложнее и требует больше и больше времени. При этом существующие инструменты управления не автоматизируют в достаточной степени процессы размещения информации – администраторы фактически вручную выделяют место для ее хранения, задают привязку к необходимым серверам, создают расписание резервного копирования, определяют источники и места назначения.<br />
<br />
Сложившуюся ситуацию в области хранения данных можно охарактеризовать следующим образом: <i><b>объем данных катастрофически растет, а имеющиеся инструменты управления не в силах с этим справиться</b></i>.<br />
<br />
<b>Нужны ли бизнесу все сохраняемые в системах данные?</b><br />
<br />
Возвращаясь к примеру компании, за 10 лет увеличившей объём корпоративной информации в 100 раз, зададимся вопросом: так ли необходимы её бизнесу эти 110 Тбайт данных, размещенных в оперативных хранилищах?<br />
<br />
Очевидно, что нет. С течением времени меняется как ценность данных, так и требования к их доступности и защищенности. Так, ценность финансовой транзакции максимальна в течение первого месяца и впоследствии неуклонно снижается. Кроме того, финансовая запись в ERP-системе компании и, скажем, личное письмо сотрудника имеют разную ценность для бизнеса уже в момент создания. <br />
<br />
Между тем в оперативных высокопроизводительных хранилищах датацентра располагаются все данные, включая устаревшие и ненужные, в то время как храниться там должны только те, к которым предъявляются высокие требования доступности. <br />
<br />
Анализ, проведенный Enterprise Storage Group, показывает, каким образом ценность информации для бизнеса изменяется с течением времени в зависимости от ее типа. <br />
<br />
<img src="http://defann.cyberflash.ru/files/ilm_value.JPG/normal" alt="http://defann.cyberflash.ru/files/ilm_value.JPG/normal" /><br />
<br />
Мы можем сделать важный вывод: <i><b>разные классы информации имеют разную ценность для бизнеса, и эта ценность меняется с течением времени</b></i>.<br />
<br />
Следующее важное свойство корпоративных данных – их состояние. Создаваемые данные сохраняются в датацентре для последующей обработки и затем в зависимости от решаемых бизнесом задач изменяются. Пока данные изменяются, они находятся в активном состоянии и называются оперативными. Но с течением времени наступает момент, когда данные «закрепляются» и более изменениям не подвергаются. Они могут использоваться для генерации новых документов, сводных отчетов и т. п. Такие данные называют ссылочными. Естественный способ хранения ссылочных данных – архив.<br />
<br />
В современных датацентрах обычно оперативные и ссылочные данные размещаются вместе, в одних и тех же хранилищах, что не только увеличивает стоимость хранения, но и создает трудности с соблюдением нормативных актов, регламентирующих хранение определенных видов информации.<br />
<br />
Наконец, есть еще одно состояние – устаревшие данные, которые нигде более не используются, а срок их хранения, регламентируемый нормативными актами, истек. Такие данные больше не нужны бизнесу, их ценность нулевая, и они могут быть удалены. В настоящее время устаревшие данные отслеживаются практически вручную, их удаление из системы представляет собой кошмар для администратора, а хранение – пустую трату денег.<br />
<br />
<b>Вперед и вверх!</b><br />
<br />
Описывая текущую ситуацию с хранением данных, мы намеренно не акцентировали внимания на различии между данными и информацией. Точно так же эти различия не учитываются в сложившейся сегодня практике организации процессов и инфраструктуры хранения. Однако именно этот аспект – один из важнейших в концепции ILM: <b>данные &#8800; информация</b><br />
<br />
Данные – это просто набор байтов, способ отражения бизнес-информации в инфраструктуре хранения. С такой точки зрения все они представляют одинаковую ценность, поскольку их семантика не определена, а значение здесь имеют такие параметры, как надежность хранения, защищенность и доступность. Именно этими характеристиками оперируют современные системы хранения данных и инструменты управления инфраструктурой.<br />
<br />
Информация – это данные, представляющие определенный смысл для бизнеса. Аналогичные по структуре данные, одинаково размещенные в системе хранения, могут иметь совершенно разный смысл и, следовательно, разную ценность для компании. Например, личное письмо сотрудника, посланное по электронной почте, и письмо того же сотрудника, содержащее конфиденциальные сведения о клиенте.<br />
<br />
ILM предлагает уйти от управления данными и сфокусироваться на управлении информацией. Для этого необходимо в первую очередь изменить подход к ее хранению. В рамках ILM предлагается классифицировать бизнес-информацию компании, прежде чем она попадет в инфраструктуру хранения. Классификация – это необходимый для эффективного управления жизненным циклом информации процесс, обеспечивающий хранимые данные адекватной семантикой. <br />
<br />
Для этого процесса вводятся понятия целевых показателей уровня сервиса (Service Level Objectives&nbsp;&mdash; SLO) и «политик» (Policies), на основе которых будет осуществляться управление хранением информации. SLO определяет, какие показатели ключевых характеристик (надежности, доступности и др.) должны обеспечиваться инфраструктурой хранения для данного класса информации. «Политики» определяют необходимые действия с конкретными классами информации при возникновении определенных условий (например, при окончании срока жизни информации). Основой для формирования SLO и политик являются бизнес-требования и бизнес-процессы компании, а также различные нормативные акты.<br />
<br />
Таким образом, подход к хранению данных в датацентре становится информационно-центричным. <br />
<br />
<img src="http://defann.cyberflash.ru/files/ilm_proc_centric.PNG/normal" alt="http://defann.cyberflash.ru/files/ilm_proc_centric.PNG/normal" /><br />
<br />
Создаваемая информация классифицируется, с ней связываются определенные SLO, на основании которых интегрированный в инфраструктуру механизм управления размещает эту информацию согласно заданным политикам. Это значит, что информация, требующая высокой доступности, попадет в высокопроизводительные системы хранения, а та, что не является критически важной для бизнеса, разместится в недорогих хранилищах. <br />
<br />
При этом механизмы работы приложений с данными не меняются, но инструменты управления постоянно отслеживают ценность информации, ее состояние и перемещают ее в адекватные системы хранения согласно политикам и SLO. На определенном этапе жизненного цикла информация может стать ссылочной, устареть или повторно использоваться. Тогда механизм управления в первом случае передаст ее в архив, во втором – просто удалит, а в третьем – заново классифицирует и свяжет с другим SLO.<br />
<br />
Таким образом, датацентр, построенный согласно ILM, обеспечивает следующие основные преимущества: <ul><li>снижение стоимости хранения информации (за счет своевременного переноса данных в недорогие системы хранения и уничтожения устаревшей информации);</li><li>строгое соблюдение нормативных актов, регламентирующих хранение данных, путем автоматического применения политик;</li><li>достижение соответствия характеристик хранения (надежности, защищенности, доступности и др.) различным классам информации;</li><li>исключение дублирования информации (за счет управления ссылочными данными).</li></ul>И при этом информация всегда предоставляется в нужном месте, в нужное время и по оптимальной цене.<br /><br /><a href="http://defann.cyberflash.ru/keywords/ilm">ILM</a><br /><a href="http://defann.cyberflash.ru/keywords/publikatsii">публикации</a>]]></description>
<pubDate>Thu, 12 Oct 2006 09:00:11 +0500</pubDate>
<author>Алексей &lt;defann+place@gmail.com&gt;</author>
</item>
<item>
<title><![CDATA[EMC верит в ILM]]></title>
<guid isPermaLink="true">http://defann.cyberflash.ru/2005/11/03/4</guid>
<link>http://defann.cyberflash.ru/2005/11/03/4</link>
<comments>http://defann.cyberflash.ru/2005/11/03/4/comments</comments>
<description><![CDATA[EMC это компания которая больше 20 лет производит корпоративные системы хранения данных под маркой Symmetrix. Где-то в 2000 году положение EMC было не слишком хорошим, её начали теснить с рынка гранды вроде Hitachi, IBM, Sun и HP. EMC обратила внимание на средние и малые предприятия, купив Data General и начав продвижение линеек Clariion, Celerra. Но такая диверсификация не спасала от выдавливания с рынка.<br />
<br />
Что сделала EMC? EMC сменила свою стратегию, мимоходом купила VMWare, Documentum, Legato и скроила себе новый боевой флаг: ILM&nbsp;&mdash; information lifecycle management. Суть ILM состоит в том, чтобы виртуализовать систему хранения данных и хранить информацию адекватно её стоимости. Это означает вот что: сначала адекватные текущие данные хранятся на высокопроизводительных дорогих системах, по мере устаревания или какого либо иного процесса, снижающего ценность данных, они перемещаются на более дешёвые (и медленные) системы хранения, неизменные же данные перемещаются в архив. При достижении определённых критериев (например, истечение срока хранения данных) данные уничтожаются. Автоматически. Для приложений всё прозрачно.<br />
<br />
Думал ли кто-то до EMC об этом? Нет. Необходим ли реально компаниям ILM сейчас? Вряд ли. EMC <i>придумала</i> изменение, <i>внушило</i> что оно необходимо. В сознании менеджеров чётко отпечаталась абреввиатура ILM. Кто будет впереди всех, когда в сознании большинства слова &laquo;необходимо&raquo; и &laquo;ILM&raquo; свяжутся в устойчивое словосочетание? Ответ очевиден. EMC&nbsp;&mdash; change generator.<br />
<br /><br /><a href="http://defann.cyberflash.ru/keywords/tekhnologii">технологии</a><br /><a href="http://defann.cyberflash.ru/keywords/biznes">бизнес</a><br /><a href="http://defann.cyberflash.ru/keywords/ilm">ILM</a><br /><a href="http://defann.cyberflash.ru/keywords/filosofiya">философия</a>]]></description>
<pubDate>Thu, 03 Nov 2005 07:00:17 +0500</pubDate>
<author>Алексей &lt;defann+place@gmail.com&gt;</author>
</item>
</channel></rss>