Согласно определению Б. Инмона, хранилище данных (Data Warehouse, DW) - предметно ориентированная, интегрированная, неизменчивая во времени, не разрушаемая совокупность данных, предназначенная для поддержки принятия решений.
Если говорить об основных ее составляющих, то необходимо отметить следующее:
-
предметная ориентированность - локальные базы данных содержат мегабайты прямой и косвенной информации, порой абсолютно не нужной для дальнейшего анализа. С учетом этого фактора проектирование хранилища данных осуществляется исключительно с с целью накопления необходимых (или потенциально необходимых) данных;
-
интегрированность (целостность и внутренняя взаимосвязь) - несмотря на то что данные погружаются из различных источников, но они объединены единой макроструктурой, стандартами обмена, способами измерения атрибутов и др. Это имеет большое значение для корпоративных организаций, в которых одновременно могут эксплуатироваться различные по своей архитектуре вычислительные системы, представляющие одинаковые данные по-разному. Например, могут использоваться несколько различных форматов представления дат или один и тот же показатель может называться по-разному, например, "вероятность доведения информации" и "вероятность получения информации". В процессе погружения подобные несоответствия устраняются автоматически;
-
отсутствие временной привязки - DW содержит исторические данные, накопленные за большой интервал времени (пять—семь лет);
-
неразрушаемая совокупность данных - модификация данных не производится, поскольку может привести к нарушению их целостности.
Хранилище данных лишь предоставляет данные в виде, удобном для анализа, и является готовым плацдармом в системе управления знаниями для построения систем извлечения знаний, анализ обычно осуществляется средствами, построенными на базе сопутствующих технологий OLAP и Data Mining.
| < Предыдущая | Следующая > |
|---|













