Курсовая работа

«Технология OLAP»

  • 29 страниц
Содержание

Основные данные о работе 3

Содержание 4

Введение 5

Основная часть 8

1 Понятие и история OLAP 8

2 Концепция и виды OLAP 15

Заключение 27

Глоссарий 30

Список использованных источников 31

Приложения 33

Введение

В своей курсовой работе я попытаюсь отразить все аспекты оперативной аналитической обработки данных, её историю и перспективы развития и применения, а также показать области, в которых данные технологии могут быть с успехом внедрены, и результат их внедрения будет наилучшим.

Термин OLAP (On-Line Analytical Processing) служит для описания модели представления данных и соответственно технологии их обработки в хранилищах данных. В OLAP применяется многомерное представление агрегированных данных для обеспечения быстрого доступа к стратегически важной информации в целях углубленного анализа. Приложения OLAP должны обладать следующими основными свойствами:

– многомерное представление данных;

– поддержка сложных расчетов;

– правильный учет фактора времени.

Технология OLAP обеспечивает быстрый доступ к информации и ее представление в достаточно сложном виде без необходимости создания дополнительных программ. Программные средства OLAP для конечного пользователя могут представлять собой электронные таблицы, пакеты статистического анализа, графические интерфейсы или системы поддержки принятия решений, включающие в себя целый набор аналитических инструментов. Среди аналитических инструментов, использующих многомерные базы данных, особенно популярны такие программные продукты, как Express фирмы Information Resources и Accumate Enterprise компании Kenan Systems. Одной из самых развитых и мощных технологий анализа сложных баз данных в среде "клиент/сервер" является Oracle Express OLAP . Этот продукт имеет функционально полную архитектуру, специально предназначенную для поддержки принятия решений в масштабе предприятия. Oracle Express OLAP использует многомерную реляционную модель данных со словарем данных и содержит все необходимые компоненты для решения сложных задач [5].

OLAP-приложения должны обеспечивать быстрый анализ разделяемой многомерной информации (Fast Analysis of Shared Multidimensional Information):

– быстрый, т.е. OLAP-приложения должны доставлять пользователю информацию с относительно постоянной скоростью, а выполнение большинства запросов должно занимать не более пяти секунд;

– анализ, т.е. OLAP-приложения должны быть в состоянии выполнять базовые операции численного и статистического анализа данных - как заранее определенные разработчиком приложения, так и специально заданные пользователем;

– разделяемой, т.е. OLAP-приложения должны реализовать требования безопасности, необходимые для совместного доступа большого числа пользователей к потенциально конфиденциальным данным;

– многомерной, многомерность - это важнейшая характеристика OLAP;

– информации, т.е. OLAP-приложения должны быть в состоянии получать доступ ко всем связанным с приложением данным и информации независимо от места их хранения и без ограничений по объему.

Актуальность данной темы обуславливается самой её сущностью. Ведь технологии OLAP можно и нужно использовать для создания комплекса поддержки принятия решений для менеджеров, кадровиков и руководства, а они в нём сейчас нуждаются как никогда, ведь количество параметров, опций и факторов, исходя из которых, требуется принять решение, растёт с каждой минутой и на среднем предприятии исчисляется уже десятками тысяч. Человеку анализ такого количества информации в сжатые сроки просто не по силам. И тут на помощь ему приходят OLAP технологии.

При написании данной курсовой работы использовалась различная литература. В большинстве своём это были статьи с сайта w*w.OLAP.r* и журнала СУБД, а также книга E. F. Codd “Providing OLAP” в электронной версии.

Основными методами, используемыми в данной работе, являлись исследование материала по заданной теме, его позитивный и критический анализ. В ходе работы над материалом я сформировал собственное мнение о технологиях оперативной аналитической обработки данных и их месте в современном мире, и попытаюсь изложить его на страницах данной курсовой работы.

Фрагмент работы

В основе концепции OLAP лежит принцип многомерного представления данных. В 1993 году E. F. Codd рассмотрел недостатки реляционной модели, в первую очередь указав на невозможность "объединять, просматривать и анализировать данные с точки зрения множественности измерений, то есть самым понятным для корпоративных аналитиков способом" , и определил общие требования к системам OLAP, расширяющим функциональность реляционных СУБД и включающим многомерный анализ как одну из своих характеристик.

В большинстве публикаций, аббревиатурой OLAP обозначается не только многомерный взгляд на данные, но и хранение самих данных в многомерной БД [2]. Вообще-то, это не совсем верно, поскольку Кодд отмечает, что "Реляционные БД были, есть и будут наиболее подходящей технологией для хранения корпоративных данных. Необходимость существует не в новой технологии БД, а, в средствах анализа, дополняющих функции СУБД и достаточно гибких, чтобы предусмотреть и автоматизировать различные виды интеллектуального анализа, присущие OLAP" . Такая путаница приводит к противопоставлениям наподобие "OLAP или ROLAP", что не совсем верно, поскольку ROLAP (реляционный OLAP) на концептуальном уровне поддерживает всю определенную термином OLAP функциональность. Более предпочтительным кажется использование для OLAP на основе многомерных СУБД специального термина MOLAP.

По Кодду, многомерное концептуальное представление (multi-dimensional conceptual view) представляет собой множественную перспективу, состоящую из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям определяется как многомерный анализ. Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. Так, измерение Исполнитель может определяться направлением консолидации, состоящим из уровней обобщения "предприятие - подразделение - отдел - служащий". Измерение Время может даже включать два направления консолидации - "год - квартал - месяц - день" и "неделя - день", поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим; напротив, операция подъема (rolling up) означает движение от низших уровней к высшим (рис. 1).

Кодд определил 12 правил, которым должен удовлетворять программный продукт класса OLAP [4].

1. Концептуальное многомерное представление. Пользователь-аналитик видит мир предприятия многомерным по своей природе. Соответственно и OLAP-модель должна быть многомерной в своей основе. Многомерная концептуальная схема или пользовательское представление облегчают моделирование и анализ так же, впрочем, как и вычисления.

2. Прозрачность. Вне зависимости от того, является OLAP-продукт частью средств пользователя или нет, этот факт должен быть прозрачен для пользователя. Если OLAP предоставляется клиент-серверными вычислениями, то этот факт также, по возможности, должен быть незаметен для пользователя. OLAP должен предоставляться в контексте истинно открытой архитектуры, позволяя пользователю, где бы он ни находился, связываться при помощи аналитического инструмента с сервером. В дополнение прозрачность должна достигаться и при взаимодействии аналитического инструмента с гомогенной и гетерогенной средами БД.

3. Доступность. Пользователь-аналитик OLAP должен иметь возможность выполнять анализ, базирующийся на общей концептуальной схеме, содержащей данные всего предприятия в реляционной БД, также как и данные из старых наследуемых БД, на общих методах доступа и на общей аналитической модели. Это значит, что OLAP должен предоставлять свою собственную логическую схему для доступа в гетерогенной среде БД и выполнять соответствующие преобразования для предоставления данных пользователю. Более того, необходимо заранее позаботиться о том, где и как, и какие типы физической организации данных действительно будут использоваться. OLAP-система должна выполнять доступ только к действительно требующимся данным, а не применять общий принцип “кухонной воронки”, который влечет ненужный ввод.

Заключение

Ситуацию с корпоративной информацией, складывающуюся в настоящее время на большинстве предприятий, можно сравнить с сокровищем, которое лежит под ногами, но которое никто не может извлечь. По данным Gartner Group, большая часть корпоративной информации – 90 % - лежит невостребованной и никак не анализируется. Между тем многие из проблем, которые возникают в текущей деятельности предприятия и которые требуют оперативного решения, не являются для него абсолютно новыми. Как правило, предприятие уже когда-то сталкивалось с похожей ситуацией, и в этой связи были приняты определенные управленческие решения, которые привели к соответствующим результатам. Этот опыт (позитивный или негативный) может оказаться очень ценным при решении проблем, стоящих перед предприятием в настоящий момент.

Оперативная аналитическая обработка позволяет значительно упростить и ускорить процесс подготовки и принятия решений руководящим персоналом. Оперативная аналитическая обработка служит цели превращения данных в информацию. Она принципиально отличается от традиционного процесса поддержки принятия решений, основанного, чаще всего, на рассмотрении структурированных отчетов. По аналогии, разница между структурированными отчетами и OLAP такая, как между ездой по городу на трамвае и на личном автомобиле. Когда вы едете на трамвае, он двигается по рельсам, что не позволяет хорошо рассмотреть отдаленные здания и тем более приблизиться к ним. Наоборот, езда на личном автомобиле дает полную свободу. Можно подъехать к любому зданию и добраться до тех мест, где трамваи не ходят.

Структурированные отчеты - это те рельсы, которые сдерживают свободу в подготовке решений. OLAP - автомобиль для эффективного движения по информационным магистралям.

Преимущества OLAP:

– повышение производительности производственного персонала, разработчиков прикладных программ. Своевременный доступ к стратегической информации.

– предоставление пользователям достаточных возможностей для внесения собственных изменений в схему.

– приложения OLAP опираются на хранилища данных и системы OLTP, получая от них актуальные данные, что дает сохранение контроля целостности корпоративных данных.

– уменьшение нагрузки на системы OLTP и хранилища данных.

Ральф Кимбалл (Ralph Kimball), один из авторов концепции хранилищ данных OLAP, описывал хранилище данных как "место, где люди могут получить доступ к своим данным". Он же сформулировал и основные требования к хранилищам данных [12]:

– поддержка высокой скорости получения данных из хранилища;

– поддержка внутренней непротиворечивости данных;

– возможность получения и сравнения так называемых срезов данных (slice and dice);

– наличие удобных утилит просмотра данных в хранилище;

– полнота и достоверность хранимых данных;

– поддержка качественного процесса пополнения данных.

Удовлетворять всем перечисленным требованиям в рамках одного и того же продукта зачастую не удается. Поэтому для реализации хранилищ данных обычно используется несколько продуктов, одни их которых представляют собой собственно средства хранения данных, другие - средства их извлечения и просмотра, третьи - средства их пополнения и т.д.

Типичное хранилище данных, как правило, отличается от обычной реляционной базы данных. Во-первых, обычные базы данных предназначены для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища данных предназначены для принятия решений. Например, продажа товара и выписка счета производятся с использованием базы данных, предназначенной для обработки транзакций, а анализ динамики продаж за несколько лет, позволяющий спланировать работу с поставщиками, - с помощью хранилища данных.

Во-вторых, обычные базы данных подвержены постоянным изменениям в процессе работы пользователей, а хранилище данных относительно стабильно: данные в нем обычно обновляются согласно расписанию (например, еженедельно, ежедневно или ежечасно - в зависимости от потребностей). В идеале процесс пополнения представляет собой просто добавление новых данных за определенный период времени без изменения прежней информации, уже находящейся в хранилище.

В-третьих, обычные базы данных чаще всего являются источником данных, попадающих в хранилище. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов.

Вывод: конечной целью использования OLAP является анализ данных и представление результатов этого анализа в виде, удобном для восприятия и принятия решений. Основная идея OLAP заключается в построении многомерных кубов, которые будут доступны для пользовательских запросов. Однако исходные данные для построения OLAP-кубов обычно хранятся в реляционных базах данных. Нередко это специализированные реляционные базы данных, называемые также хранилищами данных (Data Warehouse). В отличие от так называемых оперативных баз данных, с которыми работают приложения, модифицирующие данные, хранилища данных предназначены исключительно для обработки и анализа информации, поэтому проектируются они таким образом, чтобы время выполнения запросов к ним было минимальным. Обычно данные копируются в хранилище из оперативных баз данных согласно определенному расписанию.

Список литературы

1 Альперович М. Введение в OLAP и многомерные базы данных. – М.: Вильямс. 2005. – 267с.

2 Коровкин С. Д., Левенец И. А., Ратманова И. Д., Старых В. А., Щавелёв Л. В. Решение проблемы комплексного оперативного анализа информации хранилищ данных. // СУБД. – 1997. – № 5-6. – 47-51с.

3 Кречетов Н., Иванов П. Продукты для интеллектуального анализа данных. // ComputerWeek-Москва. – 1997. – № 14-15. – 32-39с.

4 Некрасов В. 30 идей применения OLAP [Электронный ресурс] – Режим доступа – w*w.OLAP.r*

5 Пендс Н. Перевод Шамиля Абушаева. Истоки сегодняшних продуктов OLAP [Электронный ресурс] – Режим доступа – w*w.OLAP.r*

6 Пендс Н. Перевод Шамиля Абушаева. Что следует понимать под термином OLAP? [Электронный ресурс] – Режим доступа – w*w.OLAP.r*

7 Сахаров А. А. Концепция построения и реализации информационных систем, ориентированных на анализ данных // СУБД. – 1996. – № 4. – 55-70с.

8 Сахаров А. А. Принципы проектирования и использования многомерных баз данных (на примере Oracle Express Server) // СУБД. – 1996. – № 3. – 44-59с.

9 Споффорд Дж. Доступ к аналитике: новые интерфейсы для OLAP [Электронный ресурс] – Режим доступа – w*w.OLAP.r*

10 Федоров А., Елманова Н. Основы OLAP // КомпьютерПресс. – 2001. – № 4. – 25-37с.

11 Хамидуллин А. Клад, который лежит под ногами. – М.: Вильямс. 2003. – 379с.

12 Щавелёв Л.В. Оперативная аналитическая обработка данных: концепции и технологии [Электронный ресурс] – Режим доступа – w*w.OLAP.r*

Примечания

Приложение:

Структура корпоративной информационно-аналитической системы

Покупка готовой работы
Тема: «Технология OLAP»
Раздел: Информатика
Тип: Курсовая работа
Страниц: 29
Цена: 2000 руб.
Нужна похожая работа?
Закажите авторскую работу по вашему заданию.
  • Цены ниже рыночных
  • Удобный личный кабинет
  • Необходимый уровень антиплагиата
  • Прямое общение с исполнителем вашей работы
  • Бесплатные доработки и консультации
  • Минимальные сроки выполнения

Мы уже помогли 24535 студентам

Средний балл наших работ

  • 4.89 из 5
Узнайте стоимость
написания вашей работы
Популярные услуги
Дипломная на заказ

Дипломная работа

от 8000 руб.

срок: от 6 дней

Курсовая на заказ

Курсовая работа

от 1500 руб.

срок: от 3 дней

Отчет по практике на заказ

Отчет по практике

от 1500 руб.

срок: от 2 дней

Контрольная работа на заказ

Контрольная работа

от 100 руб.

срок: от 1 дня

Реферат на заказ

Реферат

от 700 руб.

срок: от 1 дня

682 автора

помогают студентам

23 задания

за последние сутки

10 минут

среднее время отклика