Курсовая работа
«Хранилища данных»
- 30 страниц
Введение…3
1. Основные подходы к архитектуре Хранилищ данных.…6
1.1 Хранилище данных с архитектурой CIF….….….…6
1.2 Хранилище данных с архитектурой BUS….….…7
1.3 Основные требования к структуре Хранилища данных ….….9
2. Способы оптимизации работы Хранилищ данных ….11
2.1 Управление жизненным циклом информации….….11
2.2 Принципы ILM для Хранилищ данных….…12
2.3 Устройства для Хранилищ данных….…14
3. Основные характеристики современного Хранилища данных….…20
3.1 Расширенный уровень подготовки данных…20
3.2 Сервисно - ориентированное взаимодействие….…22
3.3 Управление метаданными….…23
Заключение….26
Глоссарий…28
Список использованных источников…31
Приложение А ….…33
Приложение Б ….…34
Современные организации вынуждены быстро реагировать на изменения, происходящие на рынке. Ясно, чтобы делать это, необходим быстрый доступ ко всем видам информации прежде, чем можно принять любые логические решения. Чтобы помочь принятию правильного решения для организации, необходимо иметь средства исследования прошлого и на основании этого определить соответствующие тенденции. Далее, чтобы выполнять любой анализ тенденций, необходимо иметь доступ ко всей требуемой информации, и эта информация хранится в основном в очень больших базах данных. Наиболее простой способ получить доступ к этим данным и помочь эффективному процессу принятия решений состоит в том, чтобы установить Хранилище данных (англ. Data Warehouse). С Хранилищами данных связывали и продолжают связывать большие надежды в сфере развития информационной индустрии.
Для развития и процветания бизнеса недостаточно просто владеть информацией, все зависит от качества владения-умения четко и быстро определять категорию показателей, на основании которых требуется принимать решение, проводить анализ определенных значений данных показателей с различной степенью детализации с учетом всех параметров, оказывающих на них влияние. Хранилище данных является хорошим инструментом в решении данной задачи. Тот, у кого есть средства, позволяющие четко представить картину бизнес-данных, их взаимосвязь, историю возникновения, временную глубину, оказывается в выигрыше. Он может отследить тенденции развития, спрогнозировать возможные изменения, и, соответственно, получить конкурентные преимущества.
В большинстве организаций существуют действительно большие базы данных при работе с нормальными ежедневными транзакциями, а некоторые приложения используют транзакционные мониторы. Эти типы баз данных известны как операционные базы данных. Как правило, они были разработаны, не для того чтобы хранить историю данных или отвечать на запросы, а для того чтобы поддерживать все приложения для повседневных транзакций. Поэтому они оптимизированы для этого типа работы, с быстрой реакцией и с большим числом пользователей.
Второй тип баз данных, получивших распространение в организациях - это Хранилище данных. Оно проектируется для стратегической поддержки принятия решений, и, в значительной степени формируется из баз данных, которые являются операционными. Основная характеристика хранилища данных состоит в том, что оно содержит громадное количество данных (миллиарды записей). Меньшие, локальные хранилища данных называются информационными витринами (англ. Datamarts).
1. Основные подходы к архитектуре Хранилищ данных На сегодняшний день существует два основных подхода к архитектуре Хранилищ данных. Это так называемая корпоративная информационная фабрика (англ. Corporate Information Factory - CIF) Билла Инмона и Хранилище данных с архитектурой шины (англ. Data Warehouse Bus - BUS) Ральфа Кимболла (Ralph Kimball). Рассмотрим каждый из них подробнее. 1.1 Хранилище данных с архитектурой CIF На рисунке представлен подход, используемый в Хранилищах данных с архитектурой CIF. Когда-то этот подход был известен под названием корпоративного Хранилища данных (англ. Enterprise Data Warehouse - EDW). Работа такого Хранилища начинается со скоординированного извлечения данных из источников. После этого загружается реляционная база данных с третьей нормальной формой, содержащая атомарные данные. Получившееся нормализованное Хранилище используется для того, чтобы наполнить информацией дополнительные репозитории презентационных данных, т.е. данных, подготовленных для анализа. Эти репозитории, в частности, включают специализированные Хранилища для изучения и "добычи" данных (англ. Data Mining), а также витрины данных. При таком сценарии конечные витрины данных создаются для обслуживания бизнес-отделов или для реализации бизнес-функций и используют пространственную модель для структурирования суммарных данных. Атомарные данные остаются доступными через нормализованное Хранилище данных. Очевидно, что структура атомарных и суммарных данных при таком подходе существенно различается .
Если исходить из результатов различных аналитических исследований, то будущее платформ для Хранилищ данных пока внушает оптимизм. Объемы и разнообразие типов данных только расширяются, изменяется состав источников данных (таких как геопространственные и другие неструктурированные данные), которые поставщики преобразуют в структурированную информацию. На рынке средств генерирования Хранилищ данных ключевой тенденцией является внедрение инструментов загрузки данных в режиме близком, к реальному времени. В прошлом многие технологии интеграции разрабатывались вне технологий Хранилищ, однако все чаще и чаще идея непрерывного обновления Хранилищ данных находит свое реальное воплощение. Качество данных, метаданные и управление нормативно-справочной информацией (англ. MDM — Master Data Management) получают все более широкое признание. Перед многими сегодня стоит цель добиться решения вечных проблем бизнеса и IT, связанных с управлением качеством информации.
1. Архипенков С.Я., Голубев Д.В., Максименко О.Б. Хранилища данных. - М.: Диалог-МИФИ [Текст], 2002. ISBN 5-86404-167-X
2. Туманов В.Е Проектирование реляционных хранилищ данных. - М.: Диалог-МИФИ [Текст], 2007. ISBN 5-86404-210-2, 978-5-86404-210-6
3. Дэвид Уэддингтон (David Waddington). Архитектурный подход к интеграции информации: обзор проблемы федеративных Хранилищ данных. (An Architected Approach to Information Integration - Federated Enterprise Data Warehousing Overview) – URL: h**t://hosteddocs.ittoolbox.com/DW041505.pdf
4. Кен Пол (Ken Pohl). Управление проектом Хранилища данных (Data Warehouse Project Management) - URL: h**t://w*w.dmreview.com/editorial/dmreview/ print_action.cfm?articleId=1048521.
5. Кэтэрин Дрюэк (Katherine Drewek). "Хранилища данных: подход Билла Инмона" (Data Warehouse: Ralph Kimball's Vision) – URL: h**t://w*w.b-eye-network.com/view/727.
6. Кэтэрин Дрюэк (Katherine Drewek). "Хранилища данных: подход Ральфа Кимболла"(Data Warehouse: Bill Inmon's Vision) – URL: h**t://w*w.b-eye-network.com/view/713.
7. Майкл Дженнинз (Michael Jennings). Производительность Хранилищ данных: проблемы и способы решения (Performance Impacts on the Data Warehouse Environment). Части 1 и 2. – URL: h**t://w*w.dmreview.com/portals/ portalarticle.cfm? articleId=1014664&topicId=230007.
8. Майкл Хэйстен (Michael Haisten). "Хранилище данных в режиме реального времени: следующая стадия в развитии Хранилищ данных" (The Real-Time Data Warehouse: The Next Stage in Data Warehouse Evolution) – URL: h**t://w*w.damanconsulting.com/company/articles/dwrealtime.htm.
9. Марджи Росс (Margy Ross) и Ральф Кимболл (Ralph Kimball). "Различные мнения" (Differences of Opinion) – URL: h**t://w*w.intelligententerprise.com/showArticle.jhtml?articleID=17800088.
10. Adamson, C., Venerable, M., "Data Warehouse Design Solutions". John Wiley & Sons, Inc (2003). ISBN 047125195X.
11. Devlin, B., "Data warehouse: from architecture to implementation". Addison Wesley Longman, Inc. (2004). ISBN 0201964252.
12. Kimball, R., "The Data Warehouse Toolkit. Practical Techniques for Building Dimensional Data Warehouses". John Wiley & Sons, Inc (2003). ISBN 0471153370.
13. Kimball, R. et al., "The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing and Deploying Data Warehouses". John Wiley & Sons, Inc (2005). ISBN 0471255475.
Тема: | «Хранилища данных» | |
Раздел: | Информатика | |
Тип: | Курсовая работа | |
Страниц: | 30 | |
Цена: | 400 руб. |
Закажите авторскую работу по вашему заданию.
- Цены ниже рыночных
- Удобный личный кабинет
- Необходимый уровень антиплагиата
- Прямое общение с исполнителем вашей работы
- Бесплатные доработки и консультации
- Минимальные сроки выполнения
Мы уже помогли 24535 студентам
Средний балл наших работ
- 4.89 из 5
написания вашей работы
У нас можно заказать
(Цены могут варьироваться от сложности и объема задания)
682 автора
помогают студентам
42 задания
за последние сутки
10 минут
время отклика
Облачные среды хранения данных
Шпаргалка:
Информатика в экономике
Курсовая работа:
Технология OLAP
Курсовая работа:
Проектирование и создание кбд (картографические базы данных)
Курсовая работа:
Средства администрирования баз данных и перспективы их развития