OLAP.ru   Rambler's Top100
Вы находитесь на страницах старой версии сайта. Перейдите на новую версию OLAP.ru
  
Поиск по сайту
Новости
Основы OLAP
Продукты
Business Objects/ Crystal Decisions
Каталог
OLAP в жизни
Тенденции
Download
Яndex
 
 
 
TopList
 
 Business Objects/Crystal Decisions  Oracle  Microsoft  IBM 
 Hyperion  Sybase  Informix  Actuate  SAS Institute  Brio 

Программные решения IBM в классе деловых интеллектуальных систем

Колин  Дж. Уайт, Database Associates International, Inc.

В статье приводятся начальные сведения о деловых интеллектуальных (e-business) системах, производится их сравнение и противопоставление с хранилищами данных, рассматриваются требования к деловым интеллектуальным системам, а также подробно рассказывается о стратегии и продуктах IBM в классе деловых интеллектуальных систем.


  1. Что представляют собой деловые интеллектуальные системы?                                                             
    1. Эволюция деловых интеллектуальных систем                                                                                           
    2. Первое поколение: запросы и отчеты на базе хостов                                                                                                        
    3. Второе поколение: хранилища данных                                                                                                                                   
    4. Третье поколение: деловые интеллектуальные системы                                                                                                 
    5. Движущие силы бизнеса                                                                                                                           
    6. Требования деловых интеллектуальных систем                                                                                         
  2. Стратегия IBM в области деловых интеллектуальных систем                                                                  
    1. Исторический обзор                                                                                                                                  
    2. Структура деловых интеллектуальных систем                                                                                            
    3. Инициатива партнерства в области деловых интеллектуальных систем                                                      
    4. Технологические инициативы                                                                                                                    
    5. Передовые инструментальные средства поддержки принятия решений                                                                    
    6. Интеграция и обмен метаданными                                                                                                                                         
    7. Производительность и масштабируемость базы данных                                                                                                 
    8. Расширяемость баз данных                                                                                                                                                       
    9. Поддержка разнородных баз данных                                                                                                                                     
    10. Поддержка Web                                                                                                                                                                             
    11. Заключение: стратегия IBM                                                                                                                       
  3. Продукты IBM в классе деловых интеллектуальных систем                                                                   
    1. Деловые интеллектуальные приложения                                                                                                                           
    2. Инструментальные средства деловых интеллектуальных систем                                                                                
    3. Средства поддержки доступа                                                                                                                                                  
    4. Средства моделирования и построения хранилищ данных                                                                                           
    5. Управление данными                                                                                                                                                                
  4. Заключение                                                                                                                                                 

Что представляют собой деловые интеллектуальные системы?

 

Учитывая постоянно растущую конкуренцию в сегодняшних жестких деловых условиях, для организаций, если они собираются пережить рубеж тысячелетия, жизненно важно обеспечить эффективный с точки зрения затрат и быстрый доступ к деловой информации для широкого круга деловых пользователей. Решение данной задачи возлагается на деловые интеллектуальные системы , которые с помощью ряда технологий и продуктов позволяют предоставить пользователям информацию, необходимую для ответа на деловые вопросы и принятия тактических и стратегических деловых решений.

Многие из концепций деловых интеллектуальных систем не являются новыми, они развивались и уточнялись на основе опыта, накопленного в результате использования корпоративных информационных систем на базе хостов и более современных хранилищ данных. В данном документе приводятся начальные сведения о деловых интеллектуальных системах, производится их сравнение и противопоставление с хранилищами данных, рассматриваются требования к деловым интеллектуальным системам, а также подробно рассказывается о стратегии и продуктах IBM в классе деловых интеллектуальных систем.

Эволюция деловых интеллектуальных систем

Три поколения систем

Первый вопрос, который неизбежно возникает при описании задач деловых интеллектуальных систем: "А разве хранилища данных не имеют те же задачи и не предоставляют те же возможности, что и деловые интеллектуальные системы?" Аналогичный вопрос поднимался во время представления хранилищ данных: "А разве хранилища данных - это не то же самое, что и корпоративные информационные системы и информационные центры, которые мы создавали раньше?" Хотя на оба эти вопроса напрашивается простой и очевидный ответ да, при более внимательном изучении можно убедиться, что как между хранилищами данных и ранними корпоративными информационными системами и информационными центрами, так и между деловыми интеллектуальными системами и хранилищами данных существуют важные различия.

Первое поколение: запросы и отчеты на базе хостов

Системы первого поколения были сложны в использовании

В ранних деловых информационных системах для предоставления пользователям нужной им информации использовались пакетные приложения. Результаты работы этих приложений обычно являли собой огромные груды бумаги, которые пользователи должны были одолеть для получения ответов на деловые вопросы. Появление управляемых с терминалов приложений с разделением времени обеспечило более быстрый доступ к информации, но эти системы оставались очень громоздкими и требовали обращения к сложным операционным базам данных. В связи с этим подобные деловые информационные системы первого поколения могли использовать лишь информационные провайдеры (например, деловые аналитики), которые были очень хорошо знакомы с получаемыми данными и были квалифицированными компьютерными специалистами. Потребители информации, такие как руководители и менеджеры деловых организаций, практически были лишены возможности использовать эти системы и вместо этого должны были полагаться на информационных провайдеров, которые отвечали на их вопросы и предоставляли им нужную информацию.

Второе поколение: хранилища данных

Хранилища данных, разработанные для деловых пользователей

Вторым поколением деловых информационных систем можно считать хранилища данных, которые обладали существенно более широким спектром возможностей. Хранилища данных обладали целым рядом преимуществ по сравнению с системами первого поколения:

  • Хранилища данных разрабатывались специально в соответствии с потребностями деловых пользователей, а не как операционные приложения для повседневной работ
  • Информация в хранилищах была четкой и последовательной, причем она хранилась в такой форме, которая была понятна деловым пользователя
  • В отличие от операционных систем, в которых содержались только текущие подробные данные, хранилища данных могли снабжать пользователей историческими сведениями и обобщенной информацие
  • Использование обработки данных по схеме клиент/сервер позволило предоставить пользователям хранилищ данных улучшенный интерфейс и более мощные инструментальные средства поддержки принятия решени

Третье поколение: деловые интеллектуальные системы

От поставщиков хранилищ данных требуются комплексные пакеты прикладных решений

Хранилище данных все-таки не является полным решением для всех потребностей деловых пользователей. Одним из недостатков многих решений в классе хранилищ данных было то, что поставщики главное внимание уделяли технологиям, а не деловым решениям. Поставщики хранилищ данных, несомненно, выпускали мощные продукты для построения и работы с хранилищами данных, но все эти продукты требовали больших затрат времени на внедрение. Проблема заключалась в том, что продукты для создания хранилищ данных очень редко поставлялись заранее подготовленными для конкретных отраслей, для конкретных прикладных областей или для конкретных деловых задач. Это во многом напоминает ситуацию, сложившуюся на ранних этапах становления технологии клиент/сервер, когда поставщики начали поставлять технологии для разработки операционных решений, но затем быстро осознали, что организациям требуются приложения и деловые решения, а не просто новые технологии. Поставщики устранили эту проблему, в результате чего многие приложения клиент/сервер создаются сегодня с использованием пакетов приложений, а не пишутся "с нуля" разработчиками. Такая же эволюция произошла и с деловыми информационными системами - от поставщиков требовались пакеты приложений, а не просто новые технологии. Отличительным фактором деловых интеллектуальных систем является то, что помимо усовершенствований технологий главное внимание в них уделяется поставкам готовых прикладных решений.

В деловых интеллектуальных системах главное внимание уделяется простому доступу к информации

Еще одна проблема, связанная с хранилищами данных, заключается в том, что до сих пор главное внимание уделяется построению хранилища данных, а не доступу к нему. Многие организации, кажется, полагают, что если создать хранилище данных и предоставить пользователям нужные инструментальные средства, то работа на этом закончена. На самом деле она только начинается. Если не обеспечить тщательное документирование содержащейся в хранилище информации и простой доступ к ней, то сложность ограничит полезность хранилища до уровня провайдеров информации в информационных системах первого поколения. В деловых интеллектуальных системах главное внимание уделяется улучшению доступа к информации и предоставлению деловой информации не только провайдерам, но и потребителям информации. Это достигается за счет современных графических и базирующихся на Web инструментальных средств он-лайновой аналитической обработки (OLAP) и добычи информации, а также готовых пакетов приложений, позволяющих использовать эти инструментальные средства. Эти приложения могут требовать обработки и анализа больших объемов информации с использованием различных инструментальных средств. В связи с этим деловая интеллектуальная система должна быть масштабируемой и обеспечивать поддержку и интеграцию продуктов от различных поставщиков.

Деловые интеллектуальные системы предоставляют информационный каталог для управления информацией

Большинство деловых интеллектуальных систем включают в себя информационный каталог, помогающий организациям упорядочивать, управлять и находить нужную корпоративную деловую информацию. Средства публикации позволяют как техническим, так и деловым пользователям документировать деловую информацию, имеющуюся в организации. Для поиска информации деловые пользователи вводят описание категории нужной им информации, а инструментальные средства поиска пытаются найти информационные объекты (документы, отчеты, аналитические обзоры и т.д.), потенциально соответствующие пользовательскому запросу. Список обнаруженных информационных объектов представляется пользователю, который может выбрать из него интересующие его объекты для извлечения. С помощью средств подписки пользователь может обеспечить регулярное получение нужной информации через корпоративную сеть intranet или по электронной почте.

Деловые интеллектуальные системы поддерживают информацию многих различных типов

Информация, находящаяся в хранилище данных, обычно получается из операционных баз данных (и иногда от внешних информационных провайдеров). Однако, помимо этого огромные объемы деловой информации хранятся в офисных и групповых системах, на серверах Web в сетях intranet и Internet, а также в бумажной форме на рабочих столах служащих. Для решения данной проблемы при проектировании деловых интеллектуальных систем в них предусматривается поддержка доступа ко всем формам деловой информации, а не только к данным, находящимся в хранилище. Деловая интеллектуальная система не исключает необходимости в хранилище данных - хранилище данных представляется просто одним из источников данных, которые может обрабатывать деловая интеллектуальная система. Итак, как мы видим, деловая интеллектуальная система представляет собой деловую информационную систему третьего поколения, обладающую тремя основными преимуществами:

Три основных преимущества по сравнению с хранилищами данных

  1. Деловые интеллектуальные системы не только поддерживают самые современные информационные технологии, но и поставляются как готовые пакеты прикладных решений.
  2. В деловых интеллектуальных системах главное внимание уделяется доступу и предоставлению информации конечным пользователям, причем поддерживаются как провайдеры информации, так и потребители информации.
  3. Деловые интеллектуальные системы поддерживают доступ ко всем формам деловой информации, а не только к информации, находящейся в хранилище данных.

Движущие силы бизнеса

 

До настоящего момента рассматриваемые нами движущие силы, обуславливающие развитие деловых интеллектуальных систем, были связаны с необходимостью упростить использование и сократить количество ресурсов, необходимых для внедрения новых информационных технологий. Развитие деловых интеллектуальных систем, однако, обуславливают также три основных движущих силы бизнеса:

Три движущих силы бизнеса

1.   Потребность в увеличении доходов, сокращении затрат и более эффективной борьбе с конкурентами. Уже прошли те времена, когда конечные пользователи могли управлять и планировать деловую деятельность на основе месячных пакетных отчетов, а работающие в сфере информационных технологий компании располагали месяцами для внедрения новых приложений. Сегодня компаниям необходимо быстро разворачивать информационные приложения и обеспечивать для деловых пользователей простой и быстрый доступ к деловой информации, отражающей быстро меняющиеся деловые условия. В деловых интеллектуальных системах главное внимание уделяется доступу и предоставлению информации конечным пользователям, а также созданию готовых комплексных деловых решений в дополнение к поддержке сложных информационных технологий, необходимых для обработки современной деловой информации.

2.   Потребность в управлении и моделировании современной сложной деловой среды. Слияния корпораций и сокращение государственного регулирования позволили современным компаниям предоставлять и поддерживать более широкий спектр продуктов и услуг для более широких и более разнообразных слоев населения. Понимание и управление такой сложной деловой средой, а также обеспечение максимальной доходности инвестиций становится все более трудной задачей. Деловые интеллектуальные системы предоставляют не только обычные средства составления запросов и отчетов, они включают в себя комплексные инструментальные средства анализа и добычи информации, которые специально рассчитаны на обработку сложной деловой информации, характерной для современной деловой среды.

Деловые интеллектуальные системы помогают также сократить затраты на информационные технологии

3.   Потребность в сокращении затрат на информационные технологии и использование существующей корпоративной деловой информации. Вложения в информационные системы в настоящее время представляют, как правило, довольно значительную долю расходов корпораций, поэтому существует потребность не только сокращать эти накладные расходы, но и обеспечить получение максимальных деловых преимуществ из той информации, которую обрабатывают информационные системы. Новые информационные технологии, такие как корпоративные сети intranet, обработка данных с помощью "тонких" клиентов и доставка информации с помощью системы подписки помогают сократить затраты на развертывание деловых интеллектуальных систем для более широких слоев пользователей, и в особенности для потребителей информации, таких как руководители и менеджеры организации. Кроме того, деловые интеллектуальные системы позволяют расширить спектр обрабатываемой информации и включить в ее состав не только операционные данные и данные из хранилищ, но и информацию, управляемую офисными системами и корпоративными серверами Web.

Требования деловых интеллектуальных систем

Пять основных требований деловых интеллектуальных систем

Обобщая содержание двух вышеприведенных разделов, можно выделить следующие основные требования деловых интеллектуальных систем:

  1. Поддержка готовых прикладных деловых решений.
  2. Эффективное с точки зрения затрат решение, которое быстро окупается и позволяет организации более эффективно вести конкурентную борьбу.
  3. Быстрый и простой доступ к деловой информации организации для широкого круга конечных пользователей, включая и провайдеров информации, и потребителей информации.
  4. Поддержка современных информационных технологий, включая методы анализа и доставки информации, такие как он-лайновая аналитическая обработка (OLAP) и добыча информации.
  5. Открытая, расширяемая и масштабируемая операционная среда.

Теперь, когда мы определили понятие деловой интеллектуальной системы и выявили ее основные требования, можно перейти к рассмотрению стратегии и продуктов IBM в классе деловых интеллектуальных систем.

   

Стратегия IBM в области деловых интеллектуальных систем

Исторический обзор

 

В первой части данного документа мы показали, что деловые интеллектуальные системы представляют собой третье поколение деловых информационных систем, которые развились из существовавших на ранних этапах информационных систем на хостах и более современных хранилищ данных. IBM разрабатывала и поставляла продукты для всех трех поколений деловых информационных систем. Фактически, APL на системах IBM с разделением времени представлял собой первые коммерческие инструментальные средства он-лайновой аналитической обработки (OLAP).

IBM – пионер в области хранилищ данных

Хотя многие люди присваивают себе изобретение хранилищ данных, одним из первых источников по концепции хранилищ данных была статья в журнале IBM Systems Journal от 1988 года авторов Барри Девлина (Barry Devlin) и Пола Мерфи (Paul Murphy), озаглавленная как "Архитектура деловых и информационных систем" ("An Architecture for a Business and Information System"). В этой статье было задокументировано использование хранилища данных в IBM Дублин, что в конечном счете привело к разработке концепции и архитектуры информационного хранилища IBM в начале 90-х годов. Хотя IBM была одним из первых поставщиков, вышедших на рынок коммерческих хранилищ данных, компания слишком медленно действовала как с точки зрения разработки, так и с точки зрения маркетинга и поэтому не смогла воспользоваться своим лидирующим положением и была быстро вытеснена конкурирующими поставщиками. Позднее IBM бросила значительные ресурсы на разработку и маркетинг своих продуктов в области хранилищ данных, благодаря чему ей удалось отвоевать обратно большую часть потерянных позиций. По мере перехода отрасли на деловые информационные системы третьего поколения IBM намерена сохранить свое стремительное продвижение в области разработки и маркетинга и начать поставки интегрированных, сквозных деловых интеллектуальных решений. В данной части документа рассматриваются структура, технологии и стратегии подобных решений с точки зрения программного обеспечения.

Структура деловых интеллектуальных систем

 

Структура деловых интеллектуальных систем IBM, приведенная на рисунке 1,  представляет собой развитие ранее разработанной архитектуры хранилищ данных IBM. (Продукты, которые поддерживают данную структуру, показаны на рисунке 2 и рассматриваются в следующей части данного документа). Структура включает в себя следующие основные компоненты:

Основным компонентом являются деловые приложения

·       Деловые интеллектуальные приложения. Данные приложения представляют собой полные пакеты деловых интеллектуальных решений, адаптированные для конкретной отрасли и/или конкретной прикладной области. В данных пакетах используются продукты из других компонентов структуры деловых интеллектуальных систем. Основные деловые интеллектуальные приложения IBM распространяются под торговой маркоDecisionEdge.

Включая средства он-лайновой аналитической обработки (OLAP) и добычи информации

·       Инструментальные средства поддержки принятия решений. Данные инструментальные средства варьируются от простых средств составления запросов и отчетов до мощных средств он-лайновой аналитической обработкиOLAP) и добычи информации. Все эти инструментальные средства поддерживают графический пользовательский интерфейс. Многие из них, кроме того, можно использовать через Web. Эти инструментальные средства рассчитаны на обработку структурированной и неструктурированной информации, управляемой различными продуктами в классе баз данных и файловых систем. IBM предлагает собственные инструментальные средства подобного рода, и помимо этого участвует в разработке и маркетинге продуктов таких ведущих сторонних поставщиков, как Brio Technology, Business Objects, Cognos и Hyperion Solutions.

Рисунок 1. Структура деловых интеллектуальных систем IBM

Доступ к разнородным базам данных с помощью связующего программного обеспечения (middleware)

  • Средства поддержки доступа. Сюда входят прикладные интерфейсы и связующее программное обеспечениеmiddleware), позволяющие клиентским инструментальным средствам получать доступ и обрабатывать деловую информацию, хранящуюся в базах данных и файловых системах. Серверы связующего ПО баз данных предоставляют клиентам прозрачный доступ к различным внутренним серверам баз данных IBM и других производителей - образуя так называемую интегрированную (federated) базу данных. Связующее ПО серверов Web позволяет соединяться с этой интегрированной базой данных клиентам Web.
  • Управление данными. Данные продукты используются для управления деловой информацией, представляющей интерес для конечных пользователей. Данный набор продуктов включает в себя продукты IBM DB2 для платформ OS/390VSE и VM, AS/400, UNIX (AIX, HP-UX, Solaris, UnixWare), Linux, OS/2 и Windows (NT, 95, 98) . Кроме того, с помощью продуктов IBM в классе связующего ПО для баз данных доступ и управление деловой информацией может осуществляться с помощью реляционных баз данных сторонних поставщиков.

Три уровня хранения информации

При управлении деловой информацией IBM разделяет хранение информации на три уровня. Данная трехуровневая архитектура основана на существующих концепциях хранилищ данных, хотя, как уже отмечалось выше, может быть реализована поддержка и других типов информации, например, мультимедийных данных. На верхнем уровне этой архитектуры находится глобальное хранилище, в котором объединена вся деловая информация масштаба предприятия. На среднем уровне расположены хранилища масштаба отдела, содержащие информацию конкретного делового подразделения, группы пользователей или отдела. Эти хранилища масштаба отдела могут создаваться либо непосредственно из операционных систем, либо из глобального хранилища. (Отметим, что хранилища масштаба отдела часто называют витринами данных - data mart). На нижнем уровне архитектуры находятся прочие хранилища информации, которые могут содержать информацию, отвечающую потребностям отдельных пользователей или отдельных приложений. Примером использования хранилища данных последнего типа могут быть финансовые данные, извлекаемые из информационного хранилища масштаба отдела и загружаемые финансовым аналитиком в отдельное хранилище для моделирования.

Поддержка хранилищ данных других производителей

Инструментальные средства моделирования и построения хранилищ данных. Эти инструментальные средства используются для получения данных из операционных и внешних источников, для их очистки и преобразования, а также для загрузки в глобальные хранилища данных или хранилища масштаба отдела. Для доступа и обработки данных из хранилищ, реализованных с помощью баз данных других поставщиков, в продуктах IBM используется связующее ПО, входящее в компонент средств поддержки доступа, показанный на рисунке 1. IBM предлагает собственные инструментальные средства построения хранилищ данных под торговой маркоVisual Warehouse, а также участвует в маркетинге и разработке продуктов сторонних поставщиков, таких как Evolutionary Technologies International и Vality Technology.

Обработка технических и деловых метаданных

  • Управление метаданными. Данный компонент осуществляет управление метаданными, связанными со всей деловой интеллектуальной системой в целом, включая технические метаданные разработчиков и администраторов, а также деловые метаданные для поддержки деловых пользователе
  • Средства администрирования. Данный компонент охватывает все аспекты администрирования деловой интеллектуальной системы, включая защиту данных и авторизацию, резервное копирование и восстановление, мониторинг и настройку, эксплуатацию и планирование, а также аудит и отчетност

Инициатива партнерства в области деловых интеллектуальных систем

Партнеры поддерживают структуру деловых интеллектуальных систем

Структура деловых интеллектуальных систем IBM разработана таким образом, что она позволяет интегрировать и включить в ее состав не только продукты IBM в классе деловых интеллектуальных систем, но и продукты сторонних производителей. В целях содействия в поддержке данной структуры деловых интеллектуальных систем IBM учредила программу партнерства в области деловых интеллектуальных систем (Business Intelligence Partner Program) для независимых разработчиков программного обеспечения, реселлеров, системных интеграторов и консультантов. К настоящему времени к этой программе присоединились свыше 250 компаний. Цель данной программы заключается не только в совместных маркетинговых усилиях организаций-членов, но и в совместных мероприятиях по разработке, благодаря которым продукты других поставщиков программного обеспечения могут быть интегрированы с продуктами IBM в классе деловых интеллектуальных систем. Доказательством серьезности намерений IBM в отношении тесной интеграции между своими продуктами и продуктами других поставщиков могут служить сложившиеся взаимоотношения с такими компаниями, как Brio Technology, Business Objects, Cognos, Evolutionary Technology International, Hyperion Solutions и Vality Technology. В следующей части данного документа, посвященной продуктам IBM в классе деловых интеллектуальных систем, будет рассказано о том уровне интеграции с продуктами других поставщиков, которого удалось добиться на настоящий момент.

Технологические инициативы

 

За IBM закрепилась отличная репутация лидера в области технологий, и в данном разделе мы кратко рассмотрим текущие технологические инициативы IBM в области деловых интеллектуальных систем.

Передовые инструментальные средства поддержки принятия решений

Главный акцент – на средства он-лайновой аналитической обработки и добычи информации

На протяжении нескольких лет IBM вкладывала значительные ресурсы в собственную технологию добычи информации, и ее продукт Intelligent Miner является лидером в данной отрасли. А не так давно IBM совместно с Hyperion Solutions разработали сервер он-лайновой аналитической обработки DB2 OLAP, который поддерживает комплексную он-лайновую аналитическую обработку информации, хранящейся в реляционных и многомерных базах данных. В отношении инструментальных средств добычи информации и продуктов для он-лайновой аналитической обработки IBM намерена поставлять готовые пакеты деловых приложений, с помощью которых организации смогут быстро развернуть самые современные системы поддержки принятия решений.

Интеграция и обмен метаданными

Метаконцентраторы обеспечивают обмен метаданными

В течение многих лет IBM и другие поставщики бились над решением проблемы интеграции метаданных. Основная проблема заключается в том, что каждый продукт требует различных метаданных и различные модели метаданных (известные как метамодели). За все это время было предпринято достаточно много неудачных попыток, которые наглядно продемонстрировали, что просто невозможно создать единое хранилище метаданных, реализующее единую метамодель для всех метаданных в организации. Единственное решение, напротив, заключается в усовершенствовании обмена метаданными между продуктами, а также в автоматизации и синхронизации этого обмена по мере возможностей. Именно в этом заключается стратегия IBM в отношении собственной структуры деловых интеллектуальных систем, и компания намерена добиться этой цели с использованием метаконцентратора (metahub) для управления потоками метаданных между продуктами.

В центре структуры деловых интеллектуальных систем IBM находится семейство продуктов Visual Warehouse, которые используются для построения глобальных хранилищ данных и хранилищ данных масштаба отдела. Visual Warehouse предоставляет два хранилища метаданных: один для технических метаданных, используемых менеджером Visual Warehouse Manager; а другой представляет собой информационный каталог Visual Warehouse Information Catalog (ранее называвшийся DataGuide), который используется для обработки деловых и технических метаданных, связанных со всей средой деловых интеллектуальных систем.

Visual Warehouse управляет построением хранилища данных

Одна из задач Visual Warehouse Manager заключается в централизации управления операциями построения хранилища данных, осуществляемых с помощью продуктов IBM и продуктов деловых партнеров IBM, таких как Hyperion Solutions, Evolutionary Technology International и Vality Technology. Для обслуживания этого процесса Visual Warehouse поддерживает обмен метаданными между продуктами партнеров и хранилищем технических метаданных менеджера Visual Warehouse Manager.

Visual Warehouse предоставляет концентратор для обмена метаданными

Стратегия IBM в отношении метаданных заключается в использовании каталога Visual Warehouse Information Catalog в качестве метаконцентратора для обмена метаданными между продуктами в составе деловой интеллектуальной системы. Эквивалентным метаконцентратором для операционных систем является VisualAge Data Atlas, который позволяет обмениваться метаданными с каталогом Visual Warehouse Information Catalog.

В настоящее время IBM работает над проектом рабочей группы по управлению объектами Object Management Group (OMG), который называется Common Warehouse Metadata Interchange (CWMI). В проекте CWMI участвуют IBM, Oracle и Unisys, а цель этого проекта заключается в создании стандартов для метаданных хранилищ данных. В настоящее время OMG опубликовала запрос на предложения (Request for Proposal) для поставщиков, предлагающих технологии поддержки CWMI. Предполагается, что в CWMI будет использоваться архитектура CORBA и средства OMG Meta Object Facility (MOF), которые представляют собой основанные на UML средства определения метамоделей. IBM намерена ответить на данный запрос, представив поддерживающие обмен метаданными технологию и инструментальные средства на основе XML и общего набора метамоделей хранилищ данных на базе UML. По мере развития данной технологии обмена метаданными она будет включена в Visual Warehouse.

Производительность и масштабируемость базы данных

 

В деловых информационных системах всех трех поколений количество пользователей, объемы данных и сложность обработки всегда несколько превышали прогнозируемые. Построение и использование деловых интеллектуальных систем требует тщательного планирования и администрирования, однако помимо этого организациям следует использовать продукты, масштабируемость которых позволит справиться с расширением использования деловой интеллектуальной системы в будущем. Масштабируемость охватывает многие направления, включая возможность добавления небольшими порциями аппаратных процессоров и дисковых накопителей, поддержку аппаратных и программных средств параллельной обработки, поддержку большого количества пользователей и возможность управления крупными базами данных.

Поддержка параллельной обработки

Стратегия IBM заключается в предоставлении таких реляционных баз данных, которые могут работать на широком спектре различных платформ и которые позволяют работать как с небольшими, так и с очень крупными хранилищами информации. Одним из ключевых аспектов данной стратегии является масштабируемость аппаратного и программного обеспечения с поддержкой параллельной обработки. IBM предлагает четыре семейства аппаратных платформ для параллельной обработки: System/390, RS/6000, AS/400 и Netfinity. Все продукты DB2, работающие на этих платформах, поддерживают параллельную обработку запросов и параллельную работу утилит, что позволяет обрабатывать большие объемы информации в системах поддержки принятия решений и управлять крупными базами данных. В целях содействия в тестировании интеграции и масштабируемости аппаратных и программных решений в области деловых интеллектуальных систем IBM инвестировала 47 миллионов долларов в создание ряда испытательных центров Teraplex Integration Centers, которыми IBM, деловые партнеры IBM и некоторые заказчики могут воспользоваться для проверки предлагаемых решений при работе с очень крупными базами данных и большими объемами процессорной нагрузки.

Еще одним ключевым элементом стратегии IBM в области баз данных является повышение производительности в системах поддержки принятия решений за счет добавления расширений в модули управления данными и SQL-оптимизации своих продуктов DB2. В качестве примера можно привести функцию кодированных векторных индексов (encoded vector index, EVI), недавно добавленную в DB2 for AS/400. Технология EVI была разработана в исследовательских лабораториях IBM и представляет собой первую в отрасли методику векторной обработки битовых индексов. Среди других примеров данной стратегии можно отметить поддержку в DB2 Universal Database операторов SQL ROLLUP и CUBE, предназначенных для многомерного анализа, а также оптимизация с группировкой повторяющихся запросов SQL.

Расширяемость баз данных

DB2 Universal Database характеризуется высокой расширяемостью

Мы уже упоминали в первой части данного документа, что одним из основных отличительных факторов деловых интеллектуальных систем является их возможность обрабатывать все типы деловой информации. Чтобы упростить управление комплексными данными, такими как документы, карты, мультимедийные данные и т.д., IBM предусмотрела в своих базах данных поддержку сложных данных за счет определяемых пользователем типов данных и определяемых пользователем функций. Одним из первых продуктов, поддерживающих эти новые средства, был DB2 Spatial Extender, который предоставлял пользователям возможность хранить и анализировать геопространственные данные (например, карты и географическую информацию). Многие организации начали осознавать, что помимо стандартной деловой информации, обрабатываемой хранилищем данных, им требуется также возможность управлять геопространственными данными. Поддержка геопространственных данных в хранилище данных включала в себя расширенные пользовательские функции для составления запросов и визуального отображения результатов в геопространственном контексте.

Чтобы решить, следует или не следует хранить комплексные данные в базе данных, необходимо изучить несколько факторов. Преимущества, которые предлагают базы данных - это возможности поиска и манипулирования данными, а также средства их восстановления и защиты. Недостатком является более сложная среда, а база данных должна иметь возможность обращаться к деловой информации. Чтобы разрешить это противоречие, IBM реализовала в DB2 Universal Database концепцию ссылок на данные (data links). Ссылка на данные позволяет хранить данные вне базы данных, например, в виде двумерного файла, и в то же время использовать интерфейсы базы данных для доступа и обновления этих данных. Благодаря данной функции поддерживаются три способа работы с деловой информацией:

  • Хранение данных в базе данных и доступ к ним через интерфейсAPI базы данных.
  • Хранение данных в двумерном файле и доступ к ним через интерфейсAPI базы данных или файловой системы.
  • Хранение данных в двумерном файле (например, на сервере Web) и доступ к ним через интерфейAPI файловой системы.

Поддержка разнородных баз данных

DB2 DataJoiner поддерживает доступ к СУБД IBM и других производителей

В прошлом IBM часто и справедливо обвиняли в поставке внутренних закрытых решений, которые можно было использовать только с базами данных IBM. Одним из существенных достижений для разрешения данной проблемы был выпуск продукта в классе связующего ПО для баз данных - IBM DB2 DataJoiner. Данный продукт предоставляет инструментальным средствам поддержки принятия решений возможность обращаться и обновлять данные в серверах баз данных IBM и других производителей, а также позволяет инструментальным средствам построения хранилищ данных использовать в качестве источников данных и целевых систем, обеспечивающих хранение информации, базы данных других производителей.

Поддержка Web

 

Как и многие другие поставщики, IBM полагает, что использование технологий Web может значительно сократить затраты на развертывание решений в классе деловых интеллектуальных систем, предназначенных для широкого спектра конечных пользователей. Стратегия IBM в данной области заключается в интеграции средств Web с продуктами в классе деловых интеллектуальных систем. Например, DB2 for Domino представляет собой набор связующих приложений, с помощью которых пользователи Lotus Notes и приложения Lotus Domino могут легко обращаться к базам данных DB2. Кроме того, с помощью продукта в классе связующего ПО для Web, Net.Data, IBM обеспечивает возможность доступа к данным DB2 для пользователей и приложений Web (этот продукт входит в комплект поставки DB2 Universal Database и сервера Web-приложений IBM WebSphere).

Заключение: стратегия IBM

Стратегия IBM согласуется с требованиями деловых интеллектуальных систем

Структура деловых интеллектуальных систем и технологические инициативы, рассмотренные выше, ясно свидетельствуют об основных направлениях стратегии IBM в области деловых интеллектуальных систем:

  • Предоставление приложений, ориентированных на решение деловых задач и включающих в себя последние достижения в области информационных технологий и технологий систем поддержки принятия решени
  • Создание полных и интегрированных сквозных решений, включающих в себя продукты IBM и основных деловых партнеров IB
  • Предоставление масштабируемого аппаратного и программного обеспечения, позволяющего работать с широким спектром различных типов деловой информаци
  • Создание интегрированной среды баз данных, поддерживающей СУБД IBM и других производителей, позволяющей управлять различными типами информации в информационном хранилище, включая глобальные хранилища данных и хранилища данных масштаба отдел

Данная стратегия полностью согласуется с требованиями деловых интеллектуальных систем, описанных в первой части данного документа.

Продукты IBM в классе деловых интеллектуальных систем

 

В данной части документа рассматриваются продукты и инструментальные средства IBM (и основных партнеров IBM), предназначенные для построения деловых интеллектуальных систем - перечень этих продуктов приводится на рисунке 2. При распределении по категориям и описании этих продуктов мы будем руководствоваться структурой деловых интеллектуальных систем IBM, показанной на рисунке 1.

Деловые интеллектуальные приложения

Приложения для управления взаимоотношениями с заказчиками

Деловые интеллектуальные приложения IBM распространяются под торговой маркой DecisionEdge. DecisionEdge представляет собой решение для управления взаимоотношениями с заказчиками (Customer Relationship Management, CRM), которое позволяет организациям анализировать поведение заказчиков в целях увеличения доли рынка и прибыльности. На настоящий момент IBM объявила о выпуске решений DecisionEdge для финансовой отрасли, страховой отрасли, отрасли телекоммуникаций и отрасли коммунальных услуг. Каждое из решений DecisionEdge включает в себя интегрированные аппаратные и программные средства, консалтинговые услуги и деловые приложения, ориентированные на специфичную для данной отрасли модель данных. Решение DecisionEdge для области телекоммуникаций (DecisionEdge for Telecommunications), например, позволяет анализировать информацию о заказчиках в целях оценки прибыльности, прогнозирования поведения заказчиков, анализа насыщения и содействия в разработке специализированных маркетинговых программ. Решение DecisionEdge для сферы финансов, банковской деятельности и ценных бумаг (DecisionEdge for Finance, Banking and Securities) представляет собой готовую систему для поддержки маркетинга и продаж, а также для анализа рисков и прибыльности. Все пакеты DecisionEdge поддерживают операционные системы OS/390, AS/400, UNIX и Windows NT, а также включают в себя программное обеспечение для автоматизации маркетинговой деятельности и управления маркетинговыми кампаниями VALEX, разработанное Exchange Applications.

Включают в себя приложения для добычи информации

Кроме того, в DecisionEdge нашли применение результаты значительных вложений IBM в исследования по проблемам добычи информации. С использованием среды разработки Intelligent Miner в DecisionEdge предоставляется дополнительное приложение Intelligent Miner for Relationship Marketing, которое помогает деловым пользователям лучше уяснить такие ключевые деловые вопросы, как сегментация заказчиков и потенциальные линии поведения в отношении покупок и верности марки.

IBM уделяет все большее внимание использованию деловых интеллектуальных приложений и поставляет приложения для различных прикладных областей, включая управление студентами, розничные банковские услуги, местные и государственные кадровые службы, а также электронную коммерцию.

Пакеты приложений для он-лайновой аналитической обработки

Деловые интеллектуальные приложения поставляются также для сервера он-лайновой аналитической обработки DB2 OLAP Server (см. описание ниже). В данном продукте (который был разработан IBM совместно с Hyperion Solutions) применяется тот же интерфейс API, что и в Hyperion Essbase, и поэтому его можно использовать вместе со многочисленными специализированными пакетами приложений сторонних поставщиков, разработанными для Essbase.

Инструментальные средства деловых интеллектуальных систем

 

Инструментальные средства деловых интеллектуальных систем можно разбить на три категории: средства запросов и отчетов, средства он-лайновой аналитической обработки (OLAP) и средства добычи информации.

Средства запросов и отчетов

Продукт QMF for Windows

Основными продуктами IBM в категории средств запросов и отчетов является семейство инструментальных средств Query Management Facility (QMF). Версия QMF для System/390 уже много лет применяется пользователями DB2 for S/390 как инструмент составления запросов и отчетов для хостов. Не так давно IBM выпустила QMF for Windows, родную версию QMF для Windows, которая поддерживает доступ не только к базам данных DB2, но и к другим реляционным и нереляционным источникам данных, поддерживаемых продуктом в категории промежуточного ПО - DB2 DataJoiner (см. описание ниже). Объекты QMF для хостов совместимы с QMF for Windows, что позволяет использовать корпоративные средства запросов в Windows и Web. Результаты работы QMF могут быть опубликованы в Web, а также переданы в другие приложения под Windows, такие как Lotus 1-2-3, Microsoft Excel и прочие продукты с помощью механизма Windows OLE.

Рисунок 2. Продукты IBM в классе деловых интеллектуальных систем

Партнеры: Brio, Business Objects и Cognos

Чтобы расширить спектр продуктов, предлагаемых в категории средств запросов и отчетов, IBM установила деловые взаимоотношения с Brio Technology, Business Objects и Cognos. IBM намерена поддерживать отношения с этими поставщиками инструментальных средств не только на уровне совместных маркетинговых усилий, но и заключать с ними соглашения об интеграции продуктов этих компаний с продуктами IBM в классе деловых интеллектуальных систем, например, в области обмена метаданными.

Средства он-лайновой аналитической обработки (OLAP)

Ключевым продуктом является DB2 OLAP Server

Основным продуктом IBM в категории средств он-лайновой аналитической обработки является DB2 OLAP Server, в котором для решения сложных задач многомерного анализа данных реализована трехуровневая архитектура клиент/сервер. На среднем уровне этой архитектуры располагается сервер он-лайновой аналитической обработки, разработанный совместно с Hyperion Solutions, который отвечает за интерактивную аналитическую обработку и автоматическую генерацию оптимальной звездообразной реляционной схемы на основе указанных пользователем размерных характеристик. Данный сервер аналитической обработки функционирует на платформах Windows NT и UNIX и может быть использован для анализа данных, хранящихся на сервере DB2 Universal Database. В будущих версиях планируется реализовать поддержку серверов Oracle. Сервер он-лайновой аналитической обработки DB2 OLAP Server поддерживает тот же клиентский API и включает в себя тот же вычислительный модуль, что и Hyperion Essbase, поэтому многие инструментальные средства сторонних поставщиков (с графическим пользовательским интерфейсом или на базе Web), поддерживающие Essbase, могут выступать в роли клиентов сервера DB2 OLAP Server.

Приложения Essbase могут работать с сервером DB2 OLAP Server

Ценность сервера DB2 OLAP Server заключается в возможности генерации и управления реляционными таблицами с многомерными данными в существующих приложениях Essbase, поддерживающих данный продукт, а также в поддержке функций Visual Warehouse, обеспечивающих автоматическую загрузку реляционной звездообразной схемы информацией из внешних источников, таких как базы данных DB2, Oracle, Informix, IMS и VSAM.

Добыча информации

 

IBM выделила значительный объем ресурсов исследовательских лабораторий на разработку продукта Intelligent Miner for Data, который работает на платформах OS/390, OS/400, UNIX и Windows NT и может обрабатывать данные из баз данных DB2, из реляционных баз данных, поддерживаемых DB2 DataJoiner, а также из двумерных файлов. Intelligent Miner версии 1, выпущенный в 1996 году, выполнял функции добычи информации из структурированных данных, хранящихся в реляционных базах данных и двумерных файлах, предлагая широкий выбор различных алгоритмов добычи данных. В Intelligent Miner версии 2 был реализован новый графический интерфейс, добавлены новые алгоритмы добычи, добавлена возможность использования функций DB2 Universal Database, а также была усовершенствована система параллельной обработки.

Новый продукт – Intelligent Miner for Text

Intelligent Miner представляет собой один из немногих продуктов на рынке, поддерживающий внешний интерфейс API, благодаря чему результаты его работы могут быть переданы в другие продукты для дальнейшего анализа (например, в инструментальные средства он-лайновой аналитической обработки). В Intelligent Miner реализованы неплохие функции визуализации данных и, в отличие от многих других инструментальных средств добычи данных, поддерживаются несколько алгоритмов добычи информации. Кроме того, IBM предлагает новый продукт Intelligent Miner for Text, который позволяет извлекать, индексировать и анализировать информацию из текстовых источников, таких как документы, страницы Web, формы опроса и т.д.

Средства поддержки доступа

 

Для доступа клиентов к данным в хранилище и к операционным данным с помощью инструментальных средств деловых интеллектуальных систем требуется использование клиентского API базы данных. Инструментальные средства деловых интеллектуальных систем от IBM и других поставщиков поддерживают родной API-интерфейс DB2 SQL (предлагаемый средствами IBM Client Application Enabler) и/или такие стандартные API-интерфейсы, как ODBC, X/Open CLI и API-интерфейсы Hyperion Essbase и ESRI.

DB2 DataJoiner поддерживает репликацию разнородных данных

Очень часто деловая информация управляется несколькими различными серверами баз данных. Для решения задачи доступа к этим данным IBM предлагает свой стратегический продукт - DB2 DataJoiner, который относится к разряду промежуточного программного обеспечения и обеспечивает для одного или нескольких клиентов возможность прозрачного доступа к данным, хранящимся в различных серверах баз данных. Этот сервер интегрированных (federated) баз данных функционирует на платформах Windows NT, OS/400 и UNIX, обеспечивая взаимодействие с серверами баз данных производства IBM и других поставщиков, например, с IBM DB2, Informix, Microsoft SQL Server, Oracle, Sybase, VSAM, IMS, а также со всеми источниками данных, поддерживающими ODBC, IBM EDA/SQL или Cross Access. Необходимо отметить следующие характеристики продукта:

  • Прозрачный доступ к разнородным базам данных с использованием единственного диалекта SQ
  • Глобальная оптимизация распределенных запросов с возможностью переписывания запросов в случае неоптимального код
  • Поддержка хранимых процедур, благодаря которой глобальные процедуры DBDataJoiner могут прозрачно обращаться к данным или вызывать локальные процедуры любой поддерживаемой в DB2 DataJoiner базы данных. Сюда входит поддержка Java и Java Database Connectivity (JDBC).
  • Репликация разнородных данных (с использованием IBDataPropagator, который теперь входит в состав DB2 DataJoiner) между реляционными базами данных DB2, Informix, Oracle, Sybase è Microsoft.
  • Поддержка Web-клиентов (при использовании продукта IBNet.Data).

Net.Data обеспечивает доступ к данным через Web

Инструментальные средства IBM в категории промежуточного серверного ПО для Web, Net.Data (входящие в состав DB2), обеспечивают доступ через Web к данным в реляционных базах данных и двумерных файлах на различных платформах, включая DB2, поддерживаемые DB2 DataJoiner базы данных и источники данных ODBC. Net.Data тесно интегрирован с интерфейсами серверов Web; кроме того, этот продукт поддерживает обработку на стороне клиента и на стороне сервера с помощью приложений, написанных на Java, REXX, С++ или на собственном макроязыке.

Средства моделирования и построения хранилищ данных

 

IBM поддерживает моделирование и построение хранилищ данных как с использованием собственного семейства продуктов Visual Warehouse и инструментальных средств репликации данных, так и с помощью продуктов таких партнеров, как Evolutionary Technologies International (набор инструментальных средств ETI*EXTRACT) è Vality Technology (инструментальные средства Data Reengineering).

Семейство продуктов Visual Warehouse представляет собой набор интегрированных инструментальных средств для построения хранилища данных, который включает в себя компоненты для определения взаимосвязей между источниками данных и информацией в хранилище, для преобразования и очистки данных, полученных из источников, для автоматизации процесса загрузки данных в хранилище, а также для управления хранилищем. Выполненный на платформе ядра DB2, Visual Warehouse позволяет получать данные из баз данных DB2, Informix, Microsoft, Oracle, Sybase и IMS, из файлов VSAM и двумерных файлов, а также из поддерживаемых DB2 DataJoiner источников.

Пакеты продуктов Visual Warehouse

Организациям предлагаются на выбор два пакета продуктов Visual Warehouse, причем для каждого из них имеются дополнительные модули доступа к информации от Brio Technology, Business Objects или Cognos. В состав базового пакета Visual Warehouse входят:

  • База данных DB2 Universal Database для хранения метаданны
  • МенеджеVisual Warehouse Manager для определения, планирования и мониторинга процесса получения исходных данных и операций загрузки данных в хранилище.
  • АгенVisual Warehouse для выполнения задач захвата данных, их преобразования и загрузки.
  • Информационный каталоVisual Warehouse Information Catalog (ранее называвшийся DataGuide) для обмена метаданными между администраторами и деловыми пользователями.

Visual Warehouse включает в себя сервер он-лайновой аналитической обработки DB2 OLAP Server

В состав второго пакета, Visual Warehouse OLAP, добавлен сервер он-лайновой аналитической обработки DB2 OLAP Server, который предоставляет пользователям возможность определять реляционные базы данных со звездообразной схемой, а также автоматически выполнять предварительные вычисления и обобщение информации в процессе загрузки.

Агенты для повышения производительности

В составе Visual Warehouse имеется целый ряд функций, обеспечивающих эффективную реализацию и управление хранилищем данных: использование технологии агентов, функции управления, возможности обработки метаданных, а также возможность вызывать созданные пользователем или выпущенные сторонними производителями инструментальные средства для выполнения дополнительной обработки, не предусмотренной в базовом продукте. Первый пункт в данном списке, использование технологии агентов, направлен на обеспечение требований производительности при загрузке в хранилище больших объемов информации. Данные получаются и загружаются в информационное хранилище агентами хранилища данных, работа которых заключается в непосредственной передаче информации из одного или нескольких источников данных в одно или несколько информационных хранилищ. В отличие от многих конкурирующих продуктов информация при этом не должна проходить через центральный промежуточный сервер, который может превратиться в "узкое место" по мере роста объемов данных. Агенты Visual Warehouse могут работать на платформах OS/400, OS/2, UNIX и Windows NT; кроме того, в зависимости от объемов перемещаемых данных в конкретной реализации может потребоваться одновременная работа нескольких агентов. Источник данных, которые должны быть получены, преобразованы и загружены в информационное хранилище с помощью одного или нескольких агентов, определяется на деловом представлении (business view). Определение, планирование и мониторинг операций на деловом представлении производится с помощью менеджера Visual Warehouse Manager, работающим под Windows NT.

Управление созданными пользователем приложениями по преобразованию данных

Помимо активизации агентов, менеджер Visual Warehouse Manager может быть использован также для планирования вызова написанных пользователем приложений по получению и преобразованию данных, а также приложений деловых партнеров IBM. Данная возможность используется в Visual Warehouse для реализации загрузки многомерных данных Hyperion Essbase, а также для интеграции других операций обработки, не связанных с агентами, таких как программы ETI*EXTRACT, задания по репликации данных IBM и процессы очистки данных Vality.

Кроме того, продуктам Visual Warehouse отводится важная роль в управлении метаданными, связанными со средой деловых интеллектуальных систем IBM. В такой среде необходимо управлять двумя типами метаданных - технические метаданные и деловые метаданные. Технические метаданные связаны с проектированием, построением и эксплуатацией хранилища данных, тогда как деловые метаданные используются вместе с инструментальными средствами деловых интеллектуальных систем для доступа к данным в хранилище и их анализа.

Поддерживается обмен метаданными с продуктами партнеров

Для управления техническими метаданными, связанными с построением и управлением хранилищем данных, в менеджере Visual Warehouse Manager используется собственное хранилище метаданных на основе DB2. Как уже отмечалось выше, IBM разработала интерфейсы для обмена метаданными между Visual Warehouse и продуктами Hyperion Solutions, Evolutionary Technologies International и Vality Technology. Кроме того, обмен метаданными может осуществляться с инструментальными средствами деловых интеллектуальных систем от Brio Technology, Business Objects и Cognos.

В состав Visual Warehouse входит информационный каталог Visual Warehouse Information Catalog (ранее называвшийся DataGuide). Назначение данного информационного каталога заключается в документировании и управлении деловыми и внутренними техническими метаданными, которые помогают деловым пользователям работать с деловой интеллектуальной системой. Деловые пользователи могут просматривать эти метаданные как с помощью графического интерфейса, так и через Web.

Поддержка интерфейса MDIS от Meta Data Coalition

Метаданные в информационном каталоге Visual Warehouse Information Catalog хранятся в базе данных DB2, поэтому обращаться и управлять этими данными можно либо с помощью поставляемых интерфейсов SQL и API, либо путем импортирования и экспортирования в виде файлов с определенным языком меток. IBM предоставляет множество примеров приложений, в которых эти интерфейсы используются для обмена метаданными с продуктами сторонних поставщиков (например, Hyperion Essbase, Bachman DBA, Microsoft Excel). Технические метаданные менеджера Visual Warehouse Manager также могут быть импортированы в информационный каталог. В продуктах Visual Warehouse IBM поддерживает при перемещении метаданных в/из информационного каталога Visual Warehouse Information Catalog спецификации Meta Data Interchange Specification (MDIS) от Meta Data Coalition.

Инструментальные средства репликации данных IBM

Средства репликации данных IBM основаны на продукте DataPropagator Relational, который в настоящее время входит в состав DB2 Universal Database (для репликации однородных данных) и в состав DB2 DataJoiner (для репликации разнородных данных). Средства репликации фиксируют изменение данных в исходных базах данных DB2 и копируют эти изменения в хранилище данных на основе DB2. Изменения данных передаются из исходных в целевые хранилища с помощью промежуточных таблиц. Для извлечения данных из промежуточных таблиц с указанной пользователем периодичностью, преобразования и сохранения этих данных в хранилище на основе DB2 применяется SQL. В качестве источника или приемника изменений в процессе репликации может выступать также DB2 DataJoiner, то есть этот продукт можно использовать для реализации репликации данных из реляционных СУБД сторонних поставщиков в хранилище данных на основе DB2 или репликации данных из источника на основе DB2 в хранилище данных, построенное на базе реляционной СУБД стороннего поставщика.

В числе других продуктов IBM, предназначенных для построения хранилищ данных, можно отметить DataPropagator NonRelational, предназначенный для фиксирования изменений в базах данных IMS, è Data Refresher, предназначенный для получения и преобразования данных из нереляционных баз данных и файлов, таких как IMS и VSAM.

Партнер – Evolutionary Technologies

Деловой партнер IBM, Evolutionary Technologies International, предлагает набор инструментальных средств EXTRACT Tool Suite, предназначенный для генерации приложений по получению и преобразованию данных. В этот набор входят:

  • Инструментальное средствData Conversion Tool, позволяющее определять правила очистки и преобразования данных, а также генерировать программы получения данных.
  • Готовые библиотекData System Libraries (DSL) для всех основных операционных сред и баз данных, включая SAP, IDMS, IMS, VSAM и все ведущие реляционные СУБД. В библиотеке DSL определяется родной для соответствующей базы данных метод доступа, который будет использоваться для обработки данных, грамматика для генерации прикладных программ и деловые правила, доступные в Data Conversion Tool.
  • Набор инструментальных средстMaster ToolSet для расширения, создания и обслуживания библиотек DSL.

IBM совместно с ETI работает над оптимизацией библиотеки DB2 DSL (в частности, для поддержки параллельной загрузки), а также над интеграцией EXTRACT с Visual Warehouse в целях поддержки обмена метаданными и использования программ EXTRACT в планировании. Одним из ключевых преимуществ интеграции EXTRACT с Visual Warehouse является поддержка дополнительных источников данных и прикладных пакетов, таких как SAP.

Integrity от Vality Technology позволяет повысить качество данных

Инструментальное средство реорганизации данных Integrity от Vality Technology дополняет Visual Warehouse и ETI*EXTRACT функциями анализа содержимого данных, извлекаемых из операционных систем, и повышения качества данных перед их загрузкой в хранилище данных. В процессе реорганизации в полученных из различных систем данных выявляются уникальные информационные объекты, что позволяет производить слияние, урегулирование или объединение данных, даже если отсутствует общий ключ для осуществления слияния. Важные метаданные, получаемые в ходе данного процесса, могут использоваться для проверки и корректировки модели данных в информационном хранилище. Как и в случае с ETI, IBM ñîâìåñòíî ñ Vality работает над интеграцией Integrity с Visual Warehouse в целях поддержки обмена метаданными и планирования программ.

Управление данными

DB2 Universal Database поддерживает параллельную обработку

Управление данными в деловой интеллектуальной системе обеспечивает СУБД DB2 Universal Database, которая поддерживает интеллектуальное разделение данных, а также параллельную обработку запросов и утилит на широком спектре мультипроцессорных аппаратных платформ IBM и других производителей. Кроме того, в DB2 Universal Database поддерживается параллелизм на уровне разделов и каналов, операторы SQL CUBE и ROLLUP, предназначенные для он-лайновой аналитической обработки, встроенные средства репликации данных, динамическая битовая индексация, определяемые пользователем типы данных и определяемые пользователем функции.

Расширение DB2 Spatial Extender обеспечивает управление геопространственными данными

С помощью расширения DB2 Spatial Extender в реляционной СУБД можно обрабатывать геопространственные данные. Данный продукт является совместной разработкой IBM и Environmental Systems Research Institute (ESRI), ведущего разработчика географических информационных систем (GIS). На первом этапе IBM предлагает расширение DB2 Spatial Extender для DB2 DataJoiner, но в будущем планирует включить функциональные возможности этого расширения в состав следующей версии DB2 Universal Database. Инструментальные средства и приложения в категории географических информационных систем могут использовать для доступа и анализа геопространственных данных либо API-интерфейс ESRI, либо интерфейс SQL. Существующие инструментальные средства и приложения, поддерживающие API-интерфейс ESRI, также смогут без изменений работать с DB2 Spatial Extender.

Заключение

 

В данном документе мы рассмотрели структуру, направления разработки и продукты IBM в составе деловой интеллектуальной системы. Можно выделить следующие пять основных аспектов стратегии и целей построения такой системы:

  1. Быстрое и эффективное с точки зрения затрат развертывание специфичных для отрасли деловых приложений.
  2. Интегрированное сквозное решение, в состав которого входят продукты и услуги как IBM, так и деловых партнеров IBM.
  3. Самые передовые информационные технологии и технологии систем поддержки принятия решений.
  4. Масштабируемое аппаратное и программное обеспечение.
  5. Многоуровневая разнородная деловая информационная система, поддерживающая базы данных IBM и других поставщиков.

С появлением деловых интеллектуальных систем третьего поколения решение IBM идеально подходит на роль одного из лидеров с точки зрения инструментальных средств и приложений нового поколения, позволяющих деловым пользователям получать всю информацию, необходимую им для управления своей организацией.


Сведения о Database Associates International, Inc.

Database Associates International – работающая в сфере консалтинга и обучения компания, специализирующаяся на передовых технологиях в области баз данных, распределенной обработки данных, хранилищ данных и технологий Web.

Cкачать статью в .pdf формате

 Обсудить на форуме   Написать вебмастеру 

© 2001 Interface Ltd