Вы находитесь на страницах старой версии сайта. Перейдите на новую версию OLAP.ru |
Поиск по сайту | ||||||
Новости | ||||||
Основы OLAP | ||||||
Продукты | ||||||
Business Objects/ Crystal Decisions | ||||||
Каталог | ||||||
OLAP в жизни | ||||||
Тенденции | ||||||
Download | ||||||
| ||||||
Добыча текстаОрганизации, которые решили расширить уже имеющиеся у них возможности бизнес-интеллекта за счет использования технологии добычи текстовых данных, могут найти огромное количество важной информации, «спрятанной» во внешне бесполезных, неструктурированных текстах, таких как заметки и документы. Понятно, что неструктурированный текст может быть распределен по категориям и размещен в индексах, благодаря чему появляется возможность с пользой и неоднократно применять его в многочисленных бизнес-приложениях. Тим Филден, Computerworld Russia #1/2001, http://www.osp.ru/cw/ Перспективная технология помогает извлекать из текстов ответы на вопросыЕсли действительно все уже когда-то было написано, значит верно и то, что на каждый вопрос уже когда-то был получен ответ. Осталось только создать механизм поиска, который сможет найти эти ответы, вне зависимости от того, в какого вида документах они были изложены. Однако сегодня некоторые организации пытаются создать аналогичный инструментарий добычи данных для гораздо более сложного источника: неструктурированного текста. Подобный инструментарий очень нужен практически всем организациям, имеющим огромное (и постоянно растущее) число интерактивных документов, сообщений электронной почты и запросов, часто содержащих чрезвычайно важную информацию. Короче говоря, приложив эту технологию (примерно таким же образом, как аналитики используют добычу данных для обнаружения знаний или анализа тенденций) к неструктурированной текстовой информации, пользователь или приложения смогут анализировать текст с целью поиска определенной структуры и извлечения содержащейся в нем информации. Но что, если эту комбинацию поместить в базу данных, где содержатся ссылки из других комбинаций символов, такие как hello или даже bonjour? Тогда можно было бы проводить поиск среди всех сообщений электронной почты и создать список всех, с кем здоровался пользователь, причем на любом языке. Потенциальные возможности этой технологии поражают воображение. К сожалению, и усилий для ее создания требуется много. Производители, от IBM, предлагающей систему Intelligent Miner, до SAS Institute с ее Enterprise Miner, начинают предлагать широкий выбор инструментальных средств текстового анализа, компоненты полнотекстового поиска и инструментарий доступа в Web для расширяемых решений управления знаниями и приложений бизнес-интеллекта (business intelligence). Есть надежда, что со временем данная технология будет усовершенствована до такой степени, что организации смогут широко использовать ее преимущества в бизнесе, поскольку она позволит приобретать недостающие знания для создания «интеллектуальной основы» информации вне зависимости от ее предназначения. Добыча текста, если она будет корректно реализована, приобретет особое значение в ближайшее пятилетие, как это произошло с добычей данных в 1990 году. © 2001 Interface Ltd |