назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [ 65 ] [66] [67] [68] [69] [70] [71]


65

может дать значительно лучшие значения параметров.

Помимо рассмотренной простейшей модели можно привести примеры других в некотором смысле эквивалентных моделей статистики и нейросетевых парадигм

Таблица 2. Аналогичные методики

Нейронные сети

Статистические методы

Многослойный персептрон

Нелинейная (в т.ч. логистическая) регрессия, Дискриминантные модели

Автоассоциативный персептрон

Анализ главных компонент

Векторная квантизация

Кластеризация с А:-средними

Сети нейронов высоких порядков

Полиномиальная регрессия

Сеть Хопфилда имеет очевидную связь с кластеризацией данных и их факторным анализом.

/Факторный анализ используется для изучения структуры данных. Основной его посылкой является предположение о существовании таких признаков - факторов, которые невозможно наблюдать непосредственно, но можно оценить по нескольким наблюдаемым первичным признакам. Так, например, такие признаки, как объем производства и стоимость основных фондов, могут определять такой фактор, как масштаб производства. В отличие от нейронных сетей, требующих обучения, факторный анализ может работать лишь с определенным числом наблюдений. Хотя в принципе число таких наблюдений должно лишь на единицу превосходить число переменных рекомендуется использовать хотя бы втрое большее число значение. Это все равно считается меньшим, чем объем обучающей выборки для нейронной сети. Поэтому статистики указывают на преимущество факторного анализа, заключающееся в использовании меньшего числа данных и, следовательно, приводящего к более быстрой генерации модели. Кроме того, это означает, что реализация методов факторного анализа требует менее мощных вычислительных средств. Другим преимуществом факторного анализа считается то, что он является методом типа white-box, т.е. полностью открыт и понятен - пользователь может легко осознавать, почему модель дает тот или иной результат. Связь факторного анализа с моделью Хопфилда можно увидеть, вспомнив векторы минимального базиса для набора наблюдений (образов памяти - см. Главу 5). Именно эти векторы являются аналогами факторов, объединяющих различные компоненты векторов памяти - первичные признаки.

/Логистическая регрессия является методом бинарной классификации, широко применяемом при принятии решений в финансовой сфере. Она позволяет оценивать вероятность реализации (или нереализации) некоторого события в зависимости от значений некоторых независимых переменных - предикторов: Xi,...,Xn. В модели логистической регресии такая вероятность имеет аналитическую форму: Рг(х) =(l+exp(-z ))"\ где Z = ао+ aiXi+...+ ЯнХн. Нейросетевым аналогом ее очевидно является однослойный персептрон с нелинейным выходным нейроном. В финансовых приложениях логистическую регрессию по ряду причин предпочитают многопараметрической линейной регрессии и дискриминантному анализу. В частности, она автоматически обеспечивает принадлежность вероятности интервалу [0,1], накладывает меньше ограничений на распределение значений предикторов. Последнее очень существенно, поскольку распределение значений финансовых показателей, имеющих форму отношений, обычно не



является нормальным и "сильно перекошено". Достоинством нейронных сетей является то, что такая ситуация не представляет для них проблемы. Кроме того, нейросети нечувствительны к корреляции значений предикторов, в то время как методы оценки параметров регрессионной модели в этом случае часто дают неточные значения.

В то же время многие нейронные парадигмы, такие как сети Кохонена или машина Больцмана не имеют прямых аналогов среди статистических методов.

£У В каком-то смысле недоверие и даже "ревность" к нейросетевым методам в сообп];естве статистиков аналогичны такому же отношению, суп];ествовавшему в недалеком прошлом среди специалистов в области Искусственного Интеллекта. Теперь же значительную часть публикаций в журналах типа Artificial Intelligence (AI) или AI Expert составляют работы, посвяп];енные нейронным технологиям. В настояп];ее время в статистическом сообп];естве растет интерес к нейронным сетям, как с теоретической, так и с практической точек зрения. Это проявляется в инкорпорации нейросетевых средств в стандартные статистические пакеты, такие как SAS и SPSS.

Что лучше, статистические методы или нейронные сети?

Лучшим ответом на этот сугубо практический для прикладника вопрос является "/f depends". По-русски это означает "Все зависит от ситуации". Иногда, особенно если априорная информация о данных отсутствует, разумнее использовать нейронные сети. Такой выбор часто дает быстрое и качественное решение задачи, как правило не худшее, чем получаемое статистическими методами после тщательного изучения структуры данных.

12У Иногда высказывается такое мнение, что статистические методы предназначены для профессионтов, поскольку их использование требует основательной теоретической подготовки, в то же время, нейронные сети - это инструмент любителей, который можно быстро освоить и применять. Как бы то ни было, разработка нейросетевой системы анализа данных действительно может быть осуп];ествлена за значительно более короткое время (порядка нескольких месяцев) нежели создание аналогичной системы статистического анализа (требуюп];ее годы). Например, бизнес-стратег Дэниэл Баррас, автор "Technotrands: How to Use Technology to Go Beyond Your Competition" утверждает, что для того, чтобы остаться конкурентноспособным, деловой человек должен не только использовать инструменты будуп];его, но и использовать их по-новому. В частности, нейросетевые технологии снабжают людей экспертизой, которая прежде могла быть получена лишь в течении многих лет обучения и опыта.

При наличии дополнительных знаний о характере задачи статистические данные могут оказаться предпочтительнее. При сравнительном анализе возможностей нейронных сетей и статистических методов надо быть достаточно осторожными, поскольку иногда весьма сложные нейросетевые подходы сопоставляются с простыми статистическими моделями или наоборот. Существует мнение, что одинаково мощные статистические и нейросетевые подходы дают результаты одинаковые по точности и по затратам. Тем не менее, примеры решения действительно важных прикладных задач могут дать представление о возможностях того или иного подхода.

Очень важной является проблема диагностирования инфаркта миокарда в приемном покое. Опытные врачи правильно определяют это заболевание в 88% случаев и в 29% случаев дают ложную тревогу. Разнообразные статистические методы, включая дискргшинантный анализ, логистическую регрессию, рекурсивный аначиз распределений и пр. смогли лишь незначительно снизить число ложных тревог (до 26%). А вот Вильям Бакст, работаюп];ий на медицинском факультете университета в Сан-Диего, использовал для диагностики многослойный персептрон и повысил число правильно диагностированных инфарктов до 92%. Но более впечатляюп];им



Перекрестное опыление.

Конструктивный взгляд на взаимоотношение нейронных сетей и статистических методов заключается в том, что в общем случае они должны помогать друг другу и обогащать друг друга. Кристоф и Пьер Кувре назвали такой процесс перекрестным опылением.

£У Например, было показано, что нейросетевые классификаторы оценивают апостериорную Байесовскую вероятность и поэтому аппроксимируют оптимальный статистический классификатор с минимальной ошибкой. Подобная статистическая интерпретация значений выходов нейронной сети позволяет, в частности, компенсировать обычно существующие диспропорции в объемах примеров, представляющих в обучающей выборке различные классы.

его результатом было снижение числа ложных тревог до 4%(!). Заметим, что такое значительное уменьшение ложно-положительных реакций является достаточно типичным преимуществом использования нейронных сетей. Эта особенность стимулирует в настоящее время разработку нейросетевых систем диагностики рака молочной железы, для которой ложные диагнозы являются настоящим бичом.

Дэвид Эшби и Нед Кумар из Школы Бизнеса в Арканзасе сравнили результаты применения нейросетевой технологии и классического дискримшаитного антиза к предсказанию невыполнения обязательств по высокодоходным облигациям {"junk-bonds"). Такие облигации являются в настоящее время основным источником внешнего финансирования американских корпораций. Невыполнение обязательств означает либо потерю интереса к компании, либо потерю финансирования. Поскольку операции с такими облигациями носят ярко выраженный спекулятивный характер, то предсказание выхода их из игры представляет интерес для ее участников. Задача состоит в классификации облигаций на два класса: выполнят - не выполнят. Первичный набор признаков, характеризовавших каждую облигацию, включал 29 финансовых и рыночных показатели фирм, из которых после корреляционного анализа было отобрано 16. Линейный дискриминантный анализ позволил провести классификацию с точностью 87.5%, в то время как двухслойный персептрон (16 нейронов в скрытом слое) дал несколько лучший результат - 89.3% правильных ответов.

Нейронные сети помогают выявить связи между данными в тех случаях, когда статистические методы не справляются с задачей. Например, статистика не позволяет найти корреляцию в последовательностях ДНК двух бактериофагов РШХ174 и MIG4XX, хотя было известно, что они являются ближайшими родственниками. Использование сетей Хопфилда для поиска в этих последовательностях скрытых повторов (периодичностей), обеспечившее учет корреляций между нуклеотидными парами, не только показало несомненную близость геномов этих фагов, но и продемонстрировало, что они представляют собой гены, "сбежавшие" с комплементарных цепей ДНК-предшестенницы.

Почему статистики ревнуют специалистов по нейронным сетям, а не наоборот?

Среди так или иначе конкурирующих методологий (а нейронные сети и статистика имеют общую часть "электората" - анализ данных) как правило побеждает не более обоснованная и надежная, а та, что ставит новые задачи для исследования (Имре Лакатош). Нейрокомпьютинг гораздо более молодая отрасль знания нежели статистика. Он бросает многочисленные вызовы специалистам различных профессий: биологам, физикам, психологам, математикам и другим. Кроме того, сфера теории нейронных сетей гораздо шире анализа данных. Она включает в себя и моделирование мозга и разработку нейрокомпьютеров. Статистики не могут претендовать на соревнование в этих областях и ревностно следят за претензиями нейрокомпьютинга на их экологическую нишу.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [ 65 ] [66] [67] [68] [69] [70] [71]