Методология тестирования модели

Энциклопедия торговых стратегий

Методология тестирования модели

Методология тестирования модели на основе обращенного Медленного %К Модель выполняется со значением mode - 1 для получения набора фактов. Набор фактов загружается в N-TRAIN - набор для разработки нейронных сетей Scientific Consultant Services (516-696-3333), масштабируется и перетасовывается, как это необходимо при разработке нейронной сети. Затем обучается набор сетей, начиная с маленькой и кончая весьма большой; в основном это простые 3-слойные сети. Также обучаются две 4-слойные сети. Все сети тренируются до максимальной конвергентнос-ти и затем "полируются" для удаления мелких отклонений или сдвигов. Процесс "полировки" обеспечивается снижением интенсивности обучения до очень низкой и еще примерно 50 прогонами после этого. В табл. 11-1 приводится информация о всех сетях, обучавшихся для этой модели, с коэффициентами корреляции и другими показателями. В таблице указаны название файла, содержащего сеть, размер - число слоев и число нейронов в каждом из слоев, число связей в сети, оптимизированных при обучении (подобно количеству коэффициентов регрессии при множественной регрессии и их связи с излишней подгонкой под исторические данные), и корреляция - множественная корреляция выхода сети с его целевым значением. Скорректированные на излишнюю подгонку под входные данные значения корреляции занимают два столбца: в левом - коррекция исходя из обучения на наборе в 40 000 точек данных, в правом - исходя из 13 000 точек. Последние строки содержат реальное количество точек данных, а также их количество, предполагаемое при расчете коррекции. Количество точек данных, использованное при расчете коррекции коэффициентов корреляции, меньше, чем реальное их количество в наборе для обучения. Причина в повторяемости фактов, а именно в том, что факт, основанный на некоторой точке данных, с большой вероятностью будет весьма подобен факту, основанному на соседней точке. Из-за этого "эффективное" число точек данных в отношении статистически незави симой информации будет уступать реальному. Мы использовали два разных прореживания данных, представленных в двух столбцах. Процесс коррекции корреляций подобен процессу коррекции вероятностей множественных тестов при оптимизации: при прогонке параметра через ряд значений полученные результаты для соседних значений, скорее всего, будут подобны, что снижает эффективное количество тестов по сравнению с реальным. Назад

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60