Сегодня практически во всех отраслях экономики существует тенденция к применению Data-driven подхода, использующего анализ Big Data. Благодаря анализу множества несвязанных фактов, вырабатываются неочевидные подходы и нестандартные решения самых разнообразных задач, предсказываются будущие тренды. Не обошло это и биржевую торговлю. Но так ли всегда безопасно полагаться на алготрейдинг нам сегодня расскажет кандидат экономических наук, доцент кафедры математики и анализа данных Финансового университета при Правительстве РФ Фомичева Татьяна Леонидовна.
С того момента, как биржевые торги стали проводиться в электронной форме, пошел процесс их автоматизации. Сначала это были простые программы, отслеживающие движение определенного актива и отдающие команду на покупку/продажу при достижении определенных условий. Постепенно программы усложнялись, отслеживали все большее количество активов одновременно, принимая во внимание не только биржевые котировки, но и новостные сообщения, способные повлиять на курс активов. Современные алгоритмические торговые модели анализируют тысячи новостей, миллионы сделок и способны предвидеть тенденции рынка. Можно выделить следующие основные направления алготрейдинга.
1. Разделение сделки. Если сделка слишком крупная, чтобы исполнить ее одномоментно, она делится на несколько под-заявок, отправляемых на рынок в определенное время, а программа следит за их оптимальным выполнением. Основная цель - не столько получение прибыли, сколько минимизация затрат на исполнение, снижение влияния на рынок и риска неисполнения.
2. Высокочастотная торговля. Скорость работы компьютеров многократно превышает человеческие возможности, поэтому алгоритмическая программа за короткое время совершает миллионы сделок. Да, за это время котировки меняются незначительно, и прибыль с одной сделки невелика, но за счет количества она становится значительной.
3. Торговые роботы. Это практически та же старая стратегия тейк-профит и стоп-лосс, только на новом технологическом уровне.
4. Анализ данных. Это наиболее новая и перспективная возможность, когда из анализа Big Data программа находит новые закономерности и возможности получения торговой биржевой прибыли.
Налицо преимущества применения алгоритмической торговли:
- автоматизация торгов;
- скорость проведения сделок;
- эффективность;
- исключение человеческого фактора, в частности, эмоциональных решений.
Казалось бы, создаешь алгоритмическую платформу, учитывающую массу всевозможных влияний на рынок, и пожинаешь плоды успеха. Но как раз тут и кроется самая большая проблема, поскольку рынок - это не идеальная, а хаотичная система, развивающаяся и самообучающаяся. Модель мы всегда строим на уже произошедших событиях, а рынок постоянно движется в будущее. Поэтому, очень часто, корректно работающий на прошлых данных алгоритм, не выдерживает столкновения с реальностью. По статистике, только около десяти процентов гипотез выдают стабильные и достоверные результаты после всех проводимых тестов. 90% отсеиваются из-за смещений в данных, пройденных переобучений модели, простого случайного совпадения. Но именно такой подход, основанный на строгой дисциплине проверки и отказе от иллюзорных ожиданий, делает Data-driven систему достоверной и эффективной.
Альфа и омега построения успешной алгоритмической трейдинговой системы - это качество данных. Специалисты считают, что это 50%, но зато 90% проблем и, что побеждает не тот, кто нашел «правильный» алгоритм, а кто корректно «вычистил» данные. Так, чтобы создать объединенную базу данных по индексу S&P 1500 Composite Index, было затрачено полгода усилий, т.к. разные источники могут противоречить друг другу, например, дата отчета могла различаться на один-два дня, что ломало весь результат. Для повышения достоверности использовались метод голосования между источниками, индикаторы ожидаемой волатильности, кросс-чеки.
Существует целый ряд так называемых «ловушек данных». Самая распространенная из них - «переобучение» (пере-, в смысле «слишком», «излишне»), когда модель показывает полное совпадение данным обучающей выборке, но не соответствует реальным данным. Причина — многократные оптимизации гиперпараметров, короткие тестовые выборки и случайные совпадения. Чтобы избежать ее вводится математическая оценка проверки случайности получения результата. Проводятся многократные стресс-тестирования в симуляции большого количества случайных сценариев. Другая - «ошибка выжившего» - модель может показывать идеальный тест на компаниях, существующих до сих пор. Но при включении обанкротившихся или делистинговых компаний, получаются ошибки. Третья ловушка - тест «знает будущее». При использовании даже единичных данных из будущего, тестирование теряет смысл. Поэтому модель должна получать исключительно данные, реально существовавшие на дату их релиза. Соответственно, вся база данных должна быть синхронизирована по времени. Еще одна - множественное тестирование. Статистически, при проверке 100 гипотез, по крайней мере одна покажет превосходный результат. Поэтому необходимо оценивать достоверность предлагаемых гипотез.
Дополнительно проводятся стресс-тесты на кризисных периодах - 2008 и 2020 годы. Только самые надежные предположения проходят такую проверку. Именно они становятся основой стратегий торговых алгоритмов.
Другая проблема в том, что финансовая доходность алготрейдинга не следует нормальному закону распределения - присутствуют «жирные хвосты», частые экстремумы, перекосы. При оценке их стандартными метриками возникает недооценка рисков и переоценка стабильности.
Поэтому для надежной оценки необходимо модифицировать изначальные формулы, чтобы учитывались искажения распределения, множественное тестирование, возможное переобучение, а результат обосновывал статистическую устойчивость стратегии.
Фактически, успешно построенный торговый алгоритм представляет из себя не единичную стратегию, выраженную математической формулой, а целую экосистему, пронизанную сложной архитектурой проверок: качество данных, контроль смещений, стресс-тесты, оценка устойчивости, адаптивность к новым условиям.
Фондовый рынок постоянно развивается (в независимости от того растет он или падает) - меняются игроки, регулятор меняет правила, возникают новые активы (например, криптовалютные) и т.д., Следовательно, любая модель рынка, даже учитывающая максимальное число возможных параметров, рано или поздно устаревает и перестает быть релевантной. У вас должна быть выстроена система фильтров и «сторожевых флажков», которая обязана вовремя показать, когда модель перестала корректно работать.
Решающим преимуществом алгоритмической торговой системы является ее достоверность. Это важнее, чем краткосрочная доходность, потому что в долгосрочной перспективе победа останется за теми, кто объективнее отражает реальность.