Измерение токсичности потока ордеров. VPIN для HFT. Часть 1

Главная › High Frequency › Измерение токсичности потока ордеров. VPIN для HFT. Часть 1

Измерение токсичности потока ордеров. VPIN для HFT. Часть 1

uralpro$7022 28.05.2015 High Frequency, Алгоритмы, Публикации

(2 голосов, средний: 3,00 из 5)

Загрузка...

Ваш комментарий (1)

В статьях об индикаторе PIN мы определили, что на рынке присутствуют два типа трейдеров - информированные и неинформированные. Заявки неинформированных трейдеров всегда подвержены adverse selection risk со стороны информированных. Ситуация, когда после исполнения таких заявок цена движется в невыгодную для неинформированных участников сторону, называется токсичностью потока ордеров. Индикатор PIN служил для измерения этой токсичности, в данной статье мы рассмотрим усовершенствованный индикатор VPIN, который применим и для высокочастотной торговли. Цикл статей основан на публикации Maureen O’Hara "Flow Toxicity and Liquidity in a High Frequency World". Будет все описываться очень подробно, потому что, кроме нахождения непосредственно VPIN, в этой публикации много интересных выводов и фактов.

Из фундаментальных исследований о микроструктуре рынка известно, что процесс поступления ордеров информативен в отношении последующего движения цены в общем случае, и токсичности потока в частности. Извлечение этой информации, однако, затруднено из-за сложной природы высокочастотных рынков. Мы утверждаем, что в высокочастотной области привязка к сделкам более релевантна, чем привязка к текущему времени. Мы применим наши исследования к рынку фьючерсов, где информация более связана с систематическими факторами, отражающими процессы хеджирования или портфельной диверсификации.

Мы представим новую процедуру оценки токсичности потока заявок прямо и аналитически, основанную на процессе, зависимом от поступающих объемов , который назовем "синхронизированная по объемам вероятность информированной торговли" (Volume-Synchronized Probability of Informed Trading), или VPIN. Подход, основанный на VPIN, не требует промежуточной числовой оценки ненаблюдаемых параметров, как в случае с PIN, и обновляется в стохастическом времени, которое откалибровано по одинаковому объему сделок в каждый его промежуток. Таким образом, наша модель избегает трудности вычисления индикатора PIN на высокоактивных рынках и предоставляет аналитический способ измерять токсичность потока ордеров при использовании высокочастотных исходных данных.

Мы определим эмпирически статистические свойства VPIN и покажем, как объемное пакетирование ( таким образом, что каждый выбранный интервал времени содержит одинаковый объем сделок) снижает скачки волатильности (кластерность) в выборке. Так как большие движения цены ассоциируются с большими объемами, выборка по объемам является отражением выборки по волатильности. Результирующая временная серия наблюдений следует статистическому распределению, которое близко к нормальному и менее гетероскедастична, чем серии с одинаковыми временными интервалами (см. график в заглавии поста).

Применение и полезность VPIN будут демонстрироваться на фьючерсах E-mini S&P500 и фьючерсных контрактах на сырую нефть WTI . Также мы покажем, что VPIN имеет важную связь с будущей изменчивостью цены. Так как токсичность опасна для провайдеров ликвидности (маркет-мейкеров), высокие значения VPIN должны предупреждать о высокой волатильности. Мы увидим, что VPIN предсказывает краткосрочную, вызванную токсичностью, волатильность, частично связанную с большими движениями цены.

Оценка токсичности потока ордеров имеет множество практических применений. Маркет-мейкеры могут использовать VPIN в качестве инструмента управления риском в реальном масштабе времени. Применение VPIN трейдерами может ограничить успешность алгоритмов-хищников, получающих прибыль от атаки на провайдеров ликвидности. Также можно использовать VPIN для создания алгоритмов управления риском исполнения (execution control).

Модель

Микроструктурную модель рынка можно представить в виде игры между провайдерами ликвидности и трейдерами (потребителями ликвидности), которая повторяется на периодах i=1,...,I. В начале каждого периода возникает какое-либо информационное событие. События возникают независимо с вероятностью $\alpha$ . Если это хорошие новости, то информированный трейдер знает, что в конце периода цена достигнет уровня $\bar{S_i}$ , а если плохие, то уровня $\underline{S_i}$ , где $\bar{S_i}>\underline{S_i}$ . Хорошие новости возникают с вероятностью $(1-\delta)$ , и плохие, соответственно, с вероятностью $\delta$ . После того, как событие возникнет, или не возникнет, торговля в этот период начинается с прибытия трейдеров в соответствии с Пуассоновским процессом и далее в течение всего периода. В периоды с возникшим информационным событием заявки от информированных трейдеров поступают с частотой $\mu$ . Эти трейдеры покупают при хороших новостях и продают при плохих. В каждом периоде ордера на покупку и продажу от неинформированных трейдеров поступают с частотой $\epsilon$ для каждого вида заявки. Повышенные объемы покупки или продажи трактуются как торговля на основе информации и применяются для идентификации $\mu$ . Число периодов, где зафиксирована повышенная активность, используются для идентификации $\alpha$ и $\delta$ .

Провайдер ликвидности использует свои знания об этих параметрах для определения цены, по которой он хочет войти в длинную позицию, Bid, и цену, по которой войдет в короткую, Ask. Эти цены различны и формируют Bid-Ask Spread, так как маркетмейкер не знает, информирован его контрагент в сделке, или нет. Спред представляет собой разницу между ожидаемым значением актива при условии, что кто-то хочет купить его у провайдера ликвидности и ожидаемым значением актива при условии, что кто-то хочет продать его провайдеру на этом уровне. Эти условные ожидания различны по причине проблемы adverse selection, вызываемой возможным присутствием информированных трейдеров.

Провайдер ликвидности наблюдает за происходящими сделками и моделирует их так, если бы они следовали правилу Байеса, для обновления своих ожиданий о токсичности потока ордеров, который в нашей модели выражается через установленные параметры.Обозначим $P(t)=(P_n(t),P_b(t),P_g(t))$ ожидания провайдера о событиях "нет новостей" (n), "плохие новости" (b) и "хорошие новости" (g) в момент времени t. В момент времени 0 он ожидает $P(0)=(1-\alpha,\alpha\delta,\alpha(1-\delta))$ .

Для определения Bid и Ask в момент времени t , провайдер ликвидности обновляет свои ожидания в зависимости от прибытия ордера соответствующего типа. В момент времени t ожидаемое значение актива при условии произошедшей сделки до времени t равно:

$E[S_i|t]=P_n(t)S_i^*+P_b(t)\underline{S_i}+P_g(t)\bar{S_i}$

где $S_i^*=\delta\underline{S_i}+(1-\delta)\bar{S_i}$ - предыдущее ожидаемое значение цены актива.

Bid в таком случае равен:

$B(t)=E[S_i|t]-\frac{\mu P_b(t)}{\epsilon+\mu P_b(t)}(E[S_i|t]-\underline{S_i})$

Аналогично, выражение для Ask:

$A(t)=E[S_i|t]+\frac{\mu P_g(t)}{\epsilon+\mu P_g(t)}(\bar{S_i}-E[S_i|t])$

Эти выражения показывают отдельные роли, которые играют прибывающие ордера от информированных и неинформированных трейдеров в отношении их влияния на цену актива. Если информированные участники отсутствуют ( $\mu=0$ ), то сделки не несут информации и таким образом Bid и Ask равны предыдущему значению цены. В другом случае, если нет неинформированных трейдеров ( $\epsilon = 0$ ), тогда Bid и Ask равны минимальной и макимальной ценам соответственно. По этим ценам информированные трейдеры торговать не будут и торговля прекратится. В общем случае, и те и другие участники присутствуют на рынке, и тогда Bid меньше , а Ask больше, чем $E[S_i|t]$ .

Спред между Bid и Ask в момент времени t обозначим $\Sigma(t)=A(t)-B(t)$ . Тогда получим:

$\Sigma(t)=\frac{\mu P_g(t)}{\epsilon+\mu P_g(t)}(\bar{S_i}-E[S_i|t])+\frac{\mu P_b(t)}{\epsilon+\mu P_b(t)}(E[S_i|t]-\underline{S_i})$

Ключевой компонент модели это вероятность того, что ордер поступил от информированного трейдера, называемая PIN. Эту вероятность можно вычислить следующим образом (см. статьи о PIN):

$PIN=\frac{\alpha\mu}{\alpha\mu+2\epsilon}$

где $\alpha\mu+2\epsilon$ - частота поступления всех ордеров и $\alpha\mu$ - частота ордеров информированных трейдеров. PIN, таким образом, мера отношения ордеров информированных трейдеров к общему потоку ордеров и выражение для спреда показывает, что это ключевой показатель для определения спреда.

Эти формулы демонстрируют идею, что провайдеры ликвидности должны правильно оценивать PIN для определения оптимальных уровней, на которых они входят в рынок. Значительные изменения PIN приводят к потерям тех маркет-мейкеров, которые не корректируют свои цены в соответствии с этим показателем.

В следующей части мы перейдем к определению VPIN, усовершенствованной и легче вычисляемой метрикой по сравнению с PIN, и найдем все его параметры.

« Назад | Вперед »

1 Комментарии[ Ваш комментарий ]

noizium 04.09.2015 в 03:12

Пакет для R для таких вычислений https://cran.r-project.org/web/packages/FinAsym/index.html

Ответить

QuantAlgos

блог про биржевых роботов