В прошлой части мы рассмотрели теоретическую модель, лежащую в основе вычисления вероятности присутствия на рынке информированных трейдеров PIN. Продолжим с эмпирической реализации этой модели.
Для уменьшения пространства параметров модели, обычно предполагают, что частоты прихода ордеров на продажу ϵs и на покупку ϵb равны. В день "хорошей новости" вероятность наблюдения последовательности сделок купли и продажи соответствует:
exp(−(μ+ϵ)T)[(μ+ϵ)T]BB!exp(ϵT)(ϵT)SS!, где B и S - число сделок купли и продажи соответственно.
Для дней "плохой новости":
exp(ϵT)(ϵT)BB!exp(−(μ+ϵ)T)[(μ+ϵ)T]SS!.
И для дней с отсутствием новостей вероятность равна:
exp(ϵT)(ϵT)BB!exp(ϵT)(ϵT)SS!.
Предполагая, что торговая активность независима от одного дня к другому в течении T дней, вероятность торговой активности принимает форму:
L[{B,S}|θ]=(1−α)exp(−ϵT)(ϵT)BB!exp(−ϵT)(ϵT)SS!+αδexp(−ϵT)(ϵT)BB!exp(−(μ+ϵ)T)[(μ+ϵ)T]SS!+α(1−δ)exp(−(μ+ϵ)T)[(μ+ϵ)T]BB!exp(−ϵT)(ϵT)SS!
с пространством параметров θ=α,δ,ϵ,μ. За h независимых дней вероятность наблюдения M=(Bi,Si)hi=1 равна произведению дневных вероятностей:
L[M|θ]=∏hh=1L(θ|Bi,Si).
Для сходимости при численной максимизации преобразуем функцию вероятности следующим образом:
L[M|θ]=∑Ti=1[−2ϵ+Mtln(x)+(Bt+St)ln(μ+ϵ)]+∑Ti=1ln[α(1−α)exp(−μ)xSt−Mt+αδexp(−μ)xBt−Mt+(1−α)xBt+St−Mt]
где Mt=min(Bt,St)+max(Bt,St)/2,xt=ϵ/(μ+ϵ).
Найти параметры θ можно методом численной максимизации вышеприведенной вероятности (в заглавии поста приведены графики полученных параметров для акций NYSE с 1983 по 2009 год). После этого мы сможем найти индикатор информированной торговли PIN, который равен безусловной вероятности того, что информированные участники покупают или продают актив в каждый момент времени:
PINt=αμαμ+2ϵ.
Когда значение PIN велико, неинформированные трейдеры сталкиваются с высоким риском того, что их контрагент в сделках лучше информирован. В своих алгоритмах необходимо учитывать этот индикатор и предпринимать соответствующие действия при его высоком значении, например, снимать ордера, противоположные текущему направлению движения цены.
Пакет PIN языка R содержит функцию для вычисления логарифма вероятности торговой активности. На вход она принимает значения параметров - ϵ,μ,α,δ - и временную последовательность дневных данных с числом сделок купли и продажи, помещенных в матрицу размерностью n х w, где n - число торговых дней. Первая колонка матрицы содержит число сделок купли, вторая - число сделок продажи.
В следующей части мы рассмотрим практический пример с использованием языка R, где применим численную максимизацию упомянутой выше функции и получим значения параметров, а затем, соответственно, вычислим PIN.
Мне кажется, что тут ошибка в формуле вероятности L. Частота сделок (mu + eps) должна быть в числителе у покупок, когда вероятность событий = delta (хорошие новости). И наоборот в третьем слагаемом. Соответственно возможно, что далее она неверно была прологарифмирована. Ну и вычисления все мимо. Смотрел статью, там такая же ошибка.
там же так и есть ...