Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Поиск редких распадов в LHCb на примере $B_s -> \mu\mu$

Поиск редких распадов в LHCb на примере $B_s -> \mu\mu$

Searching for rare decays at LHCb may look cryptic. Might be, but it is fun and rewarding as well!

part of Data-n-Science workshop series at https://events.yandex.ru/events/ds/17-sept-2016/

Andrey Ustyuzhanin

September 17, 2016
Tweet

More Decks by Andrey Ustyuzhanin

Other Decks in Science

Transcript

  1. Поиск редких событий в LHCb на примере распадов B →

    μ μ , B → μ μ Андрей Устюжанин1,2 2016-09-17, Data & Science, Yandex 1Школа Анализа Данных Яндекса, 2Высшая Школа Экономики НИУ s + − 0 + −
  2. Зачем искать редкие распады? Стандартная модель - проверенная теория взаимодействия

    сил и частиц микро- мира, НО существует ли анти-нейтрино? преобладание вещества над антивеществом? темная материя? Кандидаты на расширение стандартной модели (новая физика): суперсимметричные модели (SUper SYmmetry) нейтринная минимальная стандартная модель (νMSM) Leptoquarks ...
  3. Проверка гипотезы X выбрать нулевую (самую проверенную, консервативную) гипотезу предложить

    такой тип событий* (D), который должен происходить очень редко в соответствии с нулевой гипотезой, и гораздо чаще - в соответствии с гипотезой X количество наблюдаемых событий D - статистика, которую будем использовать для проверки гипотезы Х оценить количество событий D в соответствии со сравниваемыми гипотезами запустить эксперимент, в котором можно наблюдать события D; разрешающая способность установки позволит обнаружить и посчитать количество этих событий Идеальный результат? если мы нашли больше событий, чем предсказано нулевой гипотезой либо ошибка эксперимента (проверяется другим экспериментом) либо повод отвергнуть нулевую гипотезу (в зависимости от того, насколько больше) * Событие - регистрируемое проявление физического процесса, например, результаты распада частиц, столкнувшихся в коллайдере
  4. Свидетельство, открытие, cлучайность cчетный эксперимент: N - количество событий "выбранного

    типа" (D) события в коллайдере происходят независимо друг от друга в соответствии с пуассоновским распределением: в случае гипотезы "только фон": N ∼ Poiss(b), σ = * в случае гипотезы "сигнал + фон": N ∼ Poiss(s + b), σ = достоверность наблюдений (p − value) в физике частиц принято считать: ∣N − μ∣ > 3σ - свидетельство (p − value ≈ 0.003) ∣N − μ∣ > 5σ - открытие! (p − value ≈ 1/3000000) ∣N − μ∣ < 3σ - ¯\_(ツ)_/¯ * s - количество сигнальных событий, b - остальных (фоновых) √b √s + b
  5. Распады (каналы) B → μ μ , B → μ

    μ происходят очень редко в соответствии со стандартной моделью (подавлены): могут происходить гораздо чаще в соответствии с различными моделями новой физики (усилены) s + − 0 + −
  6. Модели (гипотезы) только фон стандартная модель 2HDM J. R. Ellis

    et al, JHEP 05 (2006) 063 MSSM J.Parry, Nucl. Phys. B 760 (2007) 38 Leptoquarks S. Davidson and S. Descotes-Genon, JHEP 11 (2010) 073 4th generation top Wei-Shu Hou, Masaya Kohda, Fanrong Xu, Phys. Rev. D87, 094005 (2013) D. M. Straub http://arxiv.org/pdf/1012.3893v2.pdf
  7. Предварительный отбор (триггеры) общее количество событий, наблюдаемых детектором за 2011-2012

    гг: ∼ 10 размерность каждого события ∼ 10 частота событий на входе триггера ~ 10 событий/секунду определение траекторий по хитам различных элеметов детектора, размерность 10 определение типов частиц (траекторий): мюон, каон, пион, протон, ... реконструкция, восстановление структуры распадов: 2 трека сходятся в одну точку - вторичная вершина вторичная вершина находится на расстоянии от первичной вершины (точки соударений протонов) частота событий на выходе триггера ~ 10 событий/секунду сохраняются в распределенной система хранения и обработки данных 15 7 7 4 4
  8. Отбор событий-кандидатов событие-кандидат - распад родительской частицы заданной массы на

    интересующие дочерние частицы. внутри одного события могут присутствовать несколько распадов 2 трека мюонов сходятся ∼ в одну точку (вторичная вершина) вторичная вершина находится на расстоянии от первичной вершины размерность "события-кандидата" - 10 инвариантная масса родительской частицы *, восстановленной из 2 мюонов, оказывается близкой к массам B или B ([4.9-6] ГэВ/c ) каждое событие-кандидат представляем вектором признаков, размерность ∼ 10 * вторичная вершина - точка распада частицы, породившей мюоны. поэтому эту частицу называют родительской частицей 2 s 0 2
  9. Сигнал: два мюона инвариантная масса в районе массы B ,

    B хорошо реконструированная вторичная вершина на заметном (~ 2мм) расстоянии от первичной вершины, импульс которой сонаправлен с направлением полета Фон: два распада B на μ и X распад B на μ и ошибочно идентифицированный мюон B → K μ ν Одиночные распады B: B → K K ... Сигнал, фон s 0 s − + s + −
  10. Признаки событий, B-мезон точка распада B - вторичная вершина распада

    1. время жизни B 2. IP - расстояние от траектории B до первичной вершины 3. pT - поперечный импульс в системе координат детектора 4. изоляция B 5. угол между импульсом B и P 6. угол между импульсом μ в системе покоя B и P в системе покоя B P - сумма импульсов всех треков, начинающихся из точки распада другого b- адрона thrust + thrust thrust
  11. Признаки событий, мюоны 1. минимальная значимость прицельного параметра 2. минимальное

    расстояние между 2 мюонами 3. изоляция трека 4. угол поляризации (the cosine of the angle between the muon momentum in the dimuon rest frame and the vector perpendicular to both the B candidate momentum and the beam axis) 5. модуль разницы между углами ϕ мюонов в сферической системе координат 6. модуль разницы между псевдобыстротой мюонов
  12. Сигнальные регион, боковой регион, слепой анализ ожидаем сигнал в районе

    инвариантной массы родительской частицы комбинаторный фон сигнал (hopefully) "пиковый" фон с двойной ошибкой идентификации вырезаем сигнальный регион и прячем до лучших времен боковые регионы - содержат только фон (различный) ВАЖНО: ожидаем, что распределение комбинаторного фона по массе должно принадлежать одному классу (e ) в сигнальном и боковом регионах −αm
  13. Использование машинного обучения не можем разметить сигнальные события в реальных

    данных! сгенерировать распады для сигнальных каналов конфигурация распада элементарных частиц отклик детектора на распады сгенерировать распады для фона провести сгенерированные данные через те же этапы отбора событий как и реальные события триггеры идентификация частиц реконструкция привести к признакам описания событий-кандидатов датасет из 12 колонок (признаков) с разметкой: 1 - сигнал 0 - фон
  14. Особенности обучения результат работы классификатора - оценка количества сигнальных событий,

    а не вероятности принадлежности отдельного события выбранному каналу другими словами, с помощью классификатора g мы хотим найти область G : g(x) > p, в которых находится как можно больше сигнальных (true positive) событий и как можно меньше фоновых (false positive) распределение фоновых событий, отобранных классификатором в сигнальном и боковых регионах, должно принадлежать одному классу, чтобы не создавать "искусственных пиков":
  15. Коррекция значений классификатора значения классификатора скорректированы так, чтобы распределение сигнальных

    событий по BDT (значениям классификатора) было равномерным для простоты работы весь интервал предсказаний разбит на 8 корзин
  16. Оценка качества классификатора 1. метрика, значимая для анализа, так как

    максимизирует силу статистического теста разделения гипотез - s/ или s/ *, NB: нестабильна, зависит от выбора порога на значение классификатора 2. ROC - удобная для интерпретации, но слишком сложная (многомерная) для автоматического сравнения, не является метрикой 3. ROC AUC - стабильная, простая, не отражает нюансы работы похожих моделей 4. взвешенная ROC AUC (например, TruePositive [0, 0.5), w=2, TP in [0.5, 1.0], w=1), https://www.kaggle.com/c/flavours-of-physics (4) - лучше всего; для автоматической оптимизации классификатора используется ROC AUC. для последующего отбора - ROC * s - сигнал, TruePositive; b - фон, FalsePositive √b √s + b
  17. Нормировка оценка branching fraction канала * (BF) по числу наблюдаемых

    событий BF = C ⋅ BF ⋅ = α ⋅ N N - число событий в сигнальном канале (неизвестный BF) N - число событий в известном нормировочном (измеренный ранее BF ) C зависит от эффективности работы детектора, триггеров и других этапов отбора для сигнального и нормировочного каналов * branching fraction (парциальная ширина распада) - величина, показывающая как часто происходит распад родительской частицы по данному каналу signal norm N2 N1 norm 1 1 2 norm
  18. Оценки количества событий α = (9.01 ± 0.62)10 α =

    (2.40 ± 0.09)10 Ожидаемое количество событий в сигнальном регионе в соответствии со стандартной моделью: B → μμ : 40 ± 4 B → μμ : 4.5 ± 0.4 B →μμ s −11 B →μμ 0 −11 s 0
  19. Комбинаторный фон основной источник фона распадов вида bb → μμX

    оцениваем ожидаемое количество фоновых событий в сигнальном регионе, аппроксимируя экспоненциальное распределение комбинаторного фона, на сигнальный регион для каждого интервала на значения порогов классификатора при высоких значениях на порог классификатора практически исчезает
  20. Пиковые фоны в сигнальном регионе играет роль только B →

    h h (двойная мисидентификация мюонов) в боковых регионах, распады с одиночной ошибкой идентификации или 2 мюонами исходящими из одной вершины: B → π μ ν, B → π μμ B → K μ ν, B → π J/ψ(μμ)μν Λ → pμν прочие каналы вносят несущественный вклад + − ′ 0 − + 0/+ 0/+ s − + c 0/+ b
  21. Другие источники фона определение формы распределения канала на сгенерированном множестве

    данных нормированы на количество ожидаемых событий ожидаемое количество фоновых событий в интервале инвариантной массы [4.9- 6] ГэВ/c^2:
  22. Подсчет событий подсчет событий для области G : g(x) >

    0.7 BF(B → μμ) = (2.9 )10 (4σ) BF(B → μμ) = (3.7 )10 (2σ) Предсказания стандартной модели: BF(B → μμ) = (3.25 ± 0.17)10 BF(B → μμ) = (1.07 ± 0.10)10 https://arxiv.org/pdf/1307.5024v2.pdf s −1.1 +1.4 −9 0 −2.1 +2.4 −10 s −9 0 −10
  23. Дополнительные шаги (за рамками рассказа) оценка погрешностей (систематические, статистические) зависимость

    распада от времени оценка верхнего предела для B → μμ Дополнительные материалы статья LHCb, 2013, https://arxiv.org/pdf/1307.5024v2.pdf LHCb & CMS B2mu workshop, http://indico.cern.ch/event/265347/ статья LHCb и CMS в Nature, http://www.nature.com/nature/journal/v522/n7554/full/nature14474.html 0
  24. Влияние на новую физику (2012) http://bit.ly/2cQ2Xiq "The physics of quark

    flavors and the search for rare decays would be considered part of the Intensity Frontier. But the measurements are being done at the LHC, which is considered an Energy Frontier facility because it has the largest collision energy of any accelerator ever built, and the process is sensitive to the effects of putative particles of very high mass. This is just one example of physics measurements that cut across frontiers." Ken Bloom http://bit.ly/2cvoQbl
  25. За прошедшие 40 минут ... Использование редких явлений для проверки

    структуры реальности Шаги эксперимента проверки моделей выбор гипотез для сравнения, выбор распадов (каналов) отбор данных отделение сигнала от фона нормировка результатов на известные каналы * оценка вклада фоновых событий результаты вычисление branching fraction, заключительная оценка погрешностей проверка соответствия предсказаниям выбранных гипотез (оценка p-value) Вспомнили, что такое branching fraction, родительская частица, вторичная вершина, боковой регион, прицельное расстояние, комбинаторный фон, сила теста, нормировка Как используются классификаторы для поиска редких событий * - необязательные шаги
  26. Заключение http://bit.ly/2cQ3UqP первое точное измерение парциальной частоты распада B →

    μ μ за 25+ лет в мире совмещение подходов инженерии, физики, статистики, машинного обучения находится в хорошем соответствии со стандартной моделью мировой рекорд точности измерений s + −