Онлайн-эмуляторы SQL

Время от времени появляется потребность проверить или улучшить свои знания SQL. В этом могут помочь разнообразные сервисы, в которых предоставляют как задачи, так и эмуляторы SQL для проверки своих запросов. Свою-то базу данных поднимать совсем не хочется.

Хакатон по BI от myBI Connect

В ноябре-декабре ребята из myBI Connect (у них еще классный блог) организовали свой первый хакатон на тему BI-аналитики. Мы с коллегами (Сергей Чипкин и Илья Карабаев) поучаствовали в этом мероприятии и заняли почетное третье место. В этом посте хотелось бы поделиться своими впечатлениями от хакатона. Если кратко: было весело 🙂

Статистические поправки для мульти-вариантных тестов. Часть 2. FDR

Поскольку процедуры контроля FWER достаточно «жесткие», статисты пытались придумать что-нибудь еще, но в итоге доказали, что более мощных процедур для FWER построить нельзя: Без дополнительных предположений нельзя построить более мощную процедуру, чем метод Холма При независимости экспериментов нельзя построить более мощную процедуру, чем метод Шидака-Холма Зато можно сделать мощную процедуру для FDR — и, как […]

Статистические поправки для мульти-вариантных тестов. Часть 1. FWER.

В случае проведения A/B/../N теста возникает проблема множественной проверки гипотез. Грубо говоря, если мы фиксируем уровень значимости как 0.05, то вероятность ошибки первого года (отклонение верной нулевой гипотезы) будет 5%. И если мы проводим сотню таких экспериментов, то раз 5 мы получим ошибочное принятие альтернативы. Такие проблемы возникают, например, если мы проверяем у людей наличие […]

Шанс побить всех — теория

A/B эксперименты, на мой взгляд, один из самых мощных инструментов для проверки придуманных гипотез (относительно чего угодно — целевой аудитории, юзабилити, маркетинговых ходах и решениях, … ). Говоря об экспериментах, всегда возникает естественное желание оценить достоверность полученных выводов. Метод «на глаз», как правило, работает сомнительно. На помощь приходит «шанс побить» — та самая магия, которая […]

Метод принятия решений «И чё?»

С этим отличным методом впервые познакомилась в книге Авинаша Кошика «Веб-аналитика 2.0. Анализ поведения посетителей на сайте». Поскольку книга печатная, и вообще автор не позволяет себе всякие вольности, в книге метод называется «ну и что?». Сути, однако, это не меняет, и суть состоит в следующем.

Виды статистических переменных и преобразование в числовой тип

Весь математический аппарат для анализа статистических данных работает исключительно с числовыми данными. Проверка гипотез, корреляционный, факторный, регрессионный анализ – все это понятия, обретающие четкий смысл, когда мы говорим о числовых выборках. Но исходные статистические данные выглядят совсем иначе. Например, простейший вид сбора – опросы населения – могут иметь такие поля как «возраст», «образование», «средний заработок», […]