В данной заметке — о двух важных статистических показателях (терминах) и о том, как это применяется на самом простом уровне.
Знаете ли вы, что средняя зарплата в России по данным Росстата составляет более 47 тысяч рублей?
Для многих это число покажется большим и неправдоподобным. Может быть, даже захочется задать вопрос: «где эти люди, которые зарабатывают так много?». Да, для кого-то эта цифра покажется нормальной (в основном для тех, кто зарабатывает больше среднего).
Но в любом случае у «простого среднего» есть один существенный минус. Он учитывает «точки-выбросы» или «аутлайеры» (outliers).
Если говорить житейским языком, то это старый добрый анекдот:
Чиновники едят мясо, я — капусту. В среднем мы едим голубцы.
Вариации, думаю, вы тоже знаете)
Если говорить про мир зарплат, то здесь это выглядит так: правления Газпрома и Роснефти делят на несколько своих членов по несколько миллиардов рублей в год. А работяге на заводе в небольшом провинциальном городе платят лишь несколько сотен рублей в день. В среднем зарплата по России 47 тысяч в месяц)
Мы здесь не будем обсуждать дела политические, так как наш блог вне политики. Разве что на выборы всегда советуем ходить, так как чаще всего власть получает тот, у кого больше голосов.
Мы будем обсуждать дела статистические. Речь идёт не о манипуляции статистикой, цель которой — ввести в заблуждение, а о нормальной статистике, цель которой — лучше понять ситуацию. И чтобы лучше понимать ситуацию, желательно избегать ситуации, когда несколько очень богатых людей получают много, и тем самым завышают средний показатель.
Как это сделать? С помощью медианы. Медиана — это середина. Середина статистического ряда.
Предположим, у нас есть 5 человек с зарплатами 1, 2, 3, 4, 15 рублей. Если взять среднее арифметическое, то оно будет равно (1+2+3+4+15)/5=5 рублям. Но понятно, что это формально правильные расчеты, но не очень показательный результат: из 5 человек четверо зарабатывают меньше среднего, и лишь один — больше среднего.
А вот медиана — середина ряда — будет намного более показательной. Из 5 упорядоченных чисел медиана будет, соответственно, третьим числом. То есть медиана такого ряда будет равна 3 рублям. И вот медианная зарплата в 3 рубля уже намного лучше передает понимание, что происходит.
Вернемся к зарплатам. По данным Forbes, средняя зарплата в России составила 47 657 рублей в месяц. Но медиана составила лишь 34 335 рублей в месяц. Видите разницу в 13 тысяч рублей? Это как раз из-за тонкой прослойки тех, у кого огромная зарплата.
Как интерпретировать эту информацию?
Если вы смотрите статистику, помните, что в ней могут быть точки-выбросы или аутлайеры, которые могут завышать (или занижать) средние показатели как в случае с мясом и голубцами. В случае с зарплатой, руководители Газпрома, Роснефти, других крупных компаний получают миллиарды, за счет чего происходит завышение показателей. Для того чтобы получить более реальную картину, лучше смотреть на медиану. Медиана — серединное (не среднее) значение, показывает, сколько зарплата у среднестатистического человека. В случае с зарплатами в реальности среднестатистический житель РФ получает не 47 тысяч рублей в месяц (средняя зарплата по РФ), а 34 тысячи (медиана).
Такой же подход можно использовать, если вы работаете и с другими статистическими данными. Математики всегда в данных считают сразу же не только среднее, но и медиану.