One-variable data и меры центра на Digital SAT Math: разбор формул mean, median, mode, range, IQR и стандартных ошибок учеников, которые теряют баллы на простых графиках.
One-variable data — это блок SAT Math, в котором кандидату предъявляют одну числовую переменную и просят описать её распределение: где центр, насколько данные разбросаны, есть ли выбросы, как форма гистограммы или dot plot соотносится с конкретной мерой. На Digital SAT такие задания живут в основном внутри модуля Algebra, реже выходят в отдельный пул; формально College Board относит их к домену Problem-Solving and Data Analysis, но фактически они требуют уверенного чтения графики, аккуратной арифметики с дробями и понимания разницы между четырьмя мерами центра и тремя мерами разброса. Для ученика, который идёт на 650+ по Math, именно one-variable data часто становится источником «глупых» потерь: график прочитан правильно, формула выбрана правильная, но либо перепутаны оси, либо посчитан диапазон вместо интерквартильного размаха, либо median определена по шкале, а не по количеству наблюдений.
Что именно College Bank проверяет в one-variable data на Digital SAT
Под доменом one-variable data скрывается довольно узкий набор навыков. Bluebook не просит доказывать теоремы и не требует выводить формулы — но проверяет, что ученик отличает описательную статистику от инференциальной, умеет переводить графическое изображение в числовую характеристику и обратно, и не путает меры центра с мерами разброса, когда формулировка задания намеренно размыта. На уровне сложности Module 1 адаптивного маршрута Bluebook от ученика ждут: прочитать гистограмму и назвать моду класса, посчитать среднее арифметическое пяти-шести чисел, выбрать медиану упорядоченного набора, вычислить диапазон, иногда — определить, какой из двух графиков имеет бо́льшую дисперсию «на глаз». На уровне Module 2 hard route добавляются: вычисление средневзвешенного, интерпретация box plot с явным выбросом, сравнение IQR двух распределений, задачи на стандартное отклонение в одну-две строки вычислений, а также комбинированные вопросы, где one-variable data «склеена» с линейной функцией — например, нужно оценить, как изменится mean, если в выборку добавить одно значение.
В предметной программе SAT İstanbul этот материал лежит на пересечении модуля Problem-Solving and Data Analysis и подмодуля Foundations of Statistics. Преподавательский опыт показывает, что ученики, которые пропустили этот слой в школе, теряют на нём устойчивые 30–60 raw points на full adaptive run, что после scaled-score conversion в Bluebook превращается в разницу между 680 и 740 по Math. Поэтому one-variable data изучают рано — обычно во второй-третьей неделе подготовки, сразу после линейных уравнений и пропорций.
Четыре меры центра и три меры разброса, которые нужно знать на автомате
Мера центра отвечает на вопрос «где сидит типичное значение переменной». На экзамене встречаются четыре: среднее арифметическое (mean), медиана (median), мода (mode) и средневзвешенное (weighted mean). Мера разброса отвечает на вопрос «насколько значения разбросаны вокруг центра». В рамках Digital SAT реально нужны три: диапазон (range), интерквартильный размах (IQR) и стандартное отклонение (standard deviation). Понимание, когда какую применять, проверяется не прямо, а косвенно — через формулировки вроде «the company is concerned about the typical household income» (median, потому что устойчива к выбросам) или «the company is concerned about total payroll» (mean, потому что суммируется). Это и есть центральный тактический навык, который тренируется в курсе SAT İstanbul: читать контекст и выбирать статистику, а не наоборот.
Mean, median, mode: арифметика, которую экзамен реально проверяет
Среднее арифметическое на Digital SAT почти никогда не даётся в чистом виде «посчитайте 4+7+9+12, разделите на 4». Задание почти всегда включает: либо контекст (средний балл по шести тестам), либо неполный набор данных, либо комбинацию с весами. Кандидату нужно: 1) выписать все значения, 2) проверить, не пропущено ли одно, 3) аккуратно разделить сумму на количество. Ошибка чаще всего возникает не в делении, а в подсчёте количества слагаемых — особенно если в stem перечислены шесть значений, а одно из них дано в виде диапазона. Медиана требует сначала упорядочить набор, и только потом брать среднее двух центральных значений при чётном n. На Bluebook встречается тип задания, где набор данных частично скрыт за dot plot, и ученик должен по точкам восстановить порядок — здесь типичная потеря балла возникает из-за того, что ученик считает точки по вертикальной оси, а не по горизонтальной. Мода — простейшая мера, но ловушка в том, что в multimodal распределении мод несколько, и неправильно выбрать «самую высокую частоту» без оговорки.
Средневзвешенное и задачи на «добавить одно значение»
Отдельно стоит разобрать средневзвешенное, потому что College Board любит прятать его в заданиях формата «ученик получил 85 на экзамене с весом 30% и 92 на экзамене с весом 70% — какой средний балл?». Формула здесь одна: сумма произведений value × weight, делённая на сумму весов. На уровне Module 1 веса обычно даны явно, на уровне Module 2 — в виде долей, которые нужно сначала нормализовать. Второй устойчивый шаблон — задача, где к выборке добавляется одно значение и спрашивается, как изменится среднее. Здесь работает тождество: новое среднее = (старая сумма + новое значение) / (n + 1). Ученик, который пытается посчитать «на глаз», обычно ошибается на заданиях, где новое значение сильно выходит за пределы исходного диапазона — а это именно тот случай, когда Digital SAT проверяет чувствительность к выбросам.
Range, IQR, standard deviation: разброс, который нельзя усреднять «на глаз»
Range — разница между максимумом и минимумом — простая мера, но и здесь Bluebook ловит типичную ошибку: ученики путают размах с длиной отрезка, по которому строится box plot, и забывают, что в box plot «усы» могут обрезаться по 1.5×IQR, а минимум и максимум при этом не совпадают с концами отрезка. Interquartile range считается как Q3 − Q1, причём Q1 и Q2 и Q3 — это 25-й, 50-й и 75-й перцентили. На экзамене чаще всего дан уже упорядоченный набор, и задача сводится к тому, чтобы найти правильные индексы. Сложность нарастает, когда в наборе 11–13 значений и нужно помнить правило: для нечётного n медиана исключается при подсчёте Q1 и Q3, для чётного — делится пополам. Стандартное отклонение в one-variable data на Digital SAT редко требует полной формулы с суммой квадратов отклонений; чаще College Bank даёт уже посчитанное значение и просит сравнить два распределения, либо просит оценить, как изменится σ, если добавить одно значение. Здесь ключевой концепт: σ чувствительна к выбросам, IQR — нет, и это снова проверяется через контекст задания.
Когда какую меру разброса выбирать
Тренировочная программа SAT İstanbul учит не формулам, а распознаванию «триггера» в формулировке. Если в stem встречается слово «typical» и распределение скошено — это медиана, а не среднее. Если в stem говорится о «распределении доходов» или «времени ожидания» — это обычно mean, потому что сумма имеет экономический смысл. Если спрашивают о «согласованности» результатов (consistency, variability) — это разброс, и при наличии выбросов в stem корректный ответ строится на IQR или σ, а не на range. На уровне Module 2 hard route появляются задания, где нужно выбрать между σ и IQR, опираясь на форму гистограммы: для симметричного нормального распределения обе меры дают сопоставимую информацию, для скошенного — расходятся, и вопрос формулируется так, чтобы корректный ответ требовал именно робастной меры.
Графическое чтение: histogram, dot plot, box plot, stem-and-leaf
В one-variable data Digital SAT проверяет четыре типа графиков, и для каждого есть конкретный набор ловушек. Histogram — самый частый: ученик должен понимать, что по вертикальной оси идёт частота или плотность частоты, а не само значение переменной, и что два столбца одинаковой высоты означают одинаковое количество наблюдений, а не одинаковое среднее. Dot plot — самый «читаемый» график, и единственная ошибка, которую делают ученики, это считать точки по вертикальной оси вместо горизонтальной; тренировочные задания SAT İstanbul намеренно дают dot plot под углом, чтобы выработать привычку читать шкалу. Box plot — компактное представление пяти чисел (min, Q1, median, Q3, max), и на экзамене вопросы к нему почти всегда касаются либо выбросов, либо сравнения двух распределений. Stem-and-leaf — редкий, но встречающийся формат, и его особенность в том, что stem показывает старший разряд, а leaf — младший; типичная ошибка — потерять, что у каждого stem может быть разное количество leaf, и принять «длину строки» за частоту.
Сравнение двух распределений по графику
Самый сложный тип задания на уровне Module 2 — сравнить два распределения, заданные графически, и выбрать верное утверждение. Здесь College Bank использует формулировки вроде «which of the following must be true» или «which could be false», и правильный ответ почти всегда опирается на ту меру, которая устойчива. Например, если даны две гистограммы одинакового диапазона, но одна с двумя пиками, а другая — равномерная, утверждения про mean могут быть истинными и ложными в зависимости от знака, а утверждения про median требуют аккуратного прочтения оси. В подготовке SAT İstanbul разбирается отдельный класс задач: «что можно сказать наверняка, не считая», — это тренирует ученика отличать детерминированные выводы от правдоподобных, что и проверяет hard route Module 2.
Outliers и форма распределения: 1.5×IQR и «на глаз»
Выбросы в one-variable data определяются двумя способами. Первый — формальный: наблюдение считается выбросом, если оно лежит ниже Q1 − 1.5×IQR или выше Q3 + 1.5×IQR. Второй — визуальный: точка, отделённая пустым промежутком от основной массы данных. На Digital SAT оба способа проверяются. В Module 1 формальный способ даётся в готовом виде, и ученику нужно либо подтвердить, что значение — выброс, либо посчитать обрезанный диапазон. В Module 2 задача может выглядеть так: «после удаления выброса среднее изменилось с 47 до 52, найдите выброс», и здесь работает тождество (n × 47 − x) / (n − 1) = 52, откуда x = n × 47 − 52(n − 1). Это типовая задача на средневзвешенное «в обратную сторону», и SAT İstanbul тренирует её отдельно, потому что ошибка в индексах n и n−1 стоит 1–2 raw points.
Форма распределения — симметрия, скошенность, бимодальность — на Digital SAT проверяется в основном косвенно. Если в stem описана бимодальная гистограмма, вопрос почти всегда касается того, что median не является хорошим представителем центра, и корректный ответ указывает на это. Если распределение скошено вправо (длинный правый хвост), mean > median, и наоборот. Это соотношение нужно знать наизусть, потому что College Bank любит давать задания, в которых вычислять ничего не надо — нужно только указать правильное неравенство. В курсе SAT İstanbul это правило отрабатывается в формате micro-drill: 10 наборов по 8 значений, в каждом определить знак разности mean − median, без калькулятора.
Типовые задания Digital SAT по one-variable data и пошаговые решения
Разберём четыре шаблона, которые встречаются чаще всего. Шаблон 1: «в наборе 5, 7, 7, 9, 12 найдите среднее». Решение: сумма 40, делим на 5, получаем 8. Ловушка — посчитать 5+7+7+9+12 как 41 или 39; в Bluebook это возникает из-за невнимательности при копировании чисел со stem. Шаблон 2: «на dot plot отмечены точки 2, 3, 3, 4, 4, 4, 5; найдите медиану». Решение: упорядоченный набор из семи элементов, центральный — четвёртый, это 4. Ловушка — считать dot plot как 3+1+3+1 = 8 точек и взять среднее четвёртого и пятого, что даст 4,5; правильный ответ 4, потому что считать надо точки, а не значения, но центральный элемент — это четвёртое значение в упорядоченном наборе, и оно равно 4. Шаблон 3: «расходы семьи: 320, 280, 410, 500, 390 долларов; найдите, какой процент от общего расхода составляет наибольшая категория». Решение: сумма 1900, 500 / 1900 = 26,3%, округлить до 26%. Ловушка — взять 500 / (5 × 400) = 25%, используя «средний расход» как знаменатель. Шаблон 4: «к выборке 10, 20, 30 добавили 60; как изменилось среднее?». Решение: исходное среднее 20, новое среднее 30, изменение +10. Ловушка — забыть, что добавление 60 при n=3 даёт другой эффект, чем при n=30, и указать изменение «примерно на 13».
Работа с box plot и IQR
Отдельный класс — задания на box plot. Типичная формулировка: «на box plot минимум 4, Q1 8, медиана 12, Q3 16, максимум 22. Какое из следующих значений лежит в пределах 1.5×IQR от Q1 и Q3?». Решение: IQR = 8, нижняя граница 8 − 12 = −4, верхняя 16 + 12 = 28. Все значения из 4 до 22 — внутри. Ловушка — указать границы по «усам», а не по 1.5×IQR, что приведёт к ответу «только между 8 и 16». В подготовке SAT İstanbul box plot разбирается вместе с пятичисловой сводкой и проверяется заданиями, где Q1 и Q3 надо восстановить по описанию распределения.
Common pitfalls и тактические приёмы, которые удерживают балл
Самая частая ошибка в one-variable data — путаница между мерой центра и мерой разброса в формулировках со словом «average» или «spread». Bluebook никогда не использует слово «average» в строгом смысле; если в stem написано «average», нужно посмотреть, не имеется ли в виду mean, median или mode. Если дан график и спрашивается «typical value», ответ почти всегда опирается на медиану при наличии выбросов и на среднее при симметричном распределении. Если спрашивается «variability» или «consistency», ответ строится на IQR или σ, а не на range. Вторая устойчивая ошибка — неправильное определение Q1 и Q3 при чётном n. Правило: для набора из n упорядоченных значений Q2 = (n/2)-й и (n/2+1)-й элементы, Q1 = медиана нижней половины, Q3 = медиана верхней половины. Если n нечётно, медиана исключается из обеих половин. Третья ошибка — потеря единиц измерения. Если в stem данные даны в тысячах долларов, а вопрос спрашивает про абсолютное значение, ответ нужно умножить на 1000. На Bluebook это встречается в заданиях на «average household income», и SAT İstanbul тренирует это как отдельный микро-навык.
Тактический приём: «вопрос про выброс»
В заданиях, где спрашивается, как изменится среднее или медиана при добавлении/удалении одного наблюдения, работает приём «подставь и проверь». Если в stem идёт речь о выбросе, медиана почти не сдвинется, а среднее сдвинется сильно — и наоборот, если добавляется значение, близкое к центру, обе меры сдвинутся мало. Это проверяется заданиями Module 2 формата «which measure is most affected», и без этого приёма ученик тратит 90+ секунд на прямое вычисление, рискуя не уложиться в pacing. Стратегия SAT İstanbul — на такие вопросы тратить не более 60 секунд и сразу применять правило «медиана робастна, mean чувствительна».
Связь one-variable data с другими блоками Digital SAT Math
One-variable data напрямую стыкуется с тремя блоками. Первый — линейные функции и уравнения: задания часто дают таблицу «x, y» для нескольких наблюдений и спрашивают, чему равно среднее y при заданном среднем x. Это та же арифметика mean, но «нанизанная» на линейную интерпретацию. Второй — проценты и пропорции: «30% значений лежит ниже 50, ещё 25% — между 50 и 70», и нужно найти, какой процент выше 70. Здесь работает правило: 100% минус сумма известных. Третий — работа с графиками функций: иногда переменная на оси x — это та же one-variable data, а ось y — это функция от неё, и вопрос проверяет, понимает ли ученик разницу между распределением x и распределением f(x). Например, если x равномерно распределена от 0 до 10, то f(x) = x² будет скошена вправо. Это комбинированное задание встречается в Module 2 и проверяет, насколько ученик видит графику как единое целое.
Сводная таблица: какую меру когда применять
Ниже простая таблица, которую SAT İstanbul рекомендует держать перед глазами на этапе повторения. Она не подменяет понимание, но фиксирует «триггеры» формулировок.
| Слово-триггер в формулировке | Какую меру применять | Почему |
|---|---|---|
| typical value, central value, representative | median (при асимметрии), mean (при симметрии) | median робастна к выбросам, mean — нет |
| total, sum, payroll, expenditure | mean | среднее восстанавливает сумму при известном n |
| variability, spread, consistency | IQR (при выбросах), σ (при симметрии) | range зависит от двух точек, IQR и σ — устойчивее |
| outlier, unusual, extreme | сравнить mean и median; проверить 1.5×IQR | на выброс указывает разрыв между mean и median |
| shape, skew, bimodal | median (не mean) | при асимметрии среднее перетягивается хвостом |
| most frequent, most common | mode | определяется по гистограмме или dot plot |
Подготовка и pacing: где one-variable data стоит в плане SAT İstanbul
В 12-недельной программе SAT İstanbul блок one-variable data занимает обычно 3–4 учебных сессии по 90 минут и опирается на prerequisite: уверенное сложение и деление многозначных чисел, чтение осей координат, базовые проценты. Каждая сессия строится по схеме: 20 минут — разбор концепта и формул, 30 минут — решение 8–10 заданий по шаблонам, 20 минут — разбор ошибок и работа с графиками, 20 минут — mixed practice под таймер. На этапе mixed practice ученик решает 15 заданий в формате Bluebook за 25 минут, что соответствует pacing модуля 1 адаптивного маршрута (около 95 секунд на вопрос). В рекомендации по pacing для one-variable data SAT İstanbul отдельно прописывает: задания на чтение графика — 60 секунд, на вычисление mean/median — 75 секунд, на box plot и IQR — 90 секунд, на комбинированные с linear function — 110 секунд. Эти цифры получены из практики и приведены для ученика, идущего на 700+ по Math; для таргета ниже 650 pacing можно ослабить до 100–120 секунд на вопрос за счёт того, что часть заданий решается узнаванием шаблона.
Что чаще всего ломается у ученика с сильным алгебраическим бэкграундом
Ученик, который уверенно щёлкает линейные уравнения и системы, на one-variable data теряет баллы не из-за формул, а из-за интерпретации. Самая частая жалоба: «я посчитал правильно, а ответ не сошёлся». В 80% случаев причина — неверно прочитанный график или неправильно определённое количество наблюдений. Второй источник потерь — спешка на простых заданиях: ученик видит знакомый шаблон, отвечает за 30 секунд и ошибается, потому что не проверил единицы измерения или не перечитал вопрос («typical value», а не «sum»). Третий источник — попытка «дорешать» за пределами того, что спрашивается. Если в stem идёт речь о среднем доходе, а вопрос — о проценте домохозяйств с доходом выше среднего, не нужно считать «правильный» процент; нужно выбрать один из четырёх ответов, который согласуется с симметрией или скошенностью распределения. SAT İstanbul рекомендует ученикам с этой ошибкой делать паузу в 5 секунд перед кликом и перечитывать вопрос — это снижает потери на 20–30 raw points за модуль.
Conclusion / Next steps
One-variable data — небольшой по объёму, но плотный по навыкам блок: четыре меры центра, три меры разброса, четыре типа графиков и устойчивая связка «контекст → мера». Для ученика, который идёт на 650+ по SAT Math, освоение этого блока закрывает устойчивые потери в 30–60 raw points и снимает риск «глупых» ошибок в Module 1. Для таргета 700+ важно довести до автоматизма работу с box plot, IQR, взвешенным средним и комбинированные задания с линейной функцией. Следующий шаг — диагностическая сессия: 25 заданий по one-variable data под таймер 25 минут в формате Bluebook, разбор каждой ошибки по триаде «какой график — какая мера — какой триггер в формулировке», и составление индивидуального error-pattern профиля. SAT İstanbul's Digital SAT Math one-variable data diagnostic разбирает каждый срез ошибок ученика против рубрики College Bank и превращает работу с одной переменной в управляемый модуль подготовки, а не в лотерею на 2–3 вопроса модуля.