Коротко напомним, что такое гипотеза. Если вкратце — это предположение или возможное объяснение явления, которое можно подтвердить или опровергнуть.

Хорошая гипотеза позволяет вам сделать предсказание «Х влияет на Y».

Здесь Х и Y — это переменные. Когда вы формулируете гипотезу для исследования, важно понимать, какие переменные вы будете использовать. Переменные — это то, что может изменяться или измеряться в вашем исследовании. Они помогают лучше понять, как и почему происходят те или иные языковые явления.

  • Независимая переменная (X) — это то, что вы сами изменяете или контролируете, чтобы увидеть, как это влияет на языковое явление. Её называют независимой, потому что она не зависит от других факторов в вашем исследовании.
  • Зависимая переменная (Y) — это результат, который изменяется под влиянием независимой переменной. Её значение напрямую зависит от того, что вы изменили.

Вот пример:

Гипотеза: «Если анализировать употребление слова „товарищ” в разные десятилетия, то частота его использования снизится после 1990-х годов».

Независимая переменная: временной период (например, десятилетия).

Зависимая переменная: частота использования слова «товарищ».

В этом случае вы предполагаете, что частота употребления слова «товарищ» уменьшится после определённого периода, и проверяете это, используя данные Национального корпуса русского языка.

Далее мы покажем плохие гипотезы, объясним, что с ними не так, а затем улучшим их.

Плохая гипотеза №1: «Слово „пейджер“ больше не используется в русском языке».

Почему мы считаем её плохой

Эта гипотеза выглядит излишне категоричной и не допускает альтернативных вариантов. Использование абсолютных понятий, таких как «никогда» и «всегда», затрудняет её проверку, поскольку, несмотря на возможное редкое употребление слова, оно всё же может встречаться в текстах.
Гипотеза должна быть сформулирована таким образом, чтобы её можно было подтвердить или опровергнуть на основе полученных данных.

Как можно улучшить

«В XXI веке частота употребления слова „пейджер“ снизилась».
Теперь мы можем проверить эту гипотезу с помощью данных! Здесь независимая переменная — это временной период. Зависимая — частота употребления слова.

Плохая гипотеза №2: «И. С. Тургенев всегда описывает природу лучше, чем В. В. Бианки».

Почему мы считаем её плохой

Гипотеза субъективна и не может быть точно проверена. «Лучше» — оценочное суждение, которое трудно измерить объективно.

Исследования должны базироваться на чётких критериях, которые можно измерить.

Как можно улучшить

«И. С. Тургенев использует больше положительных прилагательных для описания природы, чем В. В. Бианки».
В этой гипотезе независимая переменная — автор (И. С. Тургенев и В. В. Бианки), а зависимая переменная — количество положительных прилагательных, используемых для описания природы.
Теперь гипотеза становится измеримой, то есть можно конкретно посчитать, сколько прилагательных с положительной, нейтральной или негативной коннотацией использовал каждый автор.

Плохая гипотеза №3: «Слово „интернет“ появилось после изобретения компьютера».

Почему мы считаем её плохой

Гипотеза не является исследовательской. Это, скорее, общеизвестный факт, который не требует проверки. Для хорошей гипотезы важно задавать вопрос, который можно исследовать, чтоб узнать что-то новое.

Как можно улучшить

«Частота употребления слова „интернет“ резко возросла в 1990-е годы».

Здесь независимая переменная — это временной период. Зависимая — частота употребления слова. Теперь эту гипотезу можно проверить с помощью данных Корпуса, исследуя рост популярности слова в конкретный временной период.

Плохая гипотеза №4: «Частота использования эмоционально окрашенных слов в текстах зависит от вдохновения автора».

Почему мы считаем её плохой

Гипотеза неконкретна и непроверяема, так как «вдохновение» невозможно объективно измерить, ведь нельзя залезть в голову к автору и понять, было у него вдохновение или нет. Хорошие гипотезы должны основываться на чётких переменных.

Как можно улучшить

«Частота использования эмоционально окрашенных слов выше в текстах художественной фантастики по сравнению с детективами».

Здесь независимая переменная — это жанр литературы (художественная фантастика и детектив), а зависимая — частота использования слов. Такая формулировка гипотезы даёт конкретные параметры для исследования, которые можно проверить с помощью анализа текстов разных жанров.

Думаем, вы поняли различия. Но на всякий случай мы подготовили для вас чек-лист, который поможет вам оценить свою гипотезу:

01. чеклист для оценки гипотезы.webp

Правильные и неправильные гипотезы

Ученые никогда не говорят о своей гипотезе как «правильной» или «неправильной». Вместо этого они говорят, что полученные данные «подтверждают» или «не подтверждают» гипотезу. Всегда есть вероятность, что новые данные или новые методы их обработки опровергнут гипотезу.

А если придумать эксперимент, который бы опроверг гипотезу, невозможно, то такие гипотезы и основанные на них теории называют не научными, псевдонаучными или лженаучными.

Вы можете потренироваться вместе с учениками: предложите им самостоятельно найти примеры ненаучных теорий и наградите того, кто вспомнил самую необычную.

Исследование №1: изучаем бытовую историю с помощью Корпуса

Настало время сформулировать гипотезу нашего исследования. Пусть она будет такой:

Если сравнить описания способов передвижения людей в текстах разных эпох, то можно выявить закономерности, связанные с развитием технологий.

Независимой переменной будет временная эпоха, потому что мы будем изменять разные временные периоды при поиске слов в текстах.

Зависимыми переменными могут стать:

  • количество упоминаний разных типов транспорта;
  • разнообразие (количество разных видов транспорта).

Кроме того, можно узнать о транспортных средствах, о которых вы не знали. Для этого выписывайте незнакомые слова в словарик.

Для анализа составим такие таблицы:

Таблица 1. Количество упоминаний разных видов транспорта

02. Таблица 1. Количество упоминаний разных видов транспорта.webp

Таблица 2. Разнообразие видов транспорта

03. Таблица 2. Разнообразие видов транспорта.webp

Составим таблицу для словаря:

Таблица 3. Словарь видов транспорта

04. Таблица 3. Словарь видов транспорта.webp

Исследование №2: сравниваем явление в текстах разных авторов, жанров и эпох

В этом исследовании мы сформулируем гипотезу так:

«Если проанализировать тексты А. С. Пушкина и М. Ю. Лермонтова, то увидим, что А. С. Пушкин описывает природу более позитивно и гармонично, а М. Ю. Лермонтов — в более мрачных и драматических оттенках».

Давайте её проверим.

Здесь важно определиться, как будет проводиться исследование. В нашем примере посмотрим, какие прилагательные чаще всего характеризуют различные природные объекты и явления у обоих авторов. Эти прилагательные отнесём к одной из трёх групп: светлые и позитивные; мрачные и негативные; нейтральные.

Таким образом, у нас:

  • Независимая переменная — автор текстов.
  • Зависимая переменная — коннотация прилагательных, используемых с разными природными объектами и явлениями.

Проведём исследование на материале корпуса «Русская классика» и сравним тексты двух авторов — А. С. Пушкина и М. Ю. Лермонтова.

Определимся, какие слова будут использоваться для сравнения.

Возьмём для примера слова «дерево», «горы», «лес». В идеале нам нужно было бы либо взять значительно больше слов, либо скорректировать гипотезу, сузив её, например, таким образом:

«Если проанализировать тексты А. С. Пушкина и М. Ю. Лермонтова, то мы увидим, что А. С. Пушкин описывает горы более позитивно и гармонично, а М. Ю. Лермонтов — в более мрачных и драматических оттенках».

Но это учебный проект, так что здесь высокая точность формулирования гипотезы менее важна, чем навык проведения исследования.


Отлично, гипотезы сформулированы, самое время собрать данные для их проверки. Займёмся этим в следующем параграфе.

Отмечайте параграфы как прочитанные чтобы видеть свой прогресс обучения

Подписывайтесь на канал Корпуса

Здесь вы узнаете об обновлениях и получите полезные советы по работе с Корпусом.
Вступить
Предыдущий параграф2.3. Изучение контекста
Следующий параграф2.5. Проведение эксперимента и сбор данных