Проведение анализа данных - Управление впечатлениями потребителей в гостиничной индустрии

Описательная статистика позволит нам составить общее представление о характеристиках отелей. Опишем среднее значение для каждой независимой переменной, а также наиболее часто встречающуюся оценку для независимых переменных. Кроме того, опишем максимальное и минимальное значение для каждой переменной. Сделаем тот же анализ для зависимых переменных.

Количество желающих рекомендовать отель. 2 человека в среднем и чаще всего желали порекомендовать отель. Наибольшее число желающих порекомендовать отель равно 5 и это применимо для следующих отелей: БуддОтель Москва; Гостиница Интурист Коломенское.

Количество желающих посетить отель вновь. В среднем 3 человека собирались вернуться в отель, но чаще всего 2 человека отвечали, что собираются вернуться. Наибольшее число желающих вернуться равно 10 и это для Гостиницы Метрополь.

Чистота. Среднее значение этой переменной равно 8,7. Наиболее частое значение равно 8,7. Минимальное значение = 6,7; максимальное значение = 9,8 (Меркюр Москва Бауманская; Лотте Отель Москва).

Атмосфера. Среднее значение этой переменной равно 8,4. Наиболее частое значение равно 8,2. Минимальное значение = 6,5; максимальное значение = 9,7 (Лотте Отель Москва).

Месторасположение. Среднее значение этой переменной равно 8,7. Наиболее частое значение равно 9,1. Минимальное значение = 6,7; максимальное значение = 9,8 (Гостиница "Националь").

Инфраструктура. Среднее значение этой переменной равно 8. Наиболее частое значение равно 8. Минимальное значение = 6,3; максимальное значение = 9,3 (Лотте Отель Москва).

Персонал. Среднее значение этой переменной равно 8,4. Наиболее частое значение равно 8,5. Минимальное значение = 7,1; максимальное значение = 9,5 (Руссо Балт Отель).

Соотношение цены и качества. Среднее значение этой переменной равно 7,9. Наиболее частое значение равно 8. Минимальное значение = 6,7; максимальное значение = 9 (Гостиница Интурист Коломенское).

Бесплатный WiFi. На этот вопрос ответило 95,8% из всех ответивших респондентов. На этот вопрос ответило 98,9% из всех ответивших респондентов. Среднее значение этой переменной равно 8,2. Наиболее частое значение равно 8,3. Минимальное значение = 6,9; максимальное значение = 9,3 (Отель Де Пари).

Связь между желанием вернуться и характеристиками отеля

Итак, функция имеет вид:

Y=A+B1*X1+B2*X2+....+ Bn*Xn,

Где

Зависимая (у): Желание вернуться;

Независимые (х): Чистота, Атмосфера, Месторасположение, Инфраструктура, Персонал, Соотношение цены и качества, Бесплатный WiFi;

Содержательная задача - выяснить, как оценка типа впечатлений от отеля определяет желание человека вернуться в отель.

Применяется метод регрессионного анализа, при уровне значимости Альфа = 5%.

При помощи теста Колмогорова-Смирнова проводим проверку на нормальность распределения. Проанализировав график, можем считать, что остатки распределены нормально. Модель регрессии проходит по данному ограничению.

Проверка на гомоскедастичность распределения остатков. R2 не равен 1. Модель проходит по этому ограничению

Проверка на мультиколлинеарность. При помощи коэффициента корреляции Пирсона попарная проверка переменных. Проверка показывает, что наши переменные связаны между собой, что и можно ожидать от интернет-оценок.

: нормальность распределения остатков регрессии, исследующей связь между желанием вернуться и характеристиками отелей

Рисунок 8: Нормальность распределения остатков регрессии, исследующей связь между желанием вернуться и характеристиками отелей

Построение регрессии.

Оценка качества регрессии: R2=0,128, то есть Чистота, Атмосфера, Месторасположение, Инфраструктура, Персонал, Соотношение цены и качества, Бесплатный WiFi определяют желание человека вернуться в отель на 12, 8%.

Как следует из Таблицы 1 уровень значимости характеристик не позволяет судить о связи, поэтому проведем анализ при помощи метода корреляции Пирсона.

Таблица 1. Регрессионные коэффициенты для желания вернуться

Модель

Нестандартизованные коэфф.

Стандартизованные коэфф

T

B

Стнд. ош

Beta

(Constant)

-9,153

4,974

-1,840

Чистота

,000

1,194

,000

,000

Атмосфера

,616

1,105

,222

,557

Месторасположение

,705

,347

,291

2,030

Инфраструктура

-,589

1,453

-,190

-,405

Персонал

-,480

1,147

-,128

-,418

Соотношение цены и качества

1,042

,784

,285

1,328

Бесплатный WiFi

,177

,523

,059

,338

Наблюдается значимая (на уровне 10%) положительная связь:

Слабая связь между желанием вернуться и атмосферой (0,23);

Слабая связь между желанием вернуться и месторасположением (0,24);

Слабая связь между желанием вернуться и соотношением цены и качества (0,22)

Между остальными переменными (Чистота, Инфраструктура, Персонал, Бесплатный WiFi ) и желанием рекомендовать связь не значима.

Связь между желанием рекомендовать и характеристиками отеля

Здесь функция также имеет вид:

Y=A+B1*X1+B2*X2+....+ Bn*Xn,

Где

Зависимая (у): Желание рекомендовать;

Независимые (х): Чистота, Атмосфера, Месторасположение, Инфраструктура, Персонал, Соотношение цены и качества, Бесплатный WiFi; Содержательная задача - выяснить, как оценка типа впечатлений от отеля определяет желание человека рекомендовать отель.

Применяется метод регрессионного анализа, при уровне значимости Альфа = 5%.

При помощи теста Колмогорова-Смирнова проводим проверку на нормальность распределения. Проанализировав график, можем считать, что остатки распределены нормально. Модель регрессии проходит по данному ограничению.

: нормальность распределения остатков регрессии, исследующей связь между желанием рекомендовать и характеристиками отелей

Рисунок 9: Нормальность распределения остатков регрессии, исследующей связь между желанием рекомендовать и характеристиками отелей

Проверка на гомоскедастичность распределения остатков. R2 не равен 1. Модель проходит по этому ограничению.

Проверка на мультиколлинеарность. При помощи коэффициента корреляции Пирсона попарная проверка переменных. Проверка показывает, что наши переменные связаны между собой, что и можно ожидать от интернет-оценок.

Построение регрессии.

Оценка качества регрессии: R2=0,250, есть Чистота, Атмосфера, Месторасположение, Инфраструктура, Персонал, Соотношение цены и качества, Бесплатный WiFi определяют желание человека рекомендовать отель на 25%.

Как следует из Таблицы 2, уровень значимости характеристик не позволяет нам судить о связи, поэтому проведем анализ при помощи метода корреляции Пирсона.

Таблица 2. Регрессионные коэффициенты для желания рекомендовать отель

Модель

Нестандартизованные коэфф.

Стандартизованные

Коэфф

T

Знач.

B

Стнд. ош.

Beta

Константа

-8,119

3,819

-2,126

,039

Чистота

,740

,886

,384

,836

,408

Атмосфера

,357

,732

,210

,488

,628

Месторасположение

,149

,244

,104

,612

,544

Инфраструктура

-1,732

,930

-,928

-1,862

,070

Персонал

1,153

,802

,486

1,438

,158

Соотношение цены и качества

1,006

,562

,426

1,788

,081

Бесплатный WiFi

-,476

,337

-,277

-1,412

,165

Наблюдается значимая (на уровне 10%) положительная связь:

Слабая связь между чистотой и желанием рекомендовать (0,24);

Слабая связь между персоналом и желанием рекомендовать (0,27);

Средняя связь между соотношением цены и качества и желанием рекомендовать (0,32);

Между остальными переменными (Атмосфера, Месторасположение, Инфраструктура, Бесплатный WiFi) и желанием рекомендовать связь не значима.

Итак, в данной главе был сформулирован подход к исследованию впечатлений клиентов о пребывании в 95 различных отелях Москвы. Эти впечатления, с оценками от 1 до 10, были сформированы в группы факторов, оказывающих влияние на желание клиентов вернуться в гостиницу вновь, а также факторов, способствующих тому, чтобы клиенты отеля порекомендовали данную гостиницу другим людям.

Прежде всего, были установлены основные методы анализа данных: регрессионный анализ и корреляционный анализ. Затем на основе имеющихся данных было заключено, что необходимо проводить анализ построением классической линейной регрессии и подсчетом коэффициента корреляции методом Пирсона.

Далее, после выявления методов анализа данных было проведено описание данных. Установлено, что к основным способам описания данных относятся меры средней тенденции распределения значений признака и меры разброса значений признака. Описано, что первый включает в себя подсчет моды, квантили, медианы и среднего арифметического значения, а второй дисперсию, квартильный размах и меру качественной вариации. Решено, что в работе будут использоваться мода, среднее, максимальное и минимальное значение имеющихся данных.

Затем были проанализированы методы исследования шкал, использующиеся при исследовании базы данных. Отмечено, что существует 3 типа шкал: номинальная, порядковая и интервальная, а также обосновано, почему к данному исследованию подходит именно интервальная.

После этого была приведена классификация выборок для анализа данных: вероятностная и невероятностная. Установлено, что первая включает в себя такие типы как: простая случайная выборка, систематическая выборка, стратифицированная выборка и кластерная выборка, а вторая выборку доступных случаев, отбор "критических случаев"/"типичных случаев", метод "снежного кома" и квотную выборку. Было решено использовать невероятностную выборку с отбором "критических случаев" доступных случаев на основе отбора 100 отелей. Также отмечено, каким образом были сформированы данные для анализа - зависимые (желание вернуться и желание рекомендовать) и независимые (Чистота, Атмосфера, Месторасположение, Инфраструктура, Персонал, Соотношение цены и качества, Бесплатный WiFi) показатели переменных. Показано, какие ограничения есть в базе данных и проведена описательная статистика базы данных.

Затем, были проведены соответствующие расчеты на основе выбранных моделей и установлено, что единственным правильным методом анализа взаимосвязи между выбранными параметрами выступает расчет коэффициента корреляции Пирсона.

Наконец, было установлено, что для желания вернуться в отель значимыми является месторасположение, атмосфера, соотношение цены и качества. В свою очередь, для желания рекомендовать отель значимы характеристики соотношения цены и качества, качество работы персонала, а также чистота в отеле.

Похожие статьи




Проведение анализа данных - Управление впечатлениями потребителей в гостиничной индустрии

Предыдущая | Следующая