Зміст
Дисперсійний багатофакторний аналіз являє собою сукупність різних статистичних методів, які призначені для перевірки гіпотез і зв`язку між досліджуваними факторами і певними ознаками, що не мають кількісного опису. Також подібна методика дозволяє визначити ступінь взаємодії факторів і їх вплив на певні процеси. Всі ці визначення звучать досить заплутано, тому давайте розберемося в них більш детально в нашій статті.
Критерії та види дисперсійного аналізу
Метод дисперсійного багатофакторного аналізу найчастіше використовується для пошуку зв`язку між безперервною кількісною змінною та номінальними якісними ознаками. По суті, дана методика являє собою тестування різних гіпотез про рівність різних арифметичних вибірок. Таким чином, її можна розглядати і в якості критерію для порівняння декількох вибірок. Однак результати будуть ідентичними, якщо для порівняння використовується лише два елементи. Дослідження t-критерію показує, що подібна методика дозволяє вивчити проблему гіпотез більш детально, ніж будь-який інший відомий спосіб.
Також не можна не відзначити той факт, що деякі види дисперсійного аналізу базуються на певному законі: сума квадратів міжгрупових відхилень і сума квадратів внутрішньогрупових відхилень абсолютно рівні. В якості дослідження використовується критерій Фішера, що використовується для детального аналізу внутрішньогрупових дисперсій. Хоча для цього необхідні передумови нормальності розподілу, а також гомоскедастичності вибірок-рівність дисперсій. Що стосується видом дисперсійного аналізу, то розрізняють наступні:
- багатовимірний або багатофакторний аналіз;
- однофакторний або одновимірний аналіз.
Не важко здогадатися, що другий розглядає залежність однієї ознаки і досліджуваної величини, а перший-базується на аналізі відразу декількох ознак. Крім того, багатофакторна дисперсія не дозволяє виявляти більш міцний зв`язок між декількома елементами, оскільки досліджується залежність відразу декількох величин (хоча проводити метод набагато простіше).
Фактор
Задумалися про методи проведення багатофакторного кореляційного аналізу? Тоді Вам слід знати, що для детального вивчення слід вивчити ті фактори, які контролюють обставини експерименту і впливають на кінцевий результат. Також під факторами можуть матися на увазі способи і рівні обробки значень, що характеризують конкретний прояв певної умови. У цьому випадку цифри подаються в порядковій або номінальній системі вимірювань. Якщо ж виникає проблема, пов`язана з угрупованням даних, доводиться вдаватися до використання однакових числових значень, що трохи змінює кінцевий результат.

Також слід розуміти, що кількість спостережень і груп не може бути надмірно великим, адже це призводить до надлишку даних і неможливості закінчити розрахунок. У той же час спосіб угруповання залежить не тільки від обсягу, але і від характеру варіювання певних значень. Розміри і кількість інтервалів в аналізі можуть визначатися за принципом рівних частот, а також однакових проміжків між ними. В результаті всі отримані дослідження будуть вказані в статистиці багатофакторного аналізу, яка повинна базуватися на різних прикладах. До цього ми ще повернемося в наступних розділах.
Призначення дисперсійного аналізу
Отже, іноді можуть виникати ситуації, коли необхідно порівняти між собою дві або більше різних вибірок. В цьому випадку логічніше за все буде застосувати багатофакторний кореляційно-регресійний аналіз, що базується на вивченні гіпотези і зв`язку різних факторів в ступені регресії. Також назва методики вказує на той факт, що в процесі дослідження використовуються різні складові дисперсії.

У чому суть дослідження? Для початку два або більше показників розбивають на окремі частини, кожна з яких відповідає дії певного фактора. Після цього проводиться ряд дослідницьких процедур на пошук взаємозв`язку різних вибірок і зв`язків між ними. Щоб більш детально розібратися в настільки складною, але цікавою методикою, рекомендуємо вивчити кілька прикладів багатофакторного кореляційного аналізу, наведених в наступних розділах нашої статті.
Приклад перший
У виробничому цеху є кілька автоматичних верстатів, кожен з яких призначений для виготовлення певної деталі. Розмір виробленого елемента являє собою випадкову величину, яка залежить не тільки від налаштувань самого верстата, але і випадкових відхилень, які неминуче будуть виникати в результаті виробництва деталей. Але як робітнику визначити правильність роботи верстата, якщо він спочатку виробляє деталі з браком? Правильно, необхідно придбати таку ж деталь на ринку і порівняти її розміри з тим, що виходить під час виробництва. Після цього можна регулювати обладнання таким чином, щоб воно випускало деталі потрібних розмірів. І зовсім не важливо, що є виробничий брак, адже він також враховується при розрахунках.

У той же час якщо на верстатах будуть певні показники, що дозволяють визначити інтенсивність регулювання (осей X і Y, глибини і так далі), то показники на всіх верстатах будуть абсолютно різними. Якщо вимірювання виявилися абсолютно однаковими, то виробничий брак можна не враховувати зовсім. Однак таке відбувається вкрай рідко, особливо якщо похибки вимірюються в міліметрах. Але якщо випущена деталь має ті ж розміри, що і стандарт, придбаний на ринку, значить ні про який шлюб не може бути й мови, оскільки при виробництві "ідеал" також використовувався верстат, що дає певні похибки, які напевно також враховувалися робочими.
Приклад другий
Для виготовлення певного приладу, що працює на електриці, необхідно використовувати кілька типів різної ізоляційного паперу: електротехнічну, конденсаторну і так далі. Крім того, апарат може бути просочений смолою, лаком, епоксидним складам та іншими хімічними елементами, що продовжують термін експлуатації. Ну а різні витоку під вакуумним циліндром при підвищеному тиску легко усуваються за допомогою методу нагрівання або викачування повітря. Однак якщо майстер до цього використовував лише по одному елементу з кожного списку, в процесі виробництва за новою технологією можуть виникнути різні труднощі. Причому, практично напевно, подібна ситуація буде викликана через одного елемента. Однак розрахувати, який саме фактор впливає на погану працездатність приладу, буде практично нереально. Саме тому рекомендується використовувати чи не багатофакторний метод аналізу, а однофакторний, щоб швидше розібратися з причиною несправності.

Звичайно ж, при використанні різних інструментів і приладів, які відстежують вплив того чи іншого фактора на кінцевий результат, дослідження спрощується в рази, проте обзавестися подібними агрегатами починаючому інженеру буде не по кишені. Саме тому рекомендується застосовувати однофакторний дисперсійний аналіз, що дозволяє виявити причину неполадок за лічені хвилини. Для цього буде достатньо поставити перед собою одну з найбільш ймовірних гіпотез, після чого почати доводити її шляхом експериментів і аналізу показників працездатності приладу. Досить скоро майстру вдасться знайти причину неполадок і усунути її, замінивши одну з вибірок альтернативним варіантом.
Приклад третій
Ще один приклад багатофакторного аналізу. Припустимо, що тролейбусне депо може обслуговувати кілька маршрутів протягом доби. На цих самих маршрутах працюють тролейбуси абсолютно різних марок, а оплату за проїзд збирають 50 різних контролерів. Однак керівництво депо цікавиться тим, яким чином можна порівняти між собою кілька різних показників, що впливають на загальну виручку: марка тролейбуса, ефективність маршруту і вміння працівника. Щоб побачити економічну доцільність, необхідно детально проаналізувати вплив кожного з цих факторів на кінцевий результат. Наприклад, деякі контролери можуть погано справлятися зі своїми обов`язками, тому доведеться найняти більш відповідальних співробітників. Більшість пасажирів не люблять їздити на старих тролейбусах, тому найдоцільніше використовувати нову марку. Однак якщо обидва ці фактори йдуть поряд з тим, що велика частина маршрутів є високо затребуваними, то чи варто взагалі щось міняти?

Завдання дослідника полягає в тому, щоб за допомогою одного аналітичного методу отримати якомога більше корисної інформації з приводу впливу кожного з факторів на кінцевий результат. Для цього необхідно висувати як мінімум 3 різних гіпотези, які доведеться доводити різними способами. Дисперсійний аналіз дозволяє вирішити подібні завдання в максимально короткий термін і отримати максимум корисної інформації, особливо якщо використовується багатофазний метод. Однак не забувайте про те, що однофакторний аналіз дає куди більше впевненості з приводу впливу того чи іншого фактора, оскільки він досліджує вибірку більш детально. Наприклад, якщо депо направить всі сили на аналіз роботи кондукторів, то можна буде виявити багато недобросовісних робітників на всіх маршрутах.
Однофакторний аналіз
Однофакторний аналіз-це сукупність методів дослідження, спрямованих на аналіз певного фактора на кінцевий результат в конкретному випадку. Також досить часто подібна методика використовується для порівняння найбільшого впливу між двома факторами. Якщо проводити аналогію все з тим же депо, то слід спершу проаналізувати окремо вплив різних маршрутів і марок тролейбусів на прибутковість, після чого порівняти отримані результати між собою і визначити, в якому напрямку буде найкращий розвивати станцію.

Крім того, не варто забувати про таке поняття, як нульова гіпотеза-тобто гіпотеза, яка не може бути відкинутою і на неї в будь-якому випадку впливають всі фактори з перерахованих в тій чи іншій мірі. Навіть якщо ми будемо порівнювати між собою лише маршрути і марки тролейбусів, від впливу професіоналізму кондукторів все одно нікуди не дітися. Тому навіть якщо даний фактор не піддається аналізу, про вплив нульової гіпотези забувати не варто. Наприклад, якщо ви вирішили дослідити залежність прибутку від маршруту, пускайте в рейс одного і того ж кондуктора, щоб показання виявилися максимально точними.
Двофакторний аналіз

Найчастіше дану методику також називають методом порівняння і використовують для того, щоб виявити залежність двох факторів один від одного. На практиці доведеться використовувати різні таблиці з точними показниками, щоб не заплутатися у власних розрахунках і впливах на них факторів. Наприклад, можна пустити за двома однаковими маршрутами два абсолютно різних тролейбуса в один і той же час, нехтуючи фактором нульової гіпотези (вибрати двох відповідальних кондукторів). В цьому випадку порівняння двох ситуацій буде максимально якісним, оскільки експеримент проходить в один і той же час.
Багатофакторний аналіз з повторними дослідами
Даний метод застосовується на практиці набагато частіше за інших, особливо якщо мова йде про групу початківців дослідників. Повторний досвід дозволяє не тільки переконатися у впливі того чи іншого фактора на кінцевий результат, але і знайти помилки, які були допущені в ході дослідження. Наприклад, більшість недосвідчених аналітиків забувають про наявність однієї або відразу декількох нульових гіпотез, що призводить до отримання неточних результатів в ході дослідження. Продовжуючи приклад з депо, можна проаналізувати вплив тих чи інших факторів в різний сезон року, оскільки кількість пасажирів взимку сильно відрізняється від літнього. Крім того, повторний досвід може наштовхнути дослідника на нові ідеї і висунення нових гіпотез.
Відеоролик і висновок
Сподіваємося, наша стаття допомогла вам розібратися в тому, на чому заснований метод багатофакторного кореляційного аналізу. Якщо у вас досі залишилися якісь питання по даній темі, то рекомендуємо до перегляду невеликий відеоролик. У ньому у всіх подробицях розповідається про методи дисперсійного дослідження на певному прикладі.

Як бачите, багатофакторний аналіз-це досить складний, але дуже цікавий процес, який дозволяє виявити залежність певних факторів на кінцевий результат. Дана методика може застосовуватися абсолютно у всіх сферах життя і ефективно використовуватися для ведення бізнесу. Також модель багатофакторного аналізу можна використовувати для досягнення проривних завдань за допомогою простих методів.