Обсяги цифрових даних зростають шаленими темпами, і до 2025 року, за прогнозами аналітичної фірми IDC, об’єм усіх даних у всьому світі складе 163 зеттабайт (ZB). Це в 10 разів більше, ніж загальний об’єм даних станом на 2016 рік.
Робота з даними такого роду (Big Data) потребує принципово нових умінь та інструментарію, адже їх неможливо опрацьовувати за допомогою традиційних баз даних чи статистичних пакетів, неможливо подавати за допомогою стандартних програм візуалізації. Дані стали більш різнорідними. Цифровий текст, звук та відео, дані сенсорів та блогів, як правило, хаотичні, неповні та неструктуровані.
DataScience (наука про дані) — це поєднання математичної статистики та програмування, призначене для вирішення сучасних задач IT-технологій, фінансів, оцінки ризиків.
Високий попит на фахівців із науки про дані (Data Scientists) та статистиків пояснюється невпинно зростаючим значенням збору та оцінювання значних обсягів даних у різних сферах діяльності.
Тому, порівнюючи з минулими роками, державне замовлення на підготовку бакалаврів за спеціальністю «Статистика» збільшено:
– у 2020 році на 26, 7 %;
– у 2019 році на 14, 3 %.
МАТЕМАТИЧНА СТАТИСТИКА – це розділ математики, який займається обґрунтованим аналізом даних. Слово “СТАТИСТИКА” походить від латинського слова status – положення, стан явищ і справ.
Статистика як наука
Спочатку термін “статистика” використовувався для кількісного опису економічного й політичного стану держави в числовій формі. І нині діяльність державних статистичних служб цілком укладається в це визначення.
А от сучасну математичну статистику позиціонують як розділ математики та інформатики, який розробляє методи реєстрації, опису та аналізу даних спостережень і експериментів з метою побудови ймовірнісних моделей випадкових явищ і процесів. Детальніше про математичну статистику