МВ 2.2.12.016-99

МВ 2.2.12.016-99 Математичні засоби формування системи оперативного контролю еколого-гігієнічного стану об’єкту, обумовленого роботою транспорту. Методичні вказівки

МІНІСТЕРСТВО ОХОРОНИ ЗДОРОВ'Я УКРАЇНИ ГОЛОВНЕ САНІТАРНО-ЕПІДЕМІОЛОГІЧНЕ УПРАВЛІННЯ ПЕРШИЙ ЗАСТУПНИК ГОЛОВНОГО ДЕРЖАВНОГО САНІТАРНОГО ЛІКАРЯ УКРАЇНИ Затверджено Постанова Першого заступника Головного державного санітарного лікаря України 09.02.1999 N 16 Державні санітарні правила та норми гігієнічні нормативи МВ.2.2.12.016-99 2. Комунальна гігієна 2.12. Стан здоров'я населення у зв'язку зі станом навколишнього природнього середовища та умов проживання Математичні засоби формування системи оперативного контролю еколого-гігієнічного стану об'єкту обумовленого роботою транспорту 1. Галузь застосування У МЗ пропонується оцінку стану об'єкту здійснювати обмеженим набором інтегральних показників що уявляються у вигляді рангових або угрозометричних шкал і розглядається засіб побудови таких показників на базі моделювання причинно-слідчих зв'язків аналізуємого об'єкту. МЕТОДИЧНІ ВКАЗІВКИ І ЗАГАЛЬНІ ПОЛОЖЕННЯ Методичні вказівки розроблені на допомогу практичним спеціалістам охорони здоров'я а саме санітарно-епідеміологічним станціям для формування систем оперативного контролю за станом навколишнього середовища. Актуальність проблеми обумовлена високим антропогенним навантаженням різноманітних транспортних засобів на навколишнє середовище та здоров'я населення. За даними відчизняної зарубіжної літератури та внаслідок власних досліджень встановлено що частка автомобільного транспорту в забруднені навколишнього середовища складає 78-90% запропонована нами методика збудована в основному на даних які залежать від роботи авто- та мототранспорту. Пропонується методологія побудови системи оперативного контролю еколого-гігієнічного стану конкретного об'єкту на базі інформації що міститься у систематичному та науковому моніторингу вищого рівня. При цьому припускається що запроектована система оперативного контролю припускається для рішення конкретних завдань конкретного об'єкту. Гігієнічні вимоги до природнього середовища не дозволяють визначити сумісну дію окремих факторів та одержати кінцевий результат впливу на навколишнє середовище і людину. У методвказівках пропонується оцінку стану об'єкту здійснювати обмеженим набором інтегральних показників що уявляються у вигляді рангових або угрозометричних шкал і розглядається засіб побудови таких показників на базі моделювання причинно-слідчих зв'язків аналізуємого об'єкту. Внаслідок виконання НДР: "Обгрунтування та розробка нормативно-методичної документації по державному моніторингу та прогнозу впливу транспорту на навколишнє середовище і здоров'я населення" обгрунтована концепція формування оперативного контролю еколого-гігієнічного стану об'єкту та виявлені основні причинно-слідчі зв'язки що можуть легти в основу створення оптимальної моделі подібного об'єкту. Система формується на базі вхідних даних обласних управлінь статистики при адміністрації областей України і переліку нормативних показників затверджених МОЗ України. Для цього слідує передбачити таку послідовність виконання роботи: 1 Постановка завдання побудови системи оперативного контролю і прогнозування; 2 Постановка завдання дослідження причинно-слідчих зв'язків компонентів системи; 3 Розробка засобу проведення досліджень для формування Бази Даних; 4 Статистичний аналіз інформації і моделювання; 5 Розробка моделі оперативного контролю і прогнозування. Таким чином коло питань що розглядаються цими вказівками обмежується розробкою математичного забезпечення системи оперативного контролю на етапах її формування та експлуатації. При цьому повинні бути вирішені три основні завдання розробки системи оперативного контролю санітарно-гігієнічного стану об'єкту: - побудова математичного опису причинно-слідчих зв'язків об'єкту; - визначення оптимального набору контролюємих показників що спостерігаються або узагальнених; - розробка алгоритму оцінки поточного або прогнозуємого санітарно-гігієнічного стану об'єкту що прогнозується. 2 ЕТАПИ ОБРОБКИ ІНФОРМАЦІЇ Аналіз інформації що надходить у вигляді анкет обстеження включає наступні основні етапи: 1. Збір корегування та зберігання вхідної інформації. 2. Подання вхідної інформації користувачу у зручному для огляду та якісного аналізу вигляді. Підготовка та відбір інформації для статистичного аналізу. 3. Статистичний аналіз інформації. 4. Подання результатів аналізу у вигляді форм вихідних звітних документів. Обробка інформації послідовно виробляється в Базі Даних інтегрованих пакетах статистичної обробки інформації та картографування табличних і текстових редакторах. З АЛГОРИТМИ ОБРОБКИ ІНФОРМАЦІЇ 3.1. Обробка інформації в Базі Даних У рамках бази даних повністю реалізується перший етап обробки інформації і частково завдання другого етапу зокрема: - можливість візуального контролю правильності впровадженої інформації та її корегування; - автоматичний контроль інформації за заданими користувачем межовими значеннями показників; - перетворення показників що спостерігаються до вигляду придатному для використання у розрахункових формулах оцінки показників захворюваності та факторів впливаючих на неї; - формалізований експорт набору перетворених показників. 3.2 Обробка інформації в статистичних пакетах 3.2.1 Попередній аналіз інформації. Вхідні перетворені показники піддаються якісному аналізу їх репрезентативності та додержання вхідних посилок застосування статистичних засобів аналізу: - Перевірка тимчасової стабільності набору даних за окремими роками нагляду. При відсутності часової стабільності недопустима статистична обробка згуртованого масиву даних. Апарат дослідження - розвідувальний аналіз типа "ящики з вусиками" в сумнівних випадках - дисперсійний аналіз. - Перевірка рядів вимірів на відсутність викидів. Апарат дослідження - розвідувальний аналіз типа "ящики з вусиками" в сумнівних випадках - дисперсійний аналіз. - Попередній відсів показників з низькою інформаційною спроможністю малий обсяг вибірки розкид показника сумарний з апріорною інформацією про помилку вірогідності . Апарат дослідження: графічний аналіз графік поточних наслідків спостережень гістограми розподілу розвідувальний аналіз типа "ящики з вусиками". 3.2.2 Аналіз одномірних рядів показників 3.2.2.1 Визначення статистичних характеристик: - середня арифметична; - середньоквадратичне відхилення; - середньоквадратичне відхилення середньої арифметичної; - довірчі межі показника; - довірчі межі середньої арифметичної; При оцінці вірогідності та довірчих меж статистичних характеристик використовувалися наступні алгоритми: В тому випадку коли розподіл показника не дуже відрізняється від нормального а обсяг вибірки не занадто малий на практиці n >= 30 середня квадратична помилка вірогідності середньої арифметичної визначається за формулою [1]: ---- s приблизно S / \| n 3.1 x x де s - генеральна середня квадратична помилка x вірогідності середньої арифметичної; S - виборочна середня квадратична помилка x вірогідності середньої арифметичної; S - середньоквадратичне відхилення аналізуємого ряду x вибірки ; n - обсяг вибірки; s - сігма. Довірчі межі середнього арифметичного значення визначаються за формулами: Xдвг = X + ts - верхня межа 3.2 x Xднг = X - ts - нижня межа x де t - довірчий коефіцієнт критерій Стьюдента . В соціально-гігієнічних дослідженнях прийнято t = 2. Визначення довірчого інтервалу і довірчих меж для частки: Довірчий інтервал для частки p: Генеральна частка: p = m / N 3.3 де m - кількість одиниць у групі N - об'єм генеральної сукупності. Границі довірчого інтервалу для генеральної частки: Pн <= Р <= Pв при цьому: Pн = p - ts і Pв = p + ts 3.4 p p де p - виборочна частка. Помилка виборочної частки - --- S = \ | p 1-p / n 3.5 p Ці формули застосовуються тоді коли не виконується умова 75% <= p <= 25% 3.6 Якщо умова 3.6 виконується то довірчі межі для генеральної частки визначаються за формулою: ---------------- - 2 | 2 - 1 |- t - | m n-m t | P = ------ || m + --- | + - t \ | ------- + --- | 3.7 2 || 2 | n 4 | n + t |- - | - - де n - число спостережень; m - абсолютна численність однієї з груп; t - нормоване відхилення визначене за значенням ймовірності Р . При t = 2 ця формула набуває вигляд: --------------- 1 - | - P = ----- | | m n-m | n + 4 | m + 2 + - 2 \ | ------- + 1 | 3.8 | n | | | - - Із 3.8 при m = 0 або m = n для довічного значення помилки частки одержується розрахункова формула: 2 t ts = -------- 3.9 p n + 2 t При t = 2 цей вираз приводиться до вигляду: ts = 4 / n + 4 3.10 p При цьому для m = 0 визначається нижня межа для m = 1ОО верхня межа. 3.2.1 Аналіз парних взаємозв'язків Для аналізу парних взаємозв'язків показників використовуються такі засоби; 3.2.3.1 Засоби розвідувального та графічного аналізу: стовбикові діаграми типа "ящиків з вусиками" двумірні графіки розподілу. 3.2.3.2 Перевірка статистичних гіпотез про однорідність двух виборок: традиційне порівняння середніх та дисперсій за Т-критерієм при допущенні про їх нормальність закону розподілу. 3.2.3.3 Засоби дисперсійного аналізу: перевірка гіпотез про наявність статистичної значущості зв'язку між різноманітними змінними оцінка структури і форми зокрема лінійності що припускаються взаємозв'язком. 3.2.3.4 Засоби кореляційного аналізу: оцінка й аналіз парного лінійного взаємозв'язку показників що спостерігаються у контролюємій системі. 3.2.3.5 Засоби парного регресійного аналізу. Основні області застосування: побудова моделей взаємозв'язку показників. Перевірка адекватності моделей об'єкту і оцінка їх якості. Алгоритмічне забезпечення: засоби побудови простих лінійних і лінійних за параметрами моделей. Моделювання включає 4 основних етапи: а побудова лінійної або лінійної за параметрами лінійної по відношенню до перетворених перемінних моделі ; б побудова графіків регресійних залежностей з довірчими зонами і графіками решт за результатами якого визначалася наявність аномальних точок; в побудова моделей для аналізованої виборки після виключення аномальних даних; г порівнюючий аналіз моделей та визначення мінімального набору моделей достатнього для адекватного опису взаємозв'язку показників що досліджуються. 3.2.4 Аналіз причинно-слідчих множинних взаємозв'язків. 3.2.4.1 Засоби множинної регресії: крокові засоби побудови множинних регресійних моделей [3]. 3.2.4.2 Засоби факторного аналізу Ціль: визначення мінімального набору агрегірованих показників достатніх для адекватного опису еколого-гігієнічного стану об'єкту. Алгоритмічне забезпечення - метод головних факторів з косокутним обертанням varimax equimax quartimax [4 5] Факторний аналіз проводиться для всіх наборів показників еколого-гігієнічного моніторингу. Алгоритмічне забезпечення рішення задач регламентується засобами програмного забезпечення які використовуються. 4. АЛГОРИТМ ФОРМУВАННЯ СИСТЕМИ ОПЕРАТИВНОГО КОНТРОЛЮ Формування системи оперативного контролю складається із слідуючих основних етапів: 1. Постановка і формалізація конкретних завдань оперативного контролю. 2. Визначення набору змінних що спостерігаються і створення БАЗИ ДАНИХ. 3. Проробка блокової структури системи контролю. 4. Побудова моделей причинно-слідчих зв'язків. 5. Побудова набору узагальнюючих показників. 6. Визначення оптимального набору вихідних показників використовуваних в алгоритмах прийняття рішення. 7. Перетворення набору вихідних показників у номінальні шкали відносні натурального ряду чисел рангові шкали станів . 8. Розробка алгоритмічного і програмного забезпечення подання інформації в формі максимально полегшуючій процедуру прийняття рішень. 9. Розробка алгоритмічного і програмного забезпечення формалізованого прийняття рішень. 5 ПРИКЛАД РОЗРОБКИ СИСТЕМИ ОПЕРАТИВНОГО КОНТРОЛЮ 5.1 Вступ Постановка завдання: розробити концепцію формування системи оперативного контролю еколого-гігієнічного стану об'єкту обумовленого роботою транспортних засобів. Об'єкт контролю - територіальні одиниці України: місто область регіон. Набір показників що спостерігаються і характеризують об'єкт та його еколого-гігієнічний стан. Весь набір вхідної інформації формується у вигляді БАЗИ ДАНИХ спроектованої на базі СУБД CLARION [6.7]. Статистична обробка інформації проводиться згідно з методикою наведеною у розділах 1-4 з використанням статистичного пакету STATGRAPHICS ver. 5 [8 9]. Для рішення завдань картографування використовувався пакет рекомендований ВОЗ програмний пакет EPIMАP адаптований стосовно до російськомовного користувача. 5.2. Вхідні дані Характеристики географо-демографічних показників: Кількість областей - No Кількість міст - Nr чисельність населення тис. осіб - NASEL площа тис.kb.km - PL індекси: область + місто - OG область - O місто - G Характеристики антропогенних показників: Видаток бензину т - RASBEN Видаток дизельного палива т - RASDIZ Видаток стислого газу тис.куб.м - GAZM Видаток сжіжженого газу тис.л - GAZL Викиди у атмосферу шкідливих речовин тис.т./год - VRED Кількість легкових автомобілів тис.шт - Кл Кількість вантажних автомобілів тис.шт - Кг Кількість автобусів тис.шт - Ка Кількість мотоциклів тис.шт - Км 5.3 Поблочне дослідження вхідних показників системи 5.3.1 Показники видатку палива та викиду шкідливих речовин в атмосферу Вхідні показники видатку палива та викиду шкідливих речовин в атмосферу були піддані факторному аналізу в наслідок якого було установлено що для опису даних достатньо використання 1-го головною фактору FRAS з накопиченим вкладом 98.9%. Взаємозв'язок між показником FRAS та вхідними показниками видатку палива та викиду шкідливих речовин в атмосферу може бути представлена регресійною моделлю: -6 FRAS = - 0.069 + 10 * 7.44 RASDIZO + 1.94 RASBENO + 4.98 GAZMO + 17 GAZLO + 4695 VRED 5.1 або без істотної втрати точності - моделлю: -6 FRAS = - 0.076 + 10 * 7.61 RASDIZO + 2.29 RASBENO + 4757 VRED 5.2 5.3.2 Показники кількості автотранспорту Вхідні показники що характеризують кількість автотранспорту по областях і містах були піддані факторному аналізу в наслідок якого було установлено що для опису даних окремо по місту і по області достатньо використання 1-го головного фактора FKOLA з накопиченим вкладом для моделі області - 99.2% міста - 95.4%. Крім того був визначений узагальнений показник: "умовна кількість автотранспорту KOLUSL " що визначається за формулою: KOLUSL = 10Кл + 20Kr + 25Ka + 5Км /60 5.3 де Кл Кr Кa Км - кількість легкових вантажних автомобілів автобусів мотоциклів; 10 20 25 5 - відповідні видатки пального на 100 км шляху. Коефіцієнти кореляції між цими узагальненими показниками 0.992 для міст та 0.994 для областей що зазначає надто високу ефективність використання факторного аналізу в якості засобу пошуку узагальнених показників. 5.3.3 Показники захворюваності з ТВП: Для побудови узагальненого показника захворюваності використовувався факторний аналіз. Вхідні показники: кількість випадків з ТВП по хворобам нервової системи органів дихання травлення травмам і отруєнням 6 8 9 17 класи захворювань . Одержано узагальнений показник у вигляді 1-ої головної компоненти матриці вхідних змінних ZF з накопиченою часткою з'ясованого разкиду рівного 100% тобто при заміні 4 вхідних показників одним узагальненим ніякої втрати інформації не діється. Узагальнений показник може бути також одержаний просто підсумкуванням вхідних 4 показників SUMSL т.я. коефіцієнт кореляції між показниками ZF й SUMSI рівен 0.95 а визначення останнього методично значне простіше. 5.4 Дослідження взаємозв'язку показників 5.4.1 Взаємозв'язок захворюваності з демографо-географічними показниками Внаслідок развідувального аналізу даних випадків захворювань з ТВП по містах та областях України зокрема було виявлено що в усіх класах що досліджуються спостерігається аномально підвищена захворюваність у Донецькій області. Для оцінки значимості розрізнень рівня захворюваності по областях та містах був використаний апарат перевірки статистичних гіпотез для всього набору показників захворюваності за класами та в цілому. Наслідки досліджень для значущо розрізнених показників захворюваності по області та місту приведені у таблиці 1. Таблиця 1 Аналіз кількості випадків захворювань з ТВП по областях та містах України Клас захворювань Середнє значення Критерій значимості Т.крит. Область Місто 3 0.23 0.32 0.0005 2.97 4 0.125 0.188 0.0005 2.94 6 3.12 4.03 0.027 2.30 8 23.19 30.40 0.0007 3.64 9 3.00 3.88 0.0019 3.31 При дослідженні взаємозв'язку "випадки захворювання - чисельність населення" використовувався апарат кореляційного аналізу внаслідок якого був виявлений статистичне значущий взаємозв'язок "випадки захворювання - чисельність населення області по класу захворювань "органи дихання" - r = 0 70 й "травми та отруєння" - r = 0.61 й наявність істотної взаємокореляційності показників захворювань за окремими класами на рівні r = 0.5 - 0.8. Для аналізу захворюваності за регіонами використовувався дисперсійний аналіз внаслідок якого було виявлено значуще збільшення кількості випадків з ТВП у східному регіоні по класу захворювань нервової системи 6 клас й класу захворювань "травми й отруєння" 17 клас а також тенденція регіональної залежності середньої тривалості захворювань по 17 класу. 5.4.2 Взаємозв'язок вхідних антропогенних показників з демографо-географічними показниками Внаслідок проведеного регресійно-кореляційного аналізу взаємозв'язку показників видатку палива викидів шкідливих речовин в атмосферу автотранспорту і чисельністью населення площею областей і міст було встановлено що по чисельності населення можуть бути одержані достатньо надійні кількісні оцінки прогнозуємих значень антропогенних факторів. Визначені набори показників для яких ці моделі статистичне значущі і збудовані відповідні регресійні моделі див. табл. 2 . З метою вияву оптимального набору моделей використованих для опису взаємозв'язку між антропогенними та демографічними показниками був проведений порівняльний аналіз якості моделей та додаткові етапи моделювання які включали наступні етапи: 1. Побудова графіків регресійних залежностей з довірчими межами та графіки решт за результатами якого визначалась наявність аномальних точок. 2. Побудова регресійних моделей для аналізованої вибірки після виключення аномальних точок. 3. Порівняльний аналіз моделей для міста і області і показника видатка палива на 1000 осіб населення. Таблиця 2 Регресійні моделі взаємозв'язку видатка палива кількості автотранспорту та чисельності населення областей лінійні вигляду: y = a + bх Залежна перемінна Коефіцієнти регресії Коефіцієнти регресії n Залишкове СКВ a b VRED 77.30 0.0936 24 0.936 42.55 RASBENOG RASBENO RASBENG 55401.60 14336.00 12870.80 70.7480 94.4440 66.9300 24 13 14 0.805 0.781 0.938 62830.80 76059.10 17557.50 RASDIZOG RASDIZO RASDIZG -3892.85 -32328.60 8188.72 50.4720 64.4800 40.9840 24 13 24 0.840 0.827 0.964 39299.60 43949.00 8039.70 GAZLOG GAZLO GAZLG -12837.40 -13614.40 1059.83 9.7430 11.622 3.6100 17 10 12 0.825 0.892 0.656 8055.30 6708.60 3165.50 Виключено Донецьк GAZLOGK GAZLOK GAZLGK - 961.80 - 976.10 673.29 2.45 1.82 2.94 16 9 11 0.848 0.861 0.926 1287.78 672.03 955.43 GAZMG 2267.70 7.63 13 0.816 3931.50 KOLUSLO KOLUSLG 5642.72 2315.14 24.9 24.25 24 10 0.961 0.988 781.5 905.45 Примітки: 1. n - кількість точок використовуваних для побудови моделі. 2. х - чисельність населення NASEL . Внаслідок проведеного аналізу і моделювання було встановлено наступне: - для опису взаємозв'язку видатка дизпалива бензина й чисельності населення допустимо у першому приближенні використання єдиної моделі збудованої за даними по областях включаючи місто або показника видатка палива на 10.00 осіб населення. - для моделі взаємозв'язку видатку зрідненого газу і чисельності населення було виявлено аномальне превищення видатку газу по відношенню до чисельності населення в Донецькій області; різниця між значеннями видатку оцінена за моделями збудованими за даними до і після виключення аномальної точки відрізняються більш ніж у 2.9 рази. - встановлена значуща різниця моделей для міста і області та недоцільність використання у загальному випадку показника видатку газу на 1000 осіб населення так як при цьому додаткова помилка для різноманітних об'єктів складає величину порядку 40-94%. Найбільш ефективним для оцінки взаємозв'язку між антропогенним та демографічними показниками використовувати узагальнені показники FRAS і KOLUSL і показник чисельності населення. Відповідні коефіцієнти кореляції між цими показниками складають величини не менше 0.94. 5.4.3 Взаємозв'зок антропогенних показників і показників захворюваності Коефіцієнти кореляції між показниками що спостерігаються та узагальненими показниками були на рівні 0.58-0.62. Для оцінки впливу антропогенних факторів на захворюваність можливо обмежитися аналізом захворюваності по 3-ом класам "захворювання нервової системи" "захворювання органів дихання" "травми і отруєння" . Надійним та еффективним є використання узагальненого показника захворюваності так як при цьому для аналізу використовується істотно більший обсяг інформації" і для прийняття рішення використовується тільки один показник що полегшує процедуру прийняття рішення. Враховуючи невисокі коефіцієнти кореляції для побудови прогностичних моделей необхідно підтвердити одержані результати захворюваності на виборках більшого обсягу наприклад за паралельними даними по захворюваності по областям та антропогенним показникам за 10 років . 5.5 Формування системи оперативного контролю Для системи оперативного контролю і прогнозування стану об'єкту було запропоновано використовувати 4 показника: - чисельність населення об'єкту NASELO тис.осіб; - узагальнений показаних видатку палива й викиду шкідливих речовин в атмосферу FRAS що визначається за формулами 5.1 5.2 умовна шкала; - умовна кількість автотранспорту KOLUSL що визначається за формулою 5 3 . тис.шт.; - сумарна кількість випадків ЗТВП SUMSL по 6 8 9 й 17 класам нормуроване на 100 працюючих. Для зручності в практичній роботі весь діапазон зміни цих показників представляється у вигляді рангових шкал відповідно до таблиці ранжирування таблиця 3 . Таблиця З Ранг Діапазони зміни показників NASELO FRAS KOLUSL SUMSL 1 2 3 4 5 500 ... 1000 1000... 1500 1500... 2000 2000 ... 3000 вище 3000 0.0... 1.0 1.0... 2.0 2.0... 3.0 3.0... 4.0 4;0... 5.0 20.0.. ...40.0 40.0.. ...60.0 60.0. ....80.0 80.0.. ..100.0 вище 100.0 10-20 20-30 30-40 40-50 вище 50 Для якісного аналізу видатку палива надто ефективним виявляється використання програмного забезпечення що дозволить виробляти картографічний аналіз даних розробленого нами на базі рекомендованого ВОЗ програмного засобу EPIМАP.