ISO TR 21707 - Inteligentní dopravní systémy – Informace, management a řízení integrované dopravy – Kvalita vstupních dat pro systémy ITS
Aplikační oblast: Kvalita dat, Řízení dopravy
Rok vydání normy a počet stran: Vydána 2008, 12 stran
Zavedení normy do ČSN: překladem
Rok zpracování extraktu: 2009
Skupina témat: Řízení dopravy
Téma normy: Požadavky na kvalitu vstupních dat ITS systémů
Charakteristika tématu: Požadavky na kvalitu vstupních dat do systémů ITS
Popis významu stanovení kvality dat
Definování metadat, která je nutné sledovat a určují kvalitu datové informace
Úvod
Tato technická zpráva specifikuje množinu terminologických pojmů, které definují kvalitu dat pro komunikaci mezi poskytovateli a uživateli v oblasti ITS. Jedná se tedy například o systémy dopravních informací či řízení dopravy, a to zejména pokud je mezi nimi či částmi jejich systémů otevřené rozhraní. Stejné definice mohou být využity i pro vnitřní rozhraní, ale to není předmětem této TR.
Jako typický příklad může být uveden projekt liniového řízení dopravy na dálnici D1. Snahou tohoto projektu je využít stávající data, například ze systému EFC či ze systému pro získávání dopravních informací. K popisu těchto dat by měla být použita metadata (tedy data o datech) definovaná v této normě.
Jedná se skutečně o důležitý dokument, neboť jinak by nebylo možné definovat a měřit kvalitu dat.
Užití
Tato norma by měla být použita při jakémkoli projektu ITS, v němž se vyskytují otevřená rozhraní mezi jednotlivými subsystémy. Umožní sdílení dat mezi těmito subsystémy a zvýší jejich využití.
Orgány státní správy by měly být seznámeny s existencí této normy a vyžadovat její využití při přípravě nových projektů řízených křižovatek, ale i přípravě projektů pro obnovu stávajích systémů.
Dodavatelé technologie se musí s touto normou seznámit skutečně detailně. Na základě této normy budou schopni sdílet data i mezi subsystémy dodávaných různými dodavately.
1. Předmět normy
Tato norma identifikuje množinu parametrů, takzvaných metadat, které mohou dohromady podat kvantifikaci kvality dat vyměněných mezi různými subsystémy. Tato TR se zaměřuje výhradně na kvalitu dat pro otevřená rozhraní, ale dá se využít jak pro sbíraná nezpracovaná data (raw data), tak i pro data po zpracování. Nerozlišuje také, zda se jedná o data statická, nebo o data v reálném čase.
Typická metadata pro kvalitu dat jsou například přesnost či aktuálnost. Tato TR definuje ovšem ještě celou řadu dodatečných metadat jako například vlastnictví (ownership), který je potřeba například pro určení omezení využití dat určitým uživatelům.
Měření kvality dat je nezbytné i pro určení jejich ceny v případě komerčního využití.
2. Termíny a definice
Všechny důležité termíny jsou definovány přímo v jednotlivých kapitolách ISO TR 21707.
Kapitola 3 uvádí zkratky a značky použité v této normě.
Další termíny a zkratky z oboru ITS jsou obsaženy ve slovníku ITS terminology (www. ITSterminology.org).
4 Obecné požadavky
V této kapitole je vysvětleno, co znamená pojem kvalita dat (článek 4.1) a co by měla norma věnující se tomuto tématu definovat (článek 4.2). V článku 4.3 je potom uveden přehled a základní dělení metadat týkajících se kvality dat.
Pojem kvalita dat odpovídá množině metadat, která definují parametry předávaných dat a umožní jejich příjemci rozhodnout, zda jsou tato data vhodná pro jeho aplikaci. Různé aplikace mají různé požadavky na data a není tedy možné říci, že data sbíraná každou minutu jsou kvalitnější, než data sbíraná v pětiminutových intervalech.
Tato norma potom musí identifikovat, která metadata jsou vhodná a užitečná pro příjemce dat a jak tato metadata mají být strukturovaná.
V článku 4.3 jsou metadata rozdělena do několika úrovní. Na nejnižší úrovni se jedná o metadata zaměřená na přesnost, aktuálnost, či například pravděpodobnost správnosti. Jako konkrétní příklad může být uvedena míra přesnosti polohy, délka fronty, či přesnost časového razítka.
Kvalita dat se ovšem týká i datových objektů vyšší úrovně, jako jsou definice zvláštních dopravních situací nebo měření dopravního toku. Zde se obvykle metadata vyjadřují jako kombinace metadat z nižší úrovně.
Na nejvyšší úrovni se potom jedná o metadata týkajících se celých podmnožin datových služeb, jako je například dostupnost či spolehlivost dané služby.
5 Metadata popisující kvalitu dat
V této kapitole jsou detailně definována jednotlivá metadata. Každý typ těchto metadat popisujících kvalitu dat je vyjádřen jako objekt datové kvality, společně s množinou parametrů - metadat. Tyto objekty se mohou týkat datové služby jako celku, či jednotlivých částí (datových entit).
V jednotlivých podkapitolách jsou uvedeny jednotlivé objekty kvality dat společně s jednotlivými metadaty. Přehled objektů je uveden v následujícím seznamu (dané číslo vždy odpovídá označení konkrétního článku):
Kompletnost služby
Dostupnost služby
Stupeň služby
Věrohodnost
Přesnost
Aktuálnost
Měření polohy
Zdroj měření
Vlastnictví
Pro příklad uvedeme v následujících odstavcích výběr z článku 5.2 Dostupnost služby.
5.2 Dostupnost služby
Poskytovatel dat musí být schopen specifikovat množinu metadat, která definují dostupnost dané služby (nejčastěji odvozenou z předchozích praktických zkušeností). Tato dostupnost může být uživatelem očekávaná a často je součástí písemné dohody (Service Level Agreement).
Následující metadata mohou být použita pro objekt dostupnost služby:
Perioda dostupnosti (Availability period – AP) je doba, po kterou je zaručena dostupnost dané služby. Obvykle se udává ve formátu den/týden/měsíc s uvedením speciálních podmínek (například 24/7 mimo státních svátků)
Střední doba opravy (Mean time to repair – MTTR) je střední doba od nahlášení poruchy dané služby do jejího opravení
Střední doba mezi poruchami (Mean time between failures – MTBF) je střední doba mezi dvěma poruchami daného systému
Skutečná hodnota dostupnosti je potom definována podle této rovnice:
6 Shrnutí objektů datové kvality a jejich parametrů
Tabulka 6.1 uvádí seznam objektů datové kvality, jejich možných metadat, rozdělení, zda se jedná o metadata obecná, nebo pro jednotlivé instance, a formu, jakou jsou definovány (textem, číselně, či jinak). Výběr pro již popsaný objekt dostupnost služby je jako příklad uveden i zde:
Objekt datové kvality | Metadata | Instance metadata | Obecná metadata | Jak je definován |
... | ||||
Dostupnost služby | Perioda dostupnosti |
| X | Text |
Střední doba opravy |
| X | hh:mm | |
| X | hh:mm | ||
... |