Klasyfikacja różnych podejść do schema matchingu

Klasyfikacja różnych podejść do schema matchingu Cały proces schema matchingu może funkcjonować w oparciu o kilka różnych algorytmów szukających zależności dzięki czemu możliwe jest zastosowanie różnych algorytmów w zależności od dziedziny czy rodzaju schematu. Zastosowanie grupy algorytmów wymaga tym samym wprowadzeniu kolejnego rozgraniczenia. W wyniku zastosowania pojedynczego algorytmu otrzymujemy jeden schemat powiązań oparty na określonych kryteriach. Drugie podejście bazuje na kilku algorytmach. W tym przypadku możemy wyróżnić hybrid matcher, czyli hybrydę porównującą bazującą na zbiorowych kryteriach lub composite matcher, które łączy wyniki otrzymane przez niezależne algorytmy.

Klasyfikacja różnych podejść do schema matchingu

Cały proces schema matchingu może funkcjonować w oparciu o kilka różnych algorytmów szukających zależności dzięki czemu możliwe jest zastosowanie różnych algorytmów w zależności od dziedziny czy rodzaju schematu. Zastosowanie grupy algorytmów wymaga tym samym wprowadzeniu kolejnego rozgraniczenia. W wyniku zastosowania pojedynczego algorytmu otrzymujemy jeden schemat powiązań oparty na określonych kryteriach. Drugie podejście bazuje na kilku algorytmach. W tym przypadku możemy wyróżnić hybrid matcher, czyli hybrydę porównującą bazującą na zbiorowych kryteriach lub composite matcher, które łączy wyniki otrzymane przez niezależne algorytmy.

W przypadku korzystania z pojedynczych algorytmów autorzy wprowadzają następujące charakterystyki umożliwiające klasyfikację:

• Instance vs schema – szukanie powiązań w oparciu o instancje (zawartość danych) lub w oparciu o schemat źródła; • Element vs structure matching – porównywanie pojedynczych elementów schematu (jak np. atrybuty) lub złożonych struktur składających się z kilku elementów; • Language vs constraint – podejście lingwistyczne (nazewnictwo i opisy elementów schematu) lub w oparciu o warunki (klucze, zależności); • Matching cardinality (liczebności) – wynikiem może być powiązanie jednego (lub kilku) elementów pierwszego schematu z jednym (lub kilkoma) elementami drugiego schematu; • Auxiliary information (Informacje pomocnicze) – niektóre algorytmy bazują nie tylko na wprowadzanych schematach, lecz również na dodatkowych elementach jak różnego rodzaju słowniki, ogólne schematy, wcześniejsze wyniki, decyzje użytkownika)

Schemat 1. [Rahm01]

W odniesieniu do powyższego schematu wyróżnić możemy trzy podstawowe podejścia: • Schema-level matching; • Instance-level matching; • Combinations of multiple matchers.