System Rozumienia Kształtów (SUS) – nowa generacja inteligentnych
systemów opartych na zdolności wizualnego myślenia
W chwili obecnej
projekt prowadzony jest w oparciu o własne środki autorów (Z. Les
i M. Les) to znaczy sprzęt komputerowy, oprogramowanie i wszystkie
koszty związane z prezentacją artykułów na konferencjach.
Sprzęt i
korzyści płynące z zastosowania badań jak również
rezultaty badań są przedmiotem donacji autorów tego
projektu dla the Queen Jadwiga Foundation.
Celem badań nad
Systemem Rozumienia Kształtów (SUS; ang. Shape Understanding System)
jest opracowanie metody rozumienia kształtów oraz jej implementacja
jako systemu zdolnego do wykonywania czynności związanych z
rozumieniem kształtów. W ramach rozumienia system powinien być
zdolny do uczenia się różnych koncepcji kształtu, do
zachowania tych koncepcji w strukturalnie zorganizowanej bazie wiedzy,
tworzenia procesu wyjaśniającego jak również wykonywania
pewnych operacji takich jak grupowanie obiektów czy też transformacja
form lingwistycznych do formy obrazowej.
Interdyscyplinarne badania
nad SUS-em zawierają takie dziedziny jak psychologiczne teorie
percepcji, teoria znaków (semiotyka), rozpoznawanie i analiza obrazów,
computer vision jak również automatyczne pozyskiwanie wiedzy (ang.
machine learning). Metoda rozumienia kształtu będzie najbardziej
efektywna jeżeli będzie w stanie naśladować działanie
ludzkiego układu wzrokowego. Istniejące systemy traktują
kształt jako właściwość obiektu ze świata
rzeczywistego i starają się rozpoznać konkretny obiekt.
Proces rozumienia kształtu jest czymś odmiennym, bowiem obejmuje
stworzenie pojęcia kształtu w oparciu o dane zdobyte w fazie
uczenia jak również wykonywanie vizualnych transformacji w procesie
rozumienia. W wielu istniejących aplikacjach nie odróżnia
się kształtu od obiektu i bardzo często wizualne systemy
interpretują kształt jako sam obiekt. Metoda rozumienia
kształtów w przeciwieństwie do metod rozpoznawania kształtu
uwzględnia różne aspekty kształtu reprezentowanego jako:
podstawowa kategoria percepcyjna, znacząca jednostka (zwana fantomem),
podstawowa kategoria wizualna, idealna reprezentacja kształtu
generowana w oparciu o model danej klasy kształtów (zwana archetypem),
cyfrowa realizacja archetypu zwana obiektem generowanym (ang. egzemplar),
zbiór punktów krytycznych, pojęcie wizualne (ang. visual concept),
forma opisu kształtu reprezentująca wiedzę wizualną,
wskaźnik diagnostyczny. W metodzie rozumienia kształtów
różne reprezentacje kształtu umożliwiają
niezależne przebadanie każdej z nich jak również ich
wzajemnych powiązań.
Rozumienie interpretowane
jest jako proces selektywnego pozyskiwania danych wejściowych
(percepcja), przekształcanie danych w celu przypisywania im znaczenia
w procesie wnioskowania (ang. visual reasoning), jak również
generowanie i przekształcanie danych w procesie wizualnych
transformacji (ang. visual transformations). Rozumienie kształtu,
gdzie kształt jest podstawową kategorią myślenia
wizualnego, składa się szereg złożonych procesów.
Jednym z głównych procesów jest tworzenie, na podstawie analizy
obiektu wizualnego (kształtu) jego symbolicznej reprezentacji i przypisania
mu znaczenia w formie pojęcia (ang. phantom concept).
Prezentowana metoda jest
pierwszą w świecie próbą potraktowania kształtu jako
nie tylko ‘wizualnego atrybutu’ obiektu świata rzeczywistego ale
również podstawowej kategorii wizualnego myślenia (ang. visual
thinking) w aspekcie tworzenia systemów wizyjnych. Implementacja tej metody
w postaci Systemu Rozumienia Kształtu pozwala na wyposażenie
systemów komputerowych w jakościowo nowa metodę rozumowania
wizualnego (ang. visual reasoning).
Do podstawowych pojęc
definiowanych w ramach opracowanej metody rozumienia kształtów naleza
pojecia takie jak:
- fantom jako 2-wymiarowy
obiekt (ang. phantom)
- klasy kształtów
- archetyp (ang.
archetype) i generowany obiekt (ang. exemplar)
- reguły
przydzielania badanego obiektu do klasy
- znaczenie fantomu (ang.
phantom’s meaning).
Wprowadzone nowe koncepcje
archetypu i generowanego obiektu, podkreślają różnicę
pomiędzy kształtem reprezentowanym w przestrzeni Euklidesowej a
jego reprezentacją cyfrową.
Nowa metoda generowania
archetypu z wyraźnie zdefiniowanej klasy kształtów,
będących częścią hierarchicznej struktury klas
kształtów, pozwala generować kształt na podstawie
wyraźnie zdefiniowanej kategorii kształtów. Wprowadzone trzy poziomy
reprezentacji pozwalają na interpretację kształtu, który
można interpretować w kategoriach znaków albo obiektów
rzeczywistego świata. Metodologia interdyscyplinarna daje
zintegrowaną analizę kształtu z uwzględnieniem
epistemologicznego kontekstu związanego z rozumieniem kształtów.
Metoda rozumienia
ksztaltow jest oparta na zdefiniowanej klasie kształtów. Kształt
jest reprezentowany przez swoją symboliczną nazwę,
związaną ze zbiorem możliwych klas kształtów. Zbiór
możliwych klas kształtów określa się na podstawie
znajomości „a priori” topologicznych i geometrycznych
właściwości kształtów, charakterystyki postrzeganej
figury oraz znaczenia kształtu jako formy znaczącej. Klasy kształtów
są definiowane w oparciu o wybrany model. W proponowanej metodzie
rozumienia kształtu możliwe klasy kształtu traktuje się
jako hierarchiczną strukturę, gdzie na każdym poziomie opisu
model kształtu obejmuje różne aspekty kształtu takie jak
geometryczne właściwości kształtów, własności
percepcyjne figur czy znaczące właściwości form
wizualnych. Klasa kształtów a priori tworzona jest w oparciu o model
danej klasy. Jako przyklad zdefiniowanych klas ksztaltow na poziomie
meta-klasy mozemy wyroznic: klasę cykliczną, acykliczną,
wypukłą, wklęsłą i cienką. W obrębie
meta klas wyróżniono klasy podstawowe i szczegółowe oraz
opracowano metodę otrzymywania klas na kolejnych poziomach opisu.

1 2 3 4
Rysunek 1: Przykłady generowanych
obiektów (exemplars) generowanych z meta klas
1. acykliczna 2. wypukła 3. wklęsła 4.
cienka
W prezentowanej metodzie
wprowadzony jest szczegółowy opis cyfrowej reprezentacji archetypu i
różnicę pomiędzy kształtem reprezentowanym w
przestrzeni Euklidesowej (ang. archetyp) a jego reprezentacją
cyfrową (ang. exemplar). Wprowadzone pojęcie transformacji obrazu
(ang. image transformation) definiuje metodę przekształceń w
dyskretnej przestrzeni punktów krytycznych. Transformacje obrazu
stanowią główną część procesu wizualnego
wnioskowania. Istotą transformacji obrazu jest wyznaczenie punktów
krytycznych charakterystycznych dla danej klasy. Wprowadzone pojecie
transformacji obrazu pozwala na sformalizowanie opisu procesu wnioskowania
oraz na generalizację i łatwą adaptację owego
formalizmu w pokrewnych dziedzinach badań. W oparciu o otrzymany zbiór
punktów krytycznych badany obiekt przydzielany jest do danej klasy
kształtów przez przypisanie mu reprezentacji symbolicznej (ang.
symbolic name).
Jednym z aspektów analizy
kształtu jest reprezentacja i opis kształtu. W proponowanej
metodzie rozumienia kształtu opis kształtu związany jest z
jedną z możliwych klas kształtu. Metoda rozumienia
kształtu uwzględnia różnice w przetwarzaniu różnych
klas kształtu w toku procesu rozumowania. Do rozpoznawania
kształtu proponowano wiele metod przetwarzania, ale opracowane one
były do stosowania dla szerokiego zakresu klas kształtu, co
bardzo często prowadziło do niezbyt zadowalających wyników.
W proponowanej w pracy metodzie rozumienia kształtów zastosowano nowe
sposoby przetwarzania obrazu i modyfikację istniejących metod
przetwarzania obrazu do wybranych klas kształtów. Dla każdej z
klas kształtów opracowano sekwencję metod przetwarzania, która
daje najlepsze wyniki. Ponieważ system opiera się na
wykorzystaniu wielu różnych złożonych i wzajemnie
zależnych metod pozyskiwania danych i podejmowania decyzji, to
każdą z metod przetwarzania stosuje się do bardzo konkretnego
zadania.
Przydzielenie badanego
obiektu do jednej z klas jest wykonywane w kolejnych etapach procesu
wnioskowania (rozumowania). W procesie wnioskowania stosuje się
obrazowe transformacje w celu otrzymania zbioru punktów krytycznych,
wyznacza się zbiór deskryptorów i przydziela badany obiekt do jednej z
klas .
Przedstawiony System
Rozumienia Kształtów SUS, stanowiący realizację metody
rozumienia kształtów, potrafi wykonywać różne zadania w
zakresie analizy i rozpoznawania kształtów w oparciu o swoją
zdolność rozumienia różnych koncepcji kształtu na
różnych poziomach poznania. System obejmuje różnego rodzaju
umiejętności, pozwalające na wykonywanie różnych zadań
w zakresie przetwarzania i rozumowania. Symboliczne nazwy,
nawiązujące do możliwych klas kształtów, pozwalają
na wyrażenie pojęcia wizualnego jako zbioru symbolicznych nazw.
Pojęcie wizualne, wyrażone jako zbiór symbolicznych nazw,
można wykorzystać do znalezienia wizualnych podobieństw
pomiędzy różnymi obiektami wizualnymi i do zapamiętania
wizualnego obiektu jako symbolicznej reprezentacji. Proponowany system
rozumienia kształtów, zrealizowany w języku C++ w systemie operacyjnym
Windows 2000, działa na podstawie znajomości przetwarzania
obrazów, podejmowania decyzji i strategii poszukiwań oraz
znajomości opisu i reprezentacji kształtu przez różne
wyspecjalizowane moduły (ang. experts) takie jak, dla przykladu
‘reasoning expert’, ‘processing expert’, ‘learning expert’ czy
‘self-correcting expert’. Podstawowy cel systemu SUS to tworzenie
pojęcia kształtu, umożliwiającego wizualne wnioskowanie
i przekształcenia wizualne. System SUS analizuje obiekt wizualny celem
zinterpretowania go w kategoriach symbolicznych nazw możliwych klas.
Wielopoziomowe reprezentacje zapewniają nowy, efektywny sposób
komunikowania się systemu z użytkownikiem (osobą lub z innym
systemem). Nowa architektura systemu ma na celu maksymalną
współpracę ekspertów, uczestniczących w rozwiązywaniu
problemu epistemologicznego. Metoda testowania i autokorekcji oparta jest
na rozumowaniu polegającym na generowaniu obiektu z zadanej klasy i
sprawdzaniu czy system w trakcie rozumowania przypisze ten obiekt do
właściwej klasy. Nowa metoda rozumowania, gdzie przetwarzanie
jest częścią procesu rozumowania, ma stanowić element
nowej architektury systemów rozumienia. Proponowaną metodę
realizuje się jako System Rozumienia Kształtów,
umożliwiający budowę systemu rozumienia, w którym wszystkie
nowe ustalenia testowane są w kontekście całego
istniejącego zasobu wiedzy.
W pierwszym etapie prac
przetestowano zdolność rozumienia przez system koncepcji,
związanych z meta klasami (cykliczno-acykliczna,
wypukło-wklęsłą, cienką). W drugim etapie
przetestowano zdolność rozumienia przez system koncepcji, jakie
można sformułować stosując pojęcie kształtu.
Wyniki dowodzą, że system SUS potrafi zrozumieć takie
koncepcje jak wypukłość, wklęsłość i
cienkość, reprezentowane przez
klasy ogólne „a priori”. System potrafi zrozumieć co oznacza
bycie „wielobokiem”, „elipsą”, „prostokątem”, „prostokątem z
zaokrąglonymi narożami”, „wielobokiem wklęsłym” oraz
wiele innych pojęć, związanych z określonymi klasami
kształtów. System potrafi zrozumieć takie koncepcje jak
„wypukłość”, „kształt bez otworu”, „kształt
cienki” „trojkat z dwoma otworami w ksztalcie okregu”. Opisywany system
wykonał bezbłędnie różne zadania w zakresie rozumienia
(np. rozpoznanie, grupowanie obiektów podobnych, nazywanie). Zadania te
sformułowano w kategoriach pojęcia kształtu (np. stawiane
zadanie „znaleźć wszystkie obiekty wypukłe”).
Zdolność systemu
do rozumienia pojęcia kształtu, związanego z konkretnymi
obiektami, przetestowano w toku procesu autokorekcyjnego rozumowania. Próby
przeprowadzono dla klasy wieloboków wklęsłych i klasy cienkiej i
cyklicznej. W pierwszej fazie przetestowano zdolność zrozumienia
przez system różnicy pomiędzy wielobokami wklęsłymi i
nie wklęsłymi, a w fazie drugiej zdolność rozumienia
koncepcji wieloboku wklęsłego. Wyniki wskazują, że
proponowana metoda sprawdza się w przypadku klasy wieloboków
regularnych. W przypadku klasy wieloboków nieregularnych występuje
problem z reprezentacją cyfrową wygenerowanego archetypu.
Wyniki wskazują,
że system jest zdolny do wykonania zadań wymagających
„umiejętności” rozumienia. Najtrudniejsza sprawa to nazywanie i
znajdowanie obiektów podobnych. Nazwy bardziej skomplikowanych form
wizualnych podano jako wyrażenie lingwistyczne, np. „kwadrat z
okrągłym otworem”, albo „dwie połączone elipsy”. W
przypadku obiektu cyfrowego, który można zinterpretować na
poziomie znaku albo na poziomie referencyjnym rzeczywistego świata,
ilość możliwych interpretacji dla niektórych obiektów
cyfrowych jest znaczna.
System byl również
testowany w zakresie rozumiena pojęcia wybranych kategorii znakowych
np. litery, znaki drogowe, symbole matematyczne, pismo klinowe, hieroglify
oraz inne systemy znakowe. Bardzo ważnym aspektem rozumienia jest
interpretacja gdzie ten sam obiekt wizualny jest interpretowany w różny
sposób. Interpretacja uzależniona jest od uprzednio pozyskanej
kontekstualnej informacji i jest jedną z pierwszych prób
naśladowania ludzkiego umysłu w interpretacji wizualnej
zależnej od nastawienia poznawczego.
System byl również
testowany w zakresie rozumiena obiektow trójwymiarowych jak również
obiektów realnego swiata. Chociaż obiekty świata rzeczywistego
jawią się jako obiekty trójwymiarowe jednakże postrzeganie
trójwymiarowości jest problemem który można badać abstrachując
od pojęcia obiektu świata rzeczywistego. Rozumienie obiektów
świata rzeczywistego włączone jest w kontekst rozumiena
znaków i jawi sie jako szerszy problem rozumienia znaczenia elementów
postrzeganego świata.
Jednym z najtrudniejszych
zadań jest testowanie wizualnych transformacji które są częścią
wizualnego myślenia i jednym z najważniejszych elementów
wizualnego rozwiązywania problemów jak również
częścią procesów związanych z twórczym myśleniem
(wyobrażnia). Wstępne testy dowodzą że wykorzystanie
podstawowych wizualnych kategorii (klas ksztaltow) pozwoli na prowadzenie
skomplikowanych wizualnych transformacji prowadzących w konsekwencji
do procesu wizualnego myślenia.
System rozumienia
kształtów jest w stanie wykonywać różne zadania w zakresie
analizy i rozpoznawania kształtu na podstawie swojej zdolności
rozumienia różnych koncepcji kształtu na różnych poziomach
poznania. Opracowany system obejmuje różnego rodzaju
umiejętności wykonywania rozmaitych zadań w zakresie
przetwarzania i rozumowania. System ma zdolność uczenia się
różnych pojęć kształtów i zachowywania ich w
strukturalnie zorganizowanej bazie wiedzy. System wykorzystuje szereg
różnych złożonych i wzajemnie od siebie zależnych metod
zdobywania danych, rozumowania i wyjaśniania.
Reprezentacje
wielopoziomowe pozwalają dawać wyjaśnienia
użytkownikowi na różne sposoby, naśladujące sposób
„zrozumiałego” wyjaśniania. Działanie systemu daje lepszy
wgląd w rolę rozumienia w procesie wizualnej percepcji. Metoda
wskazuje, że do zrozumienia kształtu istotne są nie tylko
cechy percepcyjne obiektu, ale również sposób przetwarzania i
rozumowania, zależny od klasy do której obiekt należy. System
Rozumienia Kształtów SUS można stosować w wielu dziedzinach,
gdzie analizę obrazu można sprowadzić do analizy
kształtów np. w statystyce, medycynie, naukach ścisłych i
astronomii.
|