1.   Aká je história vzniku a definícia znalostných systémov?

 

 

Znalostné systémy (Popper-Kelemen, 1989), (Mařík a kol., 1997), (Berka, 1994) a (Mikulecký a kol., 1998) sa vyčlenili z oblasti Umelej inteligencie (Csontó, 1990), (Návrat a kol., 2002). Odborníci v oblasti Umelej inteligencie vyvíjali od začiatku snahu vymyslieť programy, ktoré by boli schopné myslieť, teda riešiť úlohy spôsobom, akým by to robil človek, považovaný za rozumného.

V 60-tych rokoch 20. storočia vedci hľadali všeobecné metódy pre riešenie širokých tried úloh. Tieto metódy sa používali v univerzálnych programoch, ako napríklad program GPS – General Problem Solver, ktorý:

ü  používa techniku analýzy cieľov a prostriedkov (Means Ends Analysis)

ü  snaží sa krok po kroku previesť počiatočný stav riešenia do cieľového stavu (resp. do niektorého z cieľových stavov)

ü  riešenie spočíva v hľadaní odlišnosti – diferencie medzi dvojicami stavov: stavom, v ktorom sa riešený problém práve nachádza (hociktorý okrem cieľového) a cieľovým stavom

ü  hodnotí relevantnosť operátorov odstraňujúcich diferencie (o koľko posunú riešenie dopredu)

ü  testuje aplikovateľnosť operátorov

ü  ak relevantný operátor nie je možné bezprostredne aplikovať, potom sa stanovia nové podciele (ich vyriešenie je predpokladom aplikovateľnosti  vyššie uvedeného operátora)

ü  proces sa opakuje rekurzívne, kým sa nenájde celá sekvencia operátorov, ktorá úplne odstráni diferenciu, čím vyrieši úlohu, resp. dokáže že úloha nie je riešiteľná

V 70-tych rokoch 20. storočia došli vedci k záveru, že je veľmi ťažké zabezpečiť univerzálnosť programu, a že je potrebné sústrediť sa na:

ü  metódy reprezentácie t.j. formulovať problém spôsobom, ktorý uľahčí jeho riešenie

ü  metódy vyhľadávania efektívnych spôsobov riešenia, ktoré by nevyžadovali veľa pamäte a času

Napríklad, keď sa dá problém reprezentovať pomocou grafu, alebo petriho siete, potom sa dá efektívne riešiť.

V 80-tych rokoch 20. storočia zhodnotili vedci svoje doterajšie výskumy nasledovne. Efektívnosť riešenia úloh závisí od znalostí viac, ako od formalizmu odvodzovania riešení. Tento poznatok naznačil novú koncepciu „intelektuálneho programu“. Intelektuálny program je potrebné vybaviť množstvom kvalitných špecializovaných znalostí. To viedlo ku rozvoju expertných, resp. znalostných systémov a znalostnému inžinierstvu (technológii zostrojovania znalostných systémov). Z uvedeného vyplýva definícia znalostného systému.

Znalostný systém je súbor špecializovaných počítačových programov a štruktúrovaných údajov, ktoré sú schopné nahradiť špecialistu pri riešení úloh v úzko ohraničenom odbore, prípadne ho prekonať.

 

 

Prvýkrát bola použitá myšlienka aplikácie veľkého objemu špecifických znalostí, vo forme umožňujúcej programu manipuláciu s nimi v projekte DENTRAL, ktorý zohral významnú úlohu v rozvoji znalostných systémov.

DENDRAL (Lindsay, 1980) sa začal vyvíjať v roku 1965. Systém analyzuje údaje hmotového spektrografu a zostavuje pravdepodobné molekulárne štruktúry. Na vstupe má tento systém sumárny vzorec a hmotový spektrograf. Z týchto vstupov odvodí zoznam prípustných štruktúr (môže ísť o tisíce), na ktoré aplikuje niektoré zo svojich znalostí. Tým postupne znižuje počet alternatív, až dostane jediný náležitý štrukturálny vzorec. Analogické postupy je možné využiť aj v iných oblastiach. Napríklad v medicíne na vyhodnocovanie EKG.

MACSYMA (Moses, 1975) vznikla v MIT ako program pre symbolické manipulácie (diferencovanie a integrovanie v symbolickom tvare, zjednodušovanie symbolických výrazov). Používa znalosti vo forme pravidiel o transformáciách jedného symbolického výrazu na iný.

MYCIN (Shortliffe, 1976) sa zameriava na diagnostiku a liečenie infekčných ochorení krvi. Používa znalosti v tvare pravidiel spájajúcich možné diagnózy so zodpovedajúcimi príznakmi. Práca tohto znalostného systému bola porovnateľná s výsledkami expertov v danej oblasti.

HEARSAY II. bol schopný chápať súvislú reč na základe slovníka s tisíckou slov. Bol taktiež schopný riešiť úlohy na rôznej úrovni abstrakcie. Dokázal postupne rozvíjať čiastočné riešenia. V podstate mohol súperiť s desať ročným dieťaťom.

Všetky tieto znalostné systémy predstavovali veľké projekty znamenajúce dlhú prácu, riešené mnohými ľuďmi. Spotrebovali veľa človeko-rokov. Niektoré boli neskôr začlenené do iných systémov. Často boli prvé výsledky publikované po mnohých rokoch, nezriedkavo až desiatich. Obrázok znázorňuje približne časové obdobia vývinu týchto znalostných systémov.


2.   Ako sa líšia vlastnosti  znalostných systémov a ľudského riešiteľa?

 

 

Táto otázka evokuje ďalšie otázky. Načo je dobré vyvíjať software, ktorý by robil niečo, čo vie dobre robiť človek? Bolo by možné ľudských expertov úplne nahradiť znalostnými systémami? Pokúsime sa v ďalšom tieto otázky zodpovedať.

 

 

V tabuľke je veľmi stručne uvedené, ako sa niektoré vlastnosti (trvanlivosť, prenos znalostí, dokumentovateľnosť, stabilita, cena, dostupnosť), dôležité pre znalostné poradenstvo, premietnu do práce ako ľudského riešiteľa a znalostného (expertného) systému. Z tejto tabuľky sa dozvedáme o nasledovných kompetenciách znalostného systému. Jeho kompetentnosť je trvalá na rozdiel od človeka, ktorý ju musí neustálou praxou obnovovať, aby si udržal profesionálnu úroveň a dlhšia prestávka pôsobí nepriaznivo na jeho schopnosti. Je nutné dodať, že praxou si špecialista vedomosti nielen udržiava, ale ich aj prehlbuje a objavuje hlbšie súvislosti.  Kompetentnosť znalostného systému (ďalej ZS) je ľahko odovzdávateľná jednoduchým kopírovaním. Na druhej strane odovzdávanie znalostí medzi ľuďmi je ťažký, dlhý a drahý proces – učenie. Kompetentnosť ZS je dobre dokumentovateľná (báza znalostí) na rozdiel od človeka, ktorého vedomosti dokumentovať je zložité a časovo náročné. Opäť je potrebné si uvedomiť, že aj v prípade ZS bolo potrebné vedomosti oblasti najprv zdokumentovať.  Výkon ZS je stabilný, čo sa nedá povedať o človeku, ktorého výkon kolíše pod vplyvom emocionálnych faktorov, stresu a tlaku času. Zatiaľ čo ZS je neustále dostupný, človek je často zaneprázdnený a potrebuje dovolenku a odpočinok. S výnimkou vývoja ZS, ktorý je cenovo náročnejší, je používanie ZS lacné a rovná sa cene strojového času. Na druhej strane človek expert je spravidla veľmi vysoko cenený.

Na základe uvedených skutočností môžeme konštatovať, že ZS sú potrebné, lebo niekedy pracujú efektívnejšie a teda môžu doplniť prácu experta. Mohli by ho aj úplne nahradiť? Nemôžu, pretože v niektorých oblastiach činnosti ľudská kompetentnosť značne prevyšuje tú umelú. Tak napríklad človek je tvorivý, má schopnosť vyrovnať sa s neočakávaným zvratom situácie pomocou predstavivosti a nových prístupov k riešeniu úlohy. Človek je schopný sa učiť  a tak sa adaptovať na zmenené podmienky a prispôsobiť svoje stratégie novým okolnostiam. Človek má zdravý rozum, pretože disponuje všeobecnými znalosťami o svete. Je schopný sebareflexie, a teda sa nebude vždy znova a znova pokúšať o riešenie problému, ktorý je nad jeho sily (čo by sa u ZS mohlo stať).


3.    Aké miesto má človek v tvorbe a používaní znalostných systémov?

 

 

Role, ktoré človek hrá v procese tvorby a používania znalostných systémov, je možné pomenovať nasledovne: človek ako expert, ako znalostný inžinier, ako tvorca prostriedkov a napokon ako používateľ. Vzájomné vzťahy týchto úloh sú ilustrované nasledujúcim obrázkom. V tejto symbióze rôznych úloh vystupuje pochopiteľne aj znalostný systém, resp. expertný systém a blok prostriedkov pre tvorbu znalostného systému (PTZS). Znalostný systém prestavuje súbor programov, obsahujúci okrem inferenčného mechanizmu a bázy znalostí aj podporné komponenty: editory, ladiace prostriedky, komunikačné prostriedky, grafický vstup/výstup, atď. PTZS môže predstavovať prázdny znalostný systém, programovací jazyk alebo knižnica programov.

 

 

 

 

Jednotlivé role človeka v tvorbe a používaní znalostného systému je možné charakterizovať nasledovne:

Expert je človek, ktorý vďaka vzdelaniu a skúsenostiam je schopný efektívne riešiť problémy úzko vymedzenej oblasti. (Znalostný systém môže modelovať znalosti jedného, alebo viacerých expertov).

Znalostný inžinier má poznatky z oblasti znalostných systémov. (Je to expert na znalostné systémy.) Pýta sa experta na jeho znalosti a organizuje ich. Rieši, akým spôsobom majú byť reprezentované v znalostnom systéme. Je to kombinácia softverového špecialistu a psychológa.

Tvorca prostriedkov vytvára prostriedky pre tvorbu znalostných  systémov, čím pripravuje pôdu pre jeho vznik.

Používateľ používa hotový znalostný systém v podstate ako: laik (potrebuje riešenie a jeho vysvetlenie) alebo špecialista (získa záver menej namáhavou a rýchlejšou cestou ako by to robil sám, alebo je zvedavý na závery iného špecialistu).


4.   Aká je štruktúra znalostných systémov?

 

 

Štruktúra sa odvíja od typov znalostí, ktoré znalostný systém používa. Začnime od človeka. Človek používa niekoľko typov znalostí, ktoré sa líšia hlavne stupňom abstrakcie a šírkou zaberanej oblasti. Typy znalostí používaných človekom sa delia na štyri základné skupiny:

ü  VŚEOBECNÉ ZNALOSTI o svete majú na rozdiel od ostatných typov vysoký stupeň abstrakcie a mohutnú šírku záberu, lebo sa netýkajú iba úzko vymedzenej oblasti. Sú používané neustále v spojení s ostatnými typmi znalostí.

ü  PREDMETNÉ ZNALOSTI sú znalosti so stredným stupňom abstrakcie a šírky zamerania. Sú to znalosti úzko vymedzenej predmetnej oblasti (napr. medicínske). Ide o špecifické, profesijné znalosti, vznikajúce štúdiom.

ü  PROBLÉMOVÉ ZNALOSTI sú znalosti o konkrétnom probléme, bez abstrakcie a šírky zamerania. Sú to znalosti o konkrétnej úlohe (ťažkosti konkrétneho pacienta).

ü  METAZNALOSTI sú to znalosti o znalostiach, ktoré umožňujú seba-reflexiu (vieme čo vieme).

Nasledovná tabuľka dokumentuje, ktoré zo znalostí človeka používa aj znalostný, resp. expertný systém.

 

Znalostný, resp. expertný systém nepoužíva všeobecné znalosti, pretože zatiaľ nepoznáme technológie, ktoré by nám umožnili uložiť tak obrovský objem znalostí. Preto najvšeobecnejšie znalosti, ktoré používa znalostný systém sú predmetné znalosti. Spravidla sú uložené v báze znalostí (BZ). ZS taktiež používa problémové znalosti, ktoré ukladá do bázy dát (BD) a metaznalosti, ukladané do rovnomenného bloku. Okrem týchto blokov je súčasťou štruktúry ZS blok IM – inferenčný mechanizmus, ktorý umožňuje spoluprácu všetkých typov znalostí za účelom riešenia úloh. Nasledovný obrázok ilustruje súčinnosť všetkých typov znalostí pod taktovkou IM, teda ilustruje základnú štruktúru ZS.

 

 

 

Báza znalostí odpovedá predmetným znalostiam človeka, ktoré používa ako znalosti všeobecného charakteru. Umožňuje riešiť iba určitý druh úloh. Spadajú sem znalosti experta, ktoré sa týkajú konkrétnej oblasti.

Báza dát odpovedá znalostiam človeka o riešenom probléme (problémové znalosti). Zvyčajne sa získavajú od používateľa, ktorý odpovedá na otázky ZS. Používateľ spravidla poskytuje odpovede, ktoré sú mu známe. Môže však poskytnúť odpoveď obsahujúcu hodnotu odčítanú z meracieho prístroja.

Metaznalosti nemusí nutne ZS obsahovať. Ovplyvňujú činnosť IM, na základe aktuálneho stavu riešenia. S nimi pracuje ZS efektívnejšie. Získavajú sa od experta.

V súvislosti so štruktúrou ZS môže byť prázdny alebo dedikovaný systém. Prázdny znalostný systém je univerzálny. Jeho použitie nezávisí od konkrétnej BZ, ktorá sa dá vymeniť za inú. Je viazaný na formu reprezentácie znalostí, nie na ich obsah. U dedikovaného znalostného systému tvorí báza znalostí a inferenčný mechanizmus jednotný celok. Je schopný riešiť iba problémy jedného druhu, pretože BZ sa nedá vymeniť. Avšak, jeho práca je efektívnejšia ako práca porovnateľného prázdneho ZS.

Z hľadiska charakteru riešených úloh možno ZS rozdeliť do dvoch základných skupín: diagnostické a plánovacie. Podrobnejšia štruktúra znalostného systému sa u týchto dvoch skupín líši.


5.   Štruktúra diagnostických znalostných systémov!

 

 

Diagnostické ZS riešia problém diagnostikou, t.j. určovaním, ktorá hypotéza z danej konečnej množiny cieľových hypotéz najlepšie korešponduje s dátami o konkrétnom prípade. Riešenie spočíva v postupnom prehodnocovaní dielčích a cieľových hypotéz v rámci expertom pevne daného modelu riešenia. Tomuto spôsobu práce ZS odpovedá štruktúra diagnostického znalostného systému zobrazená na nasledovnom obrázku.

                                                            

 

 

Jadrom ZS je inferenčný mechanizmus, resp. riadiaci mechanizmus, ktorý s využitím znalostí z BZ a BD po každej odpovedi používateľa upresňuje aktuálny model konzultovaného prípadu. Jeho povinnosťou je vybrať takú otázku, od zodpovedania ktorej sa očakáva najväčší prínos k upresneniu aktuálneho modelu. Súčasťou inferenčného mechanizmu je aktuálny model a vysvetľovací mechanizmus.

Aktuálny model reprezentuje súčasný stav riešenia úlohy. Predstavuje množinu všetkých momentálne platných poznatkov a faktov o riešenom probléme. Aktuálny model sa môže meniť pridaním/vypustením niečoho nového z BD, alebo odvodením nového poznatku pomocou IM. Aktuálny model môže byť implicitný a prázdny. Implicitný aktuálny model zodpovedá apriórnym predstavám o podobných prípadoch. Tento počiatočný „default“ model sa postupne modifikuje. Jeho veľkosť nenarastá. Je náročnejší na odvádzanie a testovanie. Prázdny aktuálny model je na začiatku prázdny a postupne sa do neho ukladajú informácie, takže neustále rastie.

Úlohou vysvetľovacieho mechanizmu je objasniť používateľovi, čo získané riešenie znamená a akým spôsobom bolo odvodené.


6.   Štruktúra plánovacích znalostných systémov

 

 

Spôsob práce plánovacieho znalostného systému sa líši od spôsobu práce diagnostického znalostného systému. Plánovací ZS (Tien-Chien Chang, 1990) pozná počiatočný stav a cieľ. Jeho úlohou je nájsť optimálnu cestu z počiatočného stavu k cieľu. Pracuje tak, že generuje všetky možné riešenia a hľadá medzi nimi to optimálne. To však môže spôsobiť kombinatorickú explóziu, ktorej je potrebné sa vyhnúť. Výsledkom činnosti plánovacieho ZS je zoznam prípustných riešení. Spôsobu práce plánovacieho ZS odpovedá aj jeho štruktúra, ktorá je uvedená v nasledujúcom obrázku.

                                                   

 

Štrukturálna schéma plánovacieho ZS sa od štrukturálnej schémy predchádzajúceho diagnostického ZS líši tým, že namiesto aktuálneho modelu má zásobník vhodných riešení a IM pozostáva z troch súčastí: generátora možností, obmedzovača možností a testu zhody.

Generátor možností generuje všetky možné riešenia, pričom ovplyvňuje výber prípustných operátorov. Obmedzovač možností obmedzuje generatívnu schopnosť použitím znalostí v BZ. Blok s názvom test zhody riadi testovanie zhody vygenerovaných riešení s dátami v BD. Príkladom programu generujúceho množstvo riešení a testovaním vyberajúceho tie správne je riešenie hlavolamu, v ktorom je potrebné za písmená dosadiť čísla tak, aby vyhovovali nasledovnej podmienke: SEND + MORE = MONEY. Najjednoduchšie riešenie (test na diferenciu sa vykonáva po vygenerovaní celej postupnosti čísel) je v nasledovnom programe vľavo.

                           

                                        

Efektívnejšia je metóda hierarchického usporiadania generovania a testovania, ktorá umožní odmietnuť riešenie, na základe jeho čiastočného popisu. Jedným testom je zamietnutý väčší počet nevyhovujúcich riešení. Príkladom je riešenie hlavolamu send-more-money, ilustrované vyššie uvedeným programom vpravo (test na diferenciu sa vykonáva po vygenerovaní každého ďalšieho čísla).

7.   Čo je to produkčný systém?

 

 

Produkčný systém je tvorený troma zložkami:

ü  súborom produkčných pravidiel

ü  bázou dát (BD)

ü  interpretrom pravidiel.

Produkčné pravidlá majú tvar:        S --> A       resp.  P --> Z,      čo znamená, že ak v báze dát nastala situácia S, potom vykonaj akciu A, resp. ak v báze dát platia predpoklady P, potom platí záver Z. Predpoklady P, resp. situácia S sa niekedy nazývajú „situačnou časťou“ pravidla. Báza dát je prostredím pre beh produkčného systému. Situácia S sa môže vyskytnúť v BD a podobne akcia A sa vykoná nad touto BD. Interpreter realizuje produkčné pravidlá. Pracuje v dvoj krokovom cykle:

Interpreter rieši nasledovné úlohy:

1)     Skontroluje situačné časti všetkých produkčných pravidiel (PP). Nájde pravidlo, ktorého S je splnené na základe údajov v BD.

2)     Realizuje akciu A vybratého pravidla, teda vlastne pravidlo odpáli.

3)     Ak nenájde žiadne pravidlo, potom zastane.

4)     Ak nastane prípad, že je splnená situačná časť viacerých pravidiel, musí rozhodnúť, ktoré použiť. Výber pravidla je dôležitý, pretože môže ovplyvniť výsledok. (Vykonanie akcie jedného z odpáliteľných pravidiel môže zrušiť podmienky pre aplikáciu ostatných odpáliteľných pravidiel.) Stratégia výberu je daná buď usporiadaním PP, alebo sa určuje dynamicky, vyhodnocovaním zadaného kritéria.

Charakteristické vlastnosti produkčného systému sú nasledovné:

ü  Obmedzená možnosť interakcie medzi pravidlami. Interakcia sa totiž uskutočňuje iba cez BD. Pravidlo je vyvolané iba vtedy, keď je splnená podmienka v jeho situačnej časti. Naopak, ak je splnená situačná časť pravidla, je odpálené bez ohľadu na to, či prispieva k riešeniu alebo ho zahmlieva. Ak majú byť PP aplikované v určitej postupnosti,  potom predchodca musí vytvoriť v BD podmienky pre odpálenie svojho nástupcu.

ü  Existencia obmedzení kladených na tvar pravidiel. Všeobecne neexistujú, avšak v reálnych prípadoch sa prijímajú isté obmedzenia. Pri porovnaní podmienky pravidla so stavom BD sa nesmie BD meniť.

ü  Pravidlá predstavujú elementárne akcie produkčného systému, ktoré sú najmenším krokom systému z hľadiska vonkajšieho chovania.

ü  Modularita produkčného systému uľahčuje odstraňovanie závad v chovaní programu. Umožňuje ľahké integrovanie prírastkov nových znalostí. Umožňuje vynechávať pravidlá z produkčného systému. Vynechanie pravidla môže viesť k horšiemu riešeniu, ale nemôže ochromiť schopnosť ZS riešiť problémy (ZS sa bude stále chovať rozumne). Jednotlivé pravidlá sú totiž vyvolávané prostredím (stavom BD), nie v postupnosti dopredu zadanej programátorom. Ak v nejakom stave BD nedochádza k požadovanému chovaniu, stačí pridať PP:

                  popis situácie nezhody --> požadovaná akcia.

8.   Ako funguje dopredné a spätné reťazenie?

 

 

Reťazenie produkčných pravidiel nastáva, keď záver jedného pravidla obsahuje tú istú znalosť, ako predpoklad ďalšieho. Existujú dva druhy reťazenia: dopredné a spätné.

 

DOPREDNÉ REŤAZENIE funguje na základe princípu: ak platí predpoklad, potom platí záver. Vykoná sa vždy prvé pravidlo, ktorého situačná časť je splnená. Niekedy sa mu hovorí priame reťazenie, alebo reťazenie riadené dátami (data driven inference). O tom, ktoré pravidlo sa odpáli, rozhoduje nielen ich poradie, ale aj situácia v báze dát. Jednoduchým príkladom takéhoto reťazenia môže byť nasledovný program v programovacom jazyku Prolog.   

 

                                                   

 

Dopredné reťazenie má svoje nevýhody. Nehodí sa veľmi na dokazovanie konkrétnej hypotézy, pretože popri tom odpáli aj mnoho nepotrebných pravidiel jednoducho preto, že bola náhodou splnená ich situačná časť. Hodí sa skôr na odvodenie všetkých možných výsledkov platných v aktuálnom modeli, teda na základe aktuálneho stavu BD.

   

SPäTNÉ REŤAZENIE (Payne-McArtur, 1990) sa zameriava na dokázanie konkrétnej hypotézy. Dekomponuje konkrétny cieľ (dokázanie hypotézy, záveru)  na podciele (podmienky v situačnej časti pravidla s daný záverom, resp. hypotézou v pravej časti). Potom sa snaží rekurzívne splniť tieto podciele (podmienky) tak, že hľadá pravidlá, ktoré majú dané podmienky vo svojej pravej časti, teda ako záver. Ide vlastne o prehľadávanie inferenčnej siete do hĺbky. Jednoduchým príkladom takéhoto reťazenia môže byť nasledovný program v Prologu.

 

                                                   

 

                                                   

 

                                                   

 

 

 

 

 

9.   Ako je možné produkčný systém formálne definovať?

 

 

Definícia produkčného pravidla závisí od spôsobu jeho chápania. Produkčné pravidlá môžeme chápať dvojako:

ü  Deklaratívne. Pravidlo deklaruje (definuje) súvislosť medzi jednotlivými fragmentmi  znalostí, resp. medzi znalosťami navzájom.

ü  Procedurálne. Pravidlo definuje spôsob (procedúru), ako odvodiť novú znalosť (záver) pomocou iných znalostí (predpokladov).

Definujme si množinu atomických výrokov p = {p1,..., pN}. Tieto výroky sa môžu vyskytnúť v pravých stranách produkčných pravidiel, ktorých forma (nad p) bude nasledovná.

Ľavá strana PP je tvorená elementárnou konjunkciou literálov L1,...,LK. Literály sú vlastne atomické výroky, alebo negované atomické výroky. Každý literál sa v konjunkcii vyskytuje najviac raz, či už negovaný alebo nie. Pravá strana PP je tvorená atomickým výrokom p, ktorý sa nevyskytuje v L1,...,LK. p je teda záver pravidla (consequent) a elementárna  konjunkcia predstavuje predpoklady pravidla (antecedenty, evidencie).

Produkčné pravidlo sa niekedy označuje aj ako „if-then“ pravidlo. Niekedy sa pripúšťa, aby predpoklady tvorili disjunkciu. Väčšinou je za disjunkciu považovaná existencia viacerých pravidiel s rovnakým záverom, ale rôznymi predpokladmi.

Fakt, že formálne sa v ľavej časti nejakého PP môžu vyskytnúť tie isté atomické výroky, ktoré sa vyskytujú v pravej časti iného PP (nie toho istého) umožňuje reťazenie pravidiel. Napríklad:

A & B --> C

  nonC --> D

D & E --> F

        F --> G ...

Reťazenie pravidiel umožňuje vytvárať hierarchickú štruktúru nazývanú inferenčná sieť (knowledge pattern). Inferenčná sieť nesmie obsahovať reťaz, ktorá by bola zároveň aj slučkou. Napríklad:             A & B --> C

              nonC --> D

                   D --> B.

Pre odvodenie nových znalostí pomocou produkčných pravidiel sa najčastejšie používajú dva spôsoby:     1.modus ponens

   ak vieme, že platí tvrdenie              p

   a súčasne platí implikácia               p --> q

   potom platí tvrdenie                        q

 

                               2.modus tollens

   ak vieme, že neplatí tvrdenie          non q

   a súčasne platí implikácia               p --> q

   potom neplatí ani tvrdenie              non p

 

Oba spôsoby majú rovnakú deduktívnu silu. Sú deduktívne ekvivalentné. Avšak, modus tollens sa používa podstatne zriedkavejšie.

 

10.               Ako je možné znázorniť inferenčnú sieť?

 

 

 

V dôsledku toho že predpoklad a záver pravidla sú rovnakého typu, môže záver nejakého pravidla vystupovať ako dielčí predpoklad iného pravidla. V dôsledku toho tvoria produkčné pravidlá hierarchickú štruktúru, ktorú je možné znázorniť orientovaným grafom, a ktorú nazývame inferenčná sieť. Príklad takejto inferenčnej siete je ilustrovaný nasledovným obrázkom.

 

 

 

 

Uzly grafu zodpovedajú jednotlivým výrokom. Hrany grafu reprezentujú produkčné pravidlá, pričom jedno PP môže byť vyjadrené jednou, alebo viacerými hranami. Logické funkcie sú chápané v zmysle klasickej boolovskej logiky (AND uzol je v grafe vyznačený dodatočnou čiarkou. OR uzol je bez čiarky.) AND uzol bude splnený, ak budú splnené všetky jeho predpoklady - subciele. OR uzol nebude splnený, ak nebudú splnené všetky jeho predpoklady - subciele. Keby sme sa chceli vyhnúť použitiu OR uzlov, čo je v ZS obvyklé, mohli by sme produkčné pravidlá na vyššie uvedenom obrázku prepísať do nasledovnej formy:

 

                                

 

 

Uzly inferenčnej siete ako grafu môžeme deliť podľa rôznych hľadísk:

1. Podľa polohy ich delíme na:

ü  Koreňové (vrcholové), ktorých výroky sa nevyskytujú v predpokladoch žiadneho iného pravidla.

ü  Listové, ktorých výroky sa nevyskytujú v záveroch žiadneho pravidla.

ü  Medziľahlé sú všetky ostatné uzly.

 

 

2. Podľa spôsobu vyšetrovania:

ü  Dotazovateľné. Vyšetrenie ich platnosti sa realizuje dialógovým spôsobom, položením priamej otázky používateľovi v priebehu konzultácie. Ich platnosť sa môže overovať aj v báze dát.

ü  Nedotazovateľné. Vyšetrujú sa odvodením, pomocou platnosti svojich subcieľov (podmienok) a pomocou vlastnej funkcie (AND, OR).

 

3. Podľa cieľovosti:

ü  Cieľové, ktorých platnosť chceme dokázať, resp. odvodiť.

ü  Necieľové sú ostatné uzly, ktoré nám pomáhajú dokázať platnosť cieľových uzlov.

Tieto delenia sa navzájom prekrývajú podľa určitých pravidiel, ktoré sú definované v nasledovnej tabuľke.

 

 

Medziľahlý uzol môže byť aj dotazovateľný nejednoznačným spôsobom. Ak totiž používateľ nevie svojou odpoveďou dokázať medziľahlým uzlom reprezentované tvrdenie, môže byť toto dokázané odvodením, pomocou subcieľov.

Niektoré znalostné systémy umožňujú definovanie cieľovosti a dotazovateľnosti niektorých skupín uzlov tvorcovi bázy znalostí, alebo dokonca používateľovi.

 

 

11.               Ako je možné inferenčnú sieť prehľadávať?

 

 

Inferenčnú sieť je možné prehľadávať rôznymi spôsobmi. V podstate sa kombinuje dopredné/spätné reťazenie s úplným/neúplným prehľadávaním. Z toho vyplývajú štyri možnosti:

ü  Neúplný priamy chod. Pri tomto chode sa inferenčný mechanizmus pohybuje od necieľového, najčastejšie listového uzlu priamo smerom ku koreňovému, resp. cieľovému uzlu. Pri prechode cez jednotlivé uzly sa tieto neexpandujú, t.j. systém sa nezaujíma o ďalšie hrany, ktoré vedú do aktuálneho uzla. Systém iba zisťuje, platnosť ktorých cieľových uzlov môže ovplyvniť platnosť daného listového – necieľového uzla. Dosiahnuté cieľové uzly sa označujú ako relevantné vzhľadom k zadanému listovému uzlu.

ü  Úplný priamy chod. Systém postupuje opäť od listových uzlov ku koreňovým so snahou priraďovať aktuálnym uzlom pravdivostné hodnoty. Tentoraz ide o „pravú“ inferenciu a systém sa musí zaujímať aj o ostatné hrany vedúce do aktuálneho uzla a preveriť platnosť uzlov, z ktorých tieto hrany vyšli. Inak povedané, ak je to potrebné, systém expanduje uzly po ceste ku koreňu a overuje ich platnosť.

ü  Úplný spätný chod. Pri tomto chode sa systém snaží dokázať hypotézu spojenú s niektorým koreňovým uzlom. Preto postupuje spätne od zadaného cieľového, resp. koreňového uzla smerom ku listovým uzlom. Pri tomto postupe dokazuje (a teda expanduje, ak je to potrebné) uzly na zvolenej ceste. Nie vždy je nutná expanzia všetkých uzlov. Tak napríklad ďalšia expanzia nemá zmysel, ak: 1) aktuálny uzol už má priradenú pravdivostnú hodnotu (pravdivostná hodnota mu bola priradená pri overovaní iného cieľa),  2) aktuálny uzol je typu AND a jeden z jeho potomkov je nepravdivý,  3) aktuálny uzol je typu OR a jeden z jeho potomkov je pravdivý.

ü  Neúplný spätný chod. Opäť tu ide o potvrdzovanie hypotézy, pričom sa nedokazuje celá rozvetvená cesta od hypotézy – koreňového uzla ku všetkým relevantným listovým uzlom. V BZ môže byť uložená informácia o tom, ktoré z vetiev stromu vedú k najvierohodnejším alternatívam. Táto informácia umožní systému vyberať práve také vetvy. Uvedený postup je vyložene heuristický a súvisí s problematikou práce s neurčitou informáciou. Pri tomto postupe vychádza systém z koreňového uzla, zisťuje relevantné listové uzly, ktoré môžu ovplyvniť platnosť daného koreňa a vyberie jeden z nich ako alternatívu.  

 

12.               Čo je to neurčitá znalosť?

 

 

Neurčité znalosti nemajú podobu rigoróznych tvrdení. Neurčité znalosti často reprezentujú rôzne tušenia a osvedčené postupy. Neurčité znalosti sú prirodzenou súčasťou riešení experta a ako také sú neoddeliteľnou súčasťou znalostného systému.

Neurčité znalosti sú potrebné, pretože iba malú časť úloh sa podarilo analyzovať do tej miery, že ich možno uspokojujúco formálne popísať a riešiť. Sú potrebné preto, že iba malá časť vedomostí experta má tvar formálnych matematizovaných teórií, ktoré poskytujú jednoznačné výpočtové postupy vedúce k jednoznačnému riešeniu. Napriek tomu je expert schopný riešiť problémy pomocou znalostí, ktoré sú odvodené z jeho skúseností a z jeho individuálnych mentálnych modelov, t.j. pomocou neurčitých znalostí.

Jednoznačný výpočtový proces predstavuje algoritmus, ktorý pracuje s určitými znalosťami. Neformálny úsudkový postup zase predstavuje heuristika, ktorá pracuje s neurčitými znalosťami. Charakteristické vlastnosti algoritmu a heuristiky sú prehľadne ilustrované nasledovnou tabuľkou.

 

 

 

Algoritmus sa vyznačuje rezultatívnosťou, konečnosťou, hromadnosťou riešenia a garantuje optimálne riešenie. Hromadnosť riešenia znamená, že riešenie sa vždy nájde. Je pomalší a menej efektívny. Heuristika zaručuje iba rezultatívnosť a konečnosť riešenia. Nezaručuje jeho hromadnosť. Negarantuje optimálne riešenie. Poskytuje však vo väčšine prípadov vyhovujúce riešenie. Poskytuje praktickejšie riešenie za kratší čas.

Heuristike ako neformálnemu úsudkovému postupu, možno v určitom zmysle dôverovať. Táto dôvera je založená na existencii dostatočného množstva prípadov, keď sa osvedčila. Heuristika nám prináša riešenie, ktoré sa nedá dokázať, ale dá sa dobre použiť.

Uvažujme, ako by bolo možné zabrániť vstupu teroristov na palubu lietadla. Algoritmické riešenie by spočívalo v osobnej prehliadke každej osoby, ktorá vstúpi na palubu a jej batožiny (vrátane posádky a mechanikov). Heuristické riešenie by spočívalo v osobnej prehliadke iba tých cestujúcich, na ktorých reaguje detektor kovu, a ktorí svojim výzorom alebo správaním vyvolali podozrenie. V tomto prípade algoritmus úplne vylučuje možnosť preniknutia zbrane na palubu lietadla. Na druhej strane však vyžaduje príliš veľa času, je nákladný a nepopulárny.

Ako vyplýva z predošlého, jednou z charakteristických vlastností heuristických znalostí je ich neurčitosť. Znalosti o neurčitosti tvoria štvrtý typ ľudských znalostí, popri všeobecných, predmetných a konkrétnych. Táto skupina má osobitné postavenie medzi ostatnými znalosťami. Hovoríme, že má panoramatický charakter, pretože sa týka všetkých ostatných typov znalostí. Znalosti experta nemajú vždy celkom exaktný charakter. Jednotlivé znalosti používa s rôznou dôverou vo výsledok. Miera jeho dôvery je založená práve na použití 4. typu znalostí – znalostí o neurčitosti.

 

13.               Aký je rozdiel medzi neurčitosťou v BZ a v BD?

 

 

Existencia neurčitých znalostí v znalostnom systéme je vynútená neurčitosťou vedomostí a faktov, s ktorými znalostný systém pracuje. Táto neurčitosť sa vyskytuje tak v BZ ako aj v BD. Neurčitosť v sa v BZ a v BD vyskytuje z nasledovných konkrétnych dôvodov:

ü  Neurčitosť v BZ býva zapríčinená tým, že znalosti experta nie sú celkom exaktné. Často sú to domnienky, ktoré sa opierajú o skúsenosti.

ü  Neurčitosť v BD býva zapríčinená neistými odpoveďami používateľa, subjektívnosťou jeho úsudku, odhadmi nedostupných informácií ako riešením situácie v prípade vysokých nákladov na získanie presných informácií, alebo nepresné a šumom zaťažené dáta.

 

Pod riešením úloh rozumieme odvodzovanie t.j. inferenciu nových znalostí. Novo odvodené znalosti taktiež vstupujú do inferenčného procesu a slúžia pre odvodenie ďalších znalostí. To, či novo odvodené znalosti budú mať rigorózny alebo neurčitý charakter závisí od charakteru znalostí, z ktorých boli odvodené. Sú možné 4 kombinácie. Tieto kombinácie sú uvedené v nasledovnej tabuľke. 

 

 

 

 

Z tejto tabuľky vyplýva, že akonáhle boli použité v inferencii nejaké neurčité znalosti či už v BZ alebo v BD, jej výsledkom je neurčitá novo odvodená znalosť.

Tretí prípad v tabuľke (v BZ sú neurčité znalosti a v BD sú určité znalosti a teda výsledkom je neurčitá znalosť) je možné použiť iba pri jednostupňovej inferencii. V tomto prípade odvodené neurčité znalosti nemôžu byť použité v ďalšom odvodzovaní, pretože sa predpokladá, že BD je určitá a teda nie je možné do nej zapísať neurčitý odvodený fakt.

Existujú systémy, ktoré si vedia poradiť aj s týmto problémom. Napríklad EXSYS (Janota, 2000) vie pokračovať v ďalších stupňoch inferenčného procesu aj keď sa vyskytne neurčitá znalosť v BZ a určitá v BD. EXSYS používa váhy. Tento systém odvodenú neurčitú znalosť transformuje na určitú a to prahovaním.

 

14.               Aké druhy neurčitosti poznáme?

 

 

Neurčitosť znalostí máva rôzne príčiny. Z toho logicky vyplýva existencia rôznych typov neurčitostí. Jednotlivé typy sa od seba odlišujú aj prejavom navonok, pretože vyžadujú rôzne spôsoby spracovania a manipulácie.

 

Najčastejšie používané delenie je založené na príčinách vzniku neurčitosti:

ü  Nekompletnosť (incompleteness) spočíva vo fragmentálnosti ľudských poznatkov (to čo vieme sú iba ostrovčeky poznania). Človek dokáže preklenúť neúplnosť svojich poznatkov pomocou predpokladov o svete. Avšak všeobecné pravidlá (všeobecné znalosti) používané človekom nie sú aplikovateľné vo všetkých prípadoch. Majú výnimky. Preto uvažovanie človeka považujeme za nemonotónne (nemonotónna logika). Keďže sú znalosti chápané ako podmienečne platné, novo príchodzia informácia môže mať za následok ich revíziu. Indikátorom nekompletnosti je výskyt nasledovných lingvistických kvantifikátorov: väčšinou, obvykle, všeobecne, typicky.

ü  Vágnosť (imprecision) súvisí s procesom získavania znalostí od človeka t.j. so zdieľaním znalostí. To málo čo vieme (nekompletnosť) pri podávaní inému človeku ešte skreslíme (vágnosť). Vágne znalostí sú vyjadrované pomocou slov s vágnym významom: vysoký, nízky, starý. Keďže tieto výrazy nemajú jednoznačný význam, môžu byť rôzne pochopené. Vágnosť môže narastať kombináciou lingvistických kvantifikátorov a vágnych slov: obvykle vysoký, veľmi múdry, príliš bolestivý, temer starý.

ü  Neurčitosť (uncertainty) je niekedy zúžene chápaná ako jediný reprezentant neurčitosti v ZS. Odráža subjektívny charakter znalostí, resp. „ľudský faktor“ znalostí, teda: používanie heuristík namiesto algoritmov a matematických teórií, odhady a skúsenosti namiesto exaktných znalostí (v živote je bežné zovšeobecňovanie na základe dvoch, troch prípadov), nevedomosť a neznalosť niektorých vecí a súvislostí, chyba merania, povrchnosť chápania, osobná predpojatosť, dôvera experta v svoje znalosti.

Ak predpokladáme, že x je množina predpokladov a y je množina záverov, potom nekompletnosť vieme definovať tvrdením, že k predpokladu neexistuje záver:

resp., nevieme potvrdiť pravidlo, ale vieme potvrdiť jeho všeobecnejšiu variantu: .

Podobne vágnosť môžeme definovať:

, čo znamená, že poznáme záver, ale nevieme ho presne špecifikovať.

Napokon neurčitosť môžeme definovať: . To znamená, že vzťah nie je zaručený, ale platí s určitou mierou istoty, s určitou váhou. Teda každé produkčné pravidlo je asociované so stupňom korelácie – váhou w (weight). Táto väčšinou číselná váha určuje silu pravidla, resp. stupeň jeho dôveryhodnosti, stupeň jeho spoľahlivosti, alebo mieru dôvery v jeho platnosť.

                    

 

15.               Ako je možné neurčitosť reprezentovať?

 

 

Neurčitosť v BZ (váha produkčného pravidla) môže byť vyjadrená inou formou ako neurčitosť v BD (neurčitosť faktov).

Neurčitosť môže mať formu symbolickú a numerickú. V nasledujúcej tabuľke sú obidve formy stručne charakterizované.

                                                      

 

 

 

Pri symbolickej reprezentácii neurčitosti je exaktnosť znalostí kvalifikovaná slovným popisom spolu s presným pôvodom. Napríklad:        prší (Paľo odhadol)

                                                                                padajú kvapky à prší (Jožo skúsil).

Problémové je pri tejto reprezentácii odvádzanie neurčitosti novej znalosti.

Pri numerickej reprezentácii neurčitosti je exaktnosť znalostí kvalifikovaná numerickou hodnotou bez pôvodu. Odvádzanie neurčitosti nových znalostí nie je problémom, dá sa vyčísliť. Napríklad: prší (70%)

                               padajú kvapky (90%), z toho vyplýva že prší(65%).

Numerická reprezentácia sa ďalej delí podľa:

ü  POČTU POUŽITÝCH HODNôT na jedno hodnotovúviac hodnotovú (typicky dvoj hodnotovú) Pri dvoj hodnotovej neurčitosti sa dôvera a nedôvera vyjadrujú zvlášť. Nedôvera je doplnkom ku dôvere:       . Tieto dve hodnoty sa môžu kombinovať do jednej s názvom činiteľ istoty, alebo do inej dvojice s názvom konfidenčný interval. Konfidenčný interval je interval, v ktorom sa môže nachádzať skutočná neurčitosť.

ü  PODĽA ABSOLÚTNOSTI VYJADRENIA na absolútnu a relatívnu neurčitosť. Absolútna neurčitosť sa vyjadruje priamo zvyčajne reálnym číslom z intervalu alebo . Hraničné hodnoty tohto intervalu udávajú absolútnu platnosť/neplatnosť znalosti. Často sa hodnota vyberá z N celo číselných hodnôt pre potreby mnoho hodnotových logík. Relatívna neurčitosť vyjadruje zmenu absolútnej neurčitosti. Váha pravidla určuje, ako sa zmení neurčitosť záveru v prípade splnenia predpokladov. Patria sem: šanca, činiteľ istoty, miera postačiteľnosti a nevyhnutnosti. Šanca je označovaná ako pravdepodobnostný pomer a je definovaná nasledovne:

 

                          .

 

16.               Aké modely práce s neurčitosťou poznáme?

 

 

V prípade výskytu neurčitosti v pôvodných znalostiach je potrebné nielen odvodzovať nové znalosti, ale aj odvodzovať ich neurčitosť. Hovoríme o šírení neurčitosti cez inferenčnú sieť. Toto šírenie sa deje od predpokladov k záverom podľa určitých pravidiel, ktoré vytvárajú model práce s neurčitou informáciou, resp. kalkul neistého uvažovania.

 

Numerické modely práce s neurčitou informáciou delíme na:

ü  intenzionálne modely. Tieto modely riešia celý problém globálne (Petrušová, 1989). Uvažujú o všetkých závislostiach medzi všetkými znalosťami. Úlohou je nájsť najlepšiu distribúciu neurčitosti, ktorá vyhovuje každej čiastočnej - marginálnej znalosti. Odpovede používateľa sú chápané ako marginálne informácie. Vo všeobecnosti nie je možná žiadna konkrétna kombinačná funkcia. Spôsob odvádzania nových váh musí čo najlepšie aproximovať čiastočné – marginálne znalosti, preto sa mení pri každom konkrétnom prípade. Problémom tohto prístupu je obtiažna modifikovateľnosť BZ a dlhé trvanie odvádzania distribúcie neurčitosti. Prednosťou tohto prístupu je, že po odvodení poznáme všetky závislosti a vieme, že riešenie je teoreticky správne.

ü  extenzionálne modely. Sú založené na princípe lokálnosti t.j. šírení neurčitosti iba v nejakom lokálnom okolí. Taktiež sú založené na princípe extenzionality. Extenzionálne modely predpokladajú existenciu kombinačných funkcií, ktoré sa nemenia od prípadu k prípadu. Výpočet inferenčných váh je realizovaný pevne zvolenou sadou operácií. Výhody extenzionálnych modelov sú nasledujúce: rýchlosť, jednoduchosť, ľahká modifikovateľnosť, ľahká implementovateľnosť. Na druhej strane nevýhodou týchto modelov je, že si nemôžu nárokovať teoretickú správnosť. Teoretická správnosť je totiž podmienená dodržaním určitých obmedzení (napríklad nezávislosť predpokladov), ktoré v praxi často nie sú dodržané. Často nie sú známe ani znalostnému inžinierovi. Teoretická správnosť sa ťažko overuje. Často ani samotní experti nemajú predstavu, čo by malo vyjsť ako správny výsledok.

Princíp extenzionality hovorí, že pravdivostná hodnota zloženého výroku je určená pravdivostnou hodnotou jeho zložiek a nezávisí od platnosti výrokov, ktoré nie sú jeho súčasťou.

Extenzionálne modely práce s neurčitosťou delíme podľa spôsobu reprezentácie neurčitosti na: logické, pravdepodobnostné, fuzzy a hybridné, ktoré spájajú prednosti rôznych modelov. Vzájomný vzťah rôznych modelov je ilustrovaný nasledovným obrázkom. 

 

 

 

17.               Ako je definovaný všeobecný extenzionálny model?

 

 

Pre symbolické a intenzionálne modely neexistuje všeobecne platný model šírenia neurčitosti. Pre extenzionálne modely existuje model šírenia neurčitosti v tvare sady kombinačných funkcií. V takomto modeli platí princíp modularity, ktorý vyplýva z princípu extenzionality. Princíp modularity znamená, že produkčné pravidlo môže byť pridané, resp. vyňaté z BZ bez uvažovania interakcií s inými produkčnými pravidlami. Táto modifikovateľnosť, podobne ako princíp extenzionality, predpokladá splnenie požiadavky vzájomnej nezávislosti predpokladov (čo v praxi často nie je splnené).

Kombinačné funkcie udávajú predpis pre manipuláciu s neurčitosťou v priebehu jej šírenia inferenčnou sieťou. Inferenčná sieť je zložená z elementárnych typov sietí a ku každému z nich existuje jedna kombinačná funkcia. Extenzionálny model spracováva znalosti neurčité, ale prípadne aj určité. Tieto znalosti sa vyjadrujú AND/OR grafom, prispôsobeným na propagáciu neurčitosti. Sem patria tri typy elementárnych informačných sietí a im odpovedajú tri kombinačné funkcie: negácia, konjunkcia a disjunkcia.

1)     Kombinačná funkcia negácia transformuje neurčitosť predpokladu na neurčitosť jeho negácie a je definovaná nasledovne:   .

2)     Kombinačná funkcia konjunkcia transformuje neurčitosť predpokladov na neurčitosť ich konjunkcie a je definovaná nasledovne: .

3)     Kombinačná funkcia disjunkcia transformuje neurčitosť predpokladov na neurčitosť ich disjunkcie a je definovaná nasledovne: .

Neurčitosť v BZ predstavuje prenos znalostí cez neurčité produkčné pravidlá. Poznáme neurčitosť predpokladu N(P) a neurčitosť produkčného pravidla N(P-->Z). Dostaneme buď priamo neurčitosť záveru N(Z), alebo príspevok k neurčitosti záveru, ak existuje viac produkčných pravidiel s týmto záverom. Neurčitosť záveru, resp. príspevok dostaneme pomocou funkcie CTR a príspevky budeme skladať pomocou funkcie GLOB.

4)     Kombinačná funkcia CTR je definovaná nasledovne     . Táto funkcia umožňuje reťaziť neurčité produkčné pravidlá, preto sa niekedy označuje ako sekvenčná kombinácia.

5)     Kombinačná funkcia GLOB skladá príspevky od jednotlivých pravidiel, získaných pomocou CTR. Je definovaná nasledovne  . Používa sa v prípade existencie viacerých pravidiel s rovnakým záverom. Niekedy sa preto označuje ako paralelná kombinácia.

Jednotlivé extenzionálne modely používajú ako sadu svojich kombinačných funkcií nejakú podmnožinu množiny {NEG, CONJ, DISJ, CTR, GLOB}. Funkcia DISJ sa málo používa.

 

 

V ďalšom sa budeme venovať nasledovným konkrétnym extenzionálnym modelom práce s neurčitou informáciou: Subjektívna Bayes-ovská metóda, Algebraická teória, Dempster-Shafferova metóda, Fuzzy model.

 

 

 

 

 

 

 

 

 

18.               Prečo je Subjektívna Bayes-ovská metóda spracovania neurčitosti subjektívna?

 

 

Pretože vychádza z teórie pravdepodobnosti chápanej v subjektívnom zmysle, nie vo frekvenčnom zmysle. Zatiaľ čo frekvenčná definícia pravdepodobnosti predstavuje pomer početnosti výskytov sledovaného javu k početnosti výskytov všetkých javov, subjektívna definícia pravdepodobnosti predstavuje pomer odhadu početnosti výskytov sledovaného javu k početnosti výskytov všetkých javov.

   Subjektívna Bayes-ovská metóda je jednou z najčastejšie používaných spôsobov práce s neurčitosťou (Berka, 1994). Zohľadňuje tak neurčitosť pravidiel (hrany inferenčnej siete), ako aj apriórnu neurčitosť výrokov (uzlov inferenčnej siete). Apriórna neurčitosť je daná „a priori“ pred začatím procesu šírenia neurčitosti. V procese šírenia neurčitosti v inferenčnej sieti sa mení na aposteriórnu.

Neurčitosť produkčného pravidla môže byť v Bayes-ovskej metóde vyjadrená dvojakým spôsobom:

ü  absolútne. Pri absolútnom vyjadrení neurčitosti  sa používajú podmienené pravdepodobnosti, a to P(H/E) ako pravdepodobnosť záveru H v prípade splnenia predpokladu E a P(H/~E) ako pravdepodobnosť záveru H v prípade nesplnenia predpokladu E.

ü  relatívne. Relatívne vyjadrenie neurčitosti môže mať formu miery postačiteľnosti a miery postačiteľnosti. Miera postačiteľnosti LS (logical sufficiency) vyjadruje zmenu šance záveru v prípade splnenia predpokladu. Veľká hodnota LS spôsobí veľký nárast šance záveru H. Hovoríme, že predpoklad E je postačujúci k dokázaniu H. Ak predpokladáme, že O(H) je apriórna  a O(H/E) aposteriórna šanca, potom je možné LS definovať:  , pričom platí: . Na druhej strane miera nevyhnutnosti LN (logical necessity) vyjadruje zmenu šance záveru v prípade nesplnenia predpokladu. Malá hodnota LN spôsobí pokles šance. K dokázaniu záveru H je nutná platnosť predpokladu E. Platí: .

 

19.               Ako je v Subjektívne Bayes-ovskej metóde definovaná kombinačná funkcia CTR?

 

 

Predpokladajme, že v procese inferencie predpoklad E nadobúda nejakú aposteriórnu pravdepodobnosť P(E/E’). E’ označuje relevantné porovnanie súvisiace s konkrétnym prípadom. Na základe konkrétneho pozorovania je možné pravdepodobnosť záveru zložiť z dvoch zložiek: z podpory od splnenia a podpory od nesplnenia predpokladu, čo je možné vyjadriť nasledovne: .

Ak poznáme pravdivostnú hodnotu výroku E, potom pozorovanie neprináša ďalšie informácie o hypotéze H a teda platí:  .  To nám umožňuje nasledovné úpravy:  

Výsledkom uvedeného odvodenia je priamka, ktorá je znázornená v nasledovnom obrázku.

 

Túto priamku zalomíme takým spôsobom, aby obsahovala aj apriórne pravdepodobnosti predpokladu a záveru, teda P(E) a P(H). Interpoláciou týchto troch bodov vznikne lineárna lomená funkcia, ktorá prestavuje definíciu kombinačnej funkcie CTR v nasledovnom tvare:

 

.

 

Funkcia CTR môže mať aj iný tvar, ako je uvedené na predchádzajúcom obrázku. Pre ilustráciu nasledujú niektoré neobvyklé prípady funkcie CTR. 

      

Ako je v Bayes-ovskej metóde definovaná funkcia GLOB a ostatné kombinačné funkcie?

 

 

Skladanie príspevkov jednotlivých pravidiel s tým istým záverom do aposteriórnej pravdepodobnosti záveru je realizované v relatívnom tvare. Určia sa váhy jednotlivých pravidiel, kde váha j-teho pravidla je definovaná: , pričom L predstavuje mieru postačiteľnosti LS. Pri splnení predpokladu štatistickej nezávislosti jednotlivých predpokladov, možno definovať funkciu GLOB nasledovne: .

 Táto definícia funkcie GLOB nám poskytuje výslednú aposteriórnu šancu záveru, ktorú je potrebné transformovať na výslednú aposteriórnu pravdepodobnosť záveru. Pre túto transformáciu môže poslúžiť nasledovná formula: .

 

Ostatné kombinačné funkcie sú v Bayes-ovskej metóde spracovania neurčitosti definované nasledovne:

ü  Funkcia NEG je definovaná formulou: .

ü  Pre funkciu CONJ zase platí:.

ü  Napokon funkcia DISJ je definovaná:.

 

 


20.               Čo predstavuje takzvaný intuitívny model spracovania neurčitosti?

 

 

Intuitívny model spracovania neurčitosti predstavuje úvod ku algebraickej teórii, t.j. ďalšej metóde spracovania neurčitosti.

Aj keď jednotlivé kombinačné funkcie môžu byť definované rôzne, intuitívne možno stanoviť ich interpretáciu. V ďalšom sa budeme zaoberať iba funkciami CTR a GLOB. Predpokladáme existenciu troch špeciálnych hodnôt:

                        ß-minimálny prvok – úplná neplatnosť, napríklad -1

                        - neutrálny prvok

                        Ý- maximálny prvok – úplná platnosť, napríklad +1.

Produkčné pravidlo s neurčitosťou môžeme potom interpretovať nasledovne: ak je predpoklad úplne splnený (je pravdivý), potom záver platí s váhou w: . Ak predpoklad nie je splnený úplne, potom príspevok pravidla k posilneniu dôvery v záver pravidla je menší ako w. Čím väčšia je neurčitosť predpokladu, tým menší je príspevok k platnosti záveru.

Z uvedeného vyplývajú určité podmienky pre funkcie CTR a GLOB. Pre sekvenčnú kombinačnú funkciu CTR musia byť splnené predpoklady spojitosti a monotónnosti. Ďalej platí:

ü  Niekedy sa funkcia CTR uvažuje iba v intervale . V intervale potom platí .

ü  Inokedy sa uvažujú obidva intervaly, a teda uvažuje sa aj komplementárne pravidlo ~P--> Z.

Pre paralelnú kombinačnú funkciu GLOB musí platiť:

ü  Ak prvé aj druhé produkčné pravidlo podporuje záver, potom výsledná váha je posilňovaná.

ü  Ak prvé aj druhé produkčné pravidlo oslabuje záver, potom výsledná váha je oslabovaná.

ü  Ak jedno pravidlo záver podporuje a druhé ho vyvracia, potom sa vplyvy eliminujú a výsledná váha odpovedá vplyvu silnejšieho produkčného pravidla, oslabovaného vplyvom slabšieho pravidla.

Nasledujú ďalšie vlastnosti funkcie GLOB za predpokladu že e1, e2 a e3 sú príspevky troch produkčných pravidiel k platnosti záveru:

1)     Komutatívnosť znamená, že výsledok nezávisí na poradí uvažovania príspevkov a je definovaná:  .

2)     Asociatívnosť umožňuje spracovávanie príspevkov vždy po dvoch:  .

3)     Neutrálny prvok má tú vlastnosť, že výsledná váha na ňom nezávisí:  .

4)     Opačný prvok zohráva svoju úlohu v prípade, ak jedno pravidlo posilňuje a druhé oslabuje záver. Navzájom sa eliminujú, ak sú ich vplyvy rovnaké, čo je definované:  .

5)     Monotónnosť je vlastnosť, ktorá sa dá interpretovať tvrdením, že čím je vyšší príspevok predpokladu pravidla, tým je vyššia váha záveru pravidla:  .

 

21.               Čo sú to metaznalosti a ako ich delíme?

 

 

Metaznalosti sú znalosti o znalostiach, ktorých použitím sa stáva práca so znalostným systémom efektívnejšou. Nie sú to znalosti o riešenej úlohe. Sú lokalizované mimo inferenčný mechanizmus v samostatnom bloku. Výnimkou sú metaznalosti o neurčitosti, ktoré sú zabudované priamo v inferenčnom mechanizme. Sú reprezentované takzvanými metapravidlami. Uvedieme príklad takýchto metapravidiel: 

 MP1: Pravidlá zabezpečujúce bezpečnosť ľudí majú prednosť pred ostatnými.

§ Dáva strategický návod pre výber pravidiel.

§ Zužuje priestor prehľadávania, čím zlepšuje prácu systému.

 MP2: Pravidlá týkajúce sa rozpustnosti a pH sa budú meniť zriedkavo.

§ Slúži pri tvorbe a ladení bázy znalostí.

 MP3: Pravidlo R6 pracuje preto, lebo vápno s kyselinou sírovou vytvára usadeninu.

§ Objasňuje podmienky použitia niektorého pravidla.

§ Môže slúžiť používateľovi na vysvetlenie záveru znalostného systému.

§ Môže slúžiť systému, napr. došlo vápno a systém chce vedieť, či ho môže nahradiť lúhom.

 

Metaznalosti môžu mať charakter:

ü   znalostí o úlohe, ktoré sa získavajú od znalostného experta, a

ü   znalostí o systéme, ktoré sa získavajú od experta - tvorcu prostriedkov.

 

V rannom štádiu návrhu znalostný inžinier zhromažďuje znalosti o úlohe a znalosti o vytváranom programe. V pokročilom štádiu systém rastie a preberá na seba úlohy chápania svojej činnosti, dokumentovania a zdôvodňovania svojej činnosti, a prípadne aj úlohu vlastnej modifikácie.

Reprezentácia metaznalostí je zhodná s reprezentáciou znalostí v báze znalostí. Ak je príslušná znalosť  v BZ, po odvodení sa môže sprístupniť používateľovi vo forme výsledku. Ak je znalosť z bloku Metaznalosti, jej záver ovplyvní výber produkčného pravidla v inferenčnom mechanizme, ale navonok, smerom k používateľovi, sa neprejaví.

 

Podľa spôsobu použitia rozoznávame niekoľko druhov metaznalostí:

1)    Metaznalosti pre výber pravidiel

2)    Podporné znalosti o znalostiach

3)    Metaznalosti definujúce zmysel pravidiel

4)    Detekcia chýb v pravidlách

5)    Zdôvodňovanie architektúry systému

6)    Adaptácia znalostí na novú situáciu

7)    Modelovanie možností znalostného systému.

22.               Čo sú to strategické metaznalosti?

 

 

Strategické metaznalosti sú vlastne metaznalosti pre výber pravidiel. Nasleduje príklad takýchto metaznalostí. Majme produkčné pravidlá:

 

                        PP1: Ak bol únik kyseliny sírovej

                                 Potom použi látku x

                        PP2:  Ak bol únik kyseliny sírovej

                                 Potom použi látku y

 

Aby sme vedeli ktoré z pravidiel PP1 a PP2 použiť, musíme definovať metapravidlá pre výber pravidiel, resp. strategické metapravidlá:

 

                        MP3: Ak je viac alternatív

                                 Potom použi lacnejšiu alternatívu

                        MP4: Ak je viac alternatív

                                 Potom použi menej riskantnú alternatívu

                        MP5: Ak je viac alternatív

                                 Potom použi alternatívu od väčšej autority

 

Avšak, produkčný systém stále nevie s týmito pravidlami pracovať, kým mu nedodáme nasledovné informácie

 

 

Stratégia metapravidla MP3 vyberie PP2.

Stratégia metapravidla MP4 nás zavedie na PP1.

Stratégia metapravidla MP5 odpáli PP2.

 

Či sa vykoná najprv PP1 alebo PP2 závisí od toho, ktoré metapravidlo sa použije. Teda musíme vyriešiť problém, ktorú metaznalosť uprednostniť. Na to potrebujeme metapravidlá o metapravidlách, t.j. metapravidlá druhého stupňa. Metapravidlá druhého stupňa sú znalosti o metapravidlách prvého stupňa. Metapravidlá prvého stupňa sú znalosti o metapravidlách nultého stupňa t.j. produkčných pravidlách. Metapravidlá druhého stupňa sú aplikovateľné samé na seba. Uvedieme príklad.

ü  Predpokladajme, že MP3 sformuloval ekonóm závodu, lebo uprednostňuje lacnejšiu alternatívu. Ďalej predpokladajme, že MP4 sformuloval špecialista a ten uprednostňuje menšie riziko. Ak na tieto metapravidlá aplikujeme MP5, ktoré uprednostňuje väčšiu autoritu, MP5 vyberie MP4 a to odpáli PP1.

ü  Predpokladajme, že MP3 vedie často ku katastrofám, lebo uprednostňuje lacnejšie materiály, zatiaľ čo MP5 je menej riskantné. Ak na tieto metapravidlá aplikujeme metapravidlo MP4, ktoré uprednostňuje menšie riziko, MP4 vyberie MP5 a to odpáli PP2.

 

Strategické metapravidlá môžu mať aj všeobecnejší charakter, napríklad:

                        Ak chcete pravidlá, ktoré vyriešia y

                        Potom hľadajte y

                        Inak hľadajte všeobecnejšie pravidlá obsahujúce y.


23.               Na čo sa používajú podporné znalosti o znalostiach?

 

 

Na rozdiel od strategických metaznalostí, podporné metaznalosti nehrajú aktívnu úlohu v rozhodovaní o výbere pravidiel. Majú skôr pomocný charakter. Príkladom podporných metaznalostí sú dodatočné informácie o miere rizika, o autorite pôvodcu a o cene chemickej komponenty (môže byť zadaná priamo alebo spôsobom výpočtu), ktoré boli uvedené v príklade strategických metaznalostí. Ak by nebola zabezpečená dostupnosť takýchto informácií nebolo by možné dané strategické metaznalosti vôbec použiť. Na druhej strane, úloha by mohla byť riešiteľná aj bez metapravidiel, aj keď ťažkopádnejšie.

Podporné znalosti môžu mať aj formu automatických štatistických pozorovaní o pravidlách, ktoré sa v niektorých znalostných systémoch realizujú. Sú to informácie druhu:

o    koľkokrát bolo pravidlo použité

o    koľkokrát bolo pravidlo použité s úspechom a koľkokrát s neúspechom

o    aký je priemerný čas vykonania pravidla

o    počet prípadov, kedy systém prerušuje svoju prácu a obracia sa s otázkou na používateľa.

Vznikajú tak empirické dáta o využití pravidiel, resp. zdrojov. Tieto údaje vo forme metaznalostí môžu byť využité pri návrhu znalostného systému.

Podobným typom metaznalostí sú znalosti ktoré určujú, nakoľko je presný výsledok pri použití danej metódy.

Zápisy o tom, čo sa v systéme dialo, o cene, o stupni rizika predstavujú teda nový typ metaznalostí t.j. podporných metaznalostí, ktoré majú opisný, objasňujúci nie aktívny charakter. Teda typ metaznalostí odlišných od strategických, ktoré vytvárajú efektívnu a vykonateľnú radu systému, používanú pre riadenie procesu riešenia.


24.               Čo sú to metaznalosti definujúce zmysel pravidiel?

 

 

Metaznalosti definujúce zmysel pravidiel predstavujú dodatočnú informáciu, ktorá objasňuje zmysel pravidla, reprezentujúceho znalosť. Napríklad majme produkčné pravidlo PP, ktoré hovorí, že keď došlo k znečisteniu látkou X je potrebné použiť na jej neutralizáciu látku A. Ideme do skladu, a tam látka A nie je, ale je tam látka C. Otázka znie: môžeme použiť látku C? Nevieme sa rozhodnúť, lebo v BZ nie sú o látke C žiadne informácie. Naviac nepoznám väzbu medzi X a A. Keby sme vedeli ako spolu reagujú, mohli by sme zistiť, či aj C reaguje s X tak isto. Ak reaguje tak isto, môže zlúčenina klesnúť na dno, resp. neklesne, ale sa pozbiera z hladiny. Nasleduje príklad troch pravidiel, ktorých súčasťou je aj definovaný ich zmysel.

              PP6:  Ak bol únik kyseliny sírovej

                        Potom použi vápno

                        Zmysel: Vápno zneutralizuje túto kyselinu a vytvorí nerozpustnú zrazeninu

              PP7:  Ak bol únik kyseliny octovej

                        Potom použi vápno

                        Zmysle: Vápno zneutralizuje túto kyselinu a vytvorí nerozpustnú zrazeninu

              PP8:  Ak bol únik kyseliny soľnej

                        Potom použi vápno

                        Zmysel: Vápno zneutralizuje túto kyselinu a vytvorí nerozpustnú zrazeninu

 

Ak sa stane, že nemáme k dispozícii vápno, ale lúh. Musíme nájsť odpoveď na otázku: či aj lúh zneutralizuje príslušnú kyselinu a vytvorí s ňou nerozpustnú zrazeninu. Z bázy znalostí by sme sa dozvedeli:

 

              lúh + kyselina sírová tvoria rozpustnú zrazeninu

              lúh + kyselina octová tvoria nerozpustnú zrazeninu

              lúh + kyselina soľná tvoria nerozpustnú zrazeninu

 

Z toho vyplýva, že lúh nemôžeme použiť na neutralizáciu kyseliny sírovej, ale môžeme ho použiť na neutralizáciu kyseliny octovej a soľnej.

Aj návrh o zámene vápna lúhom môže mať svoj zmysel, čo je ilustrované nasledujúcim príkladom:

 

              MP:  Ak nie je vápno

                        Potom preskúmajte možnosť jeho zámeny lúhom

                        Zmysel: Lúh môže neutralizovať kyseliny

 

Čo všetko sa môžeme dozvedieť zo zmyslu pravidla?

Často chceme vedieť, na čom spočíva dôvera v nejaké pravidlo:

o    či pravidlo pochádza z dedukcie, alebo indukcie,

o    či bolo získané z experimentu alebo od autority.

Pri neurčitých pravidlách:

o    odvádzame šancu pravidla na úspech,

o    odhadujeme riziko použitia pravidla.

Používateľ môže chovať nedôveru k výsledkom znalostného systému a chcel by vedieť:

o    nakoľko je pravidlo spoľahlivé v praxi?

o    od koho boli produkčné pravidlá získané?

o    prečo sa predpokladá, že pracuje správne?

 

25.               Môžu metapravidlá detekovať chyby v pravidlách?

 

 

V princípe je to možné. Uvažujme dva pomerne často sa vyskytujúce prípady chybných pravidiel.

Po prvé, predpokladajme, že sa v BZ z nejakých dôvodov vyskytlo pravidlo:

 

PP9:    THEN Použite vápno.

 

Takéto pravidlo, ktorému chýba podmienková časť, musí byť systémom zachytené a systém musí následne požiadať znalostného inžiniera, aby pravidlo potvrdil, alebo opravil. Mohlo sa stať, že pre dané pravidlo má platiť tá istá podmienková časť ako pre predchádzajúce, ale znalostný inžinier ju zabudol doplniť.

 

Po druhé, často sa vyskytujúca chyba je, že pravidlo obsahuje podmienky, ktoré sa nedajú splniť, napríklad:

 

              PP10:         Ak potrebujeme neutralizovať kyselinu

                                 a súčasne máme lieh

                                 a súčasne nemáme nič s vysokým pH

                                 Potom ...

 

Tretia podmienka sa ťažko overuje. Lepšie by bolo nahradiť ju podmienkou „nemáme nič iné s vysokým pH“. Bez toho slovíčka „iné“, nebude dané pravidlo nikdy odpálené. Bez toho slovíčka „iné“ je v pravidle rozpor: ak máme lieh, tak máme niečo s vysokým pH.

Tieto chyby by mohli byť korigované nasledovnými metapravidlami:

 

              MP11:        Ak pravidlo neobsahuje IF časť

                                 potom navrhni korekciu, alebo vyžiadaj potvrdenie

              MP12:        Ak počas behu systému nebolo niektoré pravidlo použité

                                 potom sa spýtaj, či jeho podmienky nepotrebujú korekciu.


26.               Môžu metapravidlá zdôvodňovať architektúru znalostného systému?

 

 

V princípe je to možné, pretože otázky na systém môžu ísť niekedy do takej hĺbky, že sa týkajú jeho architektúry. Na ich zodpovedanie sú potrebné znalosti tak experta ako aj človeka zodpovedného za vytvorenie systému, zväčša znalostného inžiniera. Môže ísť o otázky typu: Prečo bola vybratá taká pomalá štruktúra riadenia? Prečo sa systém nevie vrátiť niekoľko krokov dozadu? Na zodpovedanie otázok tohto druhu je potrebné systém vybaviť veľkou zásobou vedomostí, týkajúcich sa samotnej konštrukcie ZS. Takých vedomostí ako napríklad: Z čoho pozostáva úloha? Ako ju treba riešiť? Aké sú varianty reprezentácie riadiacich štruktúr? Aké sú výhody a nedostatky riadiacich štruktúr? Ďalej sú uvedené príklady metaznalostí zdôvodňujúcich architektúru systému:

 

              MP13:        Ak je priestor riešení malý

                                 Potom použi metódu úplného prehľadávania

              MP14:        Ak je produkčný systém zriedkavo modifikovaný

                                 Potom ho skompiluj

 

-        Metaznalosť MP13 umožňuje konštruktérovi, ktorý pozná rozmer úlohy, vybrať si spôsob ovládania, riadenia riešenia, resp. spôsob prehľadávania priestoru riešení. Konkrétny používateľ sa môže spýtať: Prečo bolo použité toto pravidlo? Systém odpovie: Lebo používam úplné prehľadávanie. Odpoveď je inšpirovaná metapravidlom MP13. Teda, MP13 môže byť použité trojako:

o    ako pomoc konštruktérovi systému

o    ako pomoc pri riešení úlohy

o    ako pomoc pri odpovedi na otázky používateľa.

 

27.               Ako sa uskutočňuje adaptácia znalostného systému na novú situáciu pomocou metapravidiel?

 

 

V prvom rade si musíme položiť otázku: Môže systém sám meniť svoju konfiguráciu na základe získaných skúseností? Skôr než odpovieme, uvažujme nasledovné metapravidlá:

 

              MP15:        Ak sa ukáže, že niektorá podmienka je častejšie nesplnená ako ostatné

                                 Potom zaraď túto podmienku na začiatok podmienkovej časti

              MP16:        Ak sa časť kódu programu systému vyvoláva často

                                 Potom je účelné sa zaoberať jeho optimalizáciou

              MP17:        Ak určitý typ používateľa používa znalostný systém iba zriedkavo

                                 Potom je vhodné vymazať model tohto používateľa zo systému

 

Podmienkové časti týchto metapravidiel popisujú novú situáciu, v ktorej sa systém nachádza, napríklad: V poslednej dobe je niektorá podmienka častejšie nesplnená. Alebo, časť kódu programu sa vyvoláva často. Resp. tento používateľ  v poslednej dobe systém takmer nepoužíva.

Záverové časti týchto metapravidiel predstavujú reakciu znalostného systému na túto novú situáciu: preusporiadaj podmienky, optimalizuj kód, vymaž model používateľa. Dá sa taktiež povedať, že predstavujú formu adaptácie systému na novú situáciu.

Takéto pravidlá môžu fungovať iba v systéme s evidenciou frekvencie používania jednotlivých častí kódu, s evidenciou strednej doby práce jednotlivých kódov. Z toho vyplýva, že metaznalosti umožňujúce adaptáciu na novú situáciu pracujú v súčinnosti s podpornými, opisnými metaznalosťami.


28.               Je možné modelovať možnosti systému pomocou metaznalostí?

 

 

V prvom rade by sme si mali objasniť, čo to znamená „modelovanie možností systému“. V podstate ide o to, že systém má zmapované vlastné možnosti. To znamená, že vie, ktoré úlohy dokáže riešiť, a ktoré nie, prípadne ktoré problémy vyrieši ale riešenie pravdepodobne nebude dostatočne validné. Uvedieme príklad: Keď sa vás spýtajú na vaše telefónne číslo, hneď odpoviete. Keď sa vás spýtajú na telefónne číslo známeho, poviete, že sa musíte pozrieť do zoznamu. Keď sa vás opýtajú na telefónne číslo prezidenta, uvedomíte si, že je zbytočné pozerať sa do zoznamu a jednoducho poviete: „neviem“. Pri rozhodovaní o tom, či použijete pamäť, zoznam, alebo sa vzdáte, používate znalosti o tom, čo poznáte a čo nie, ktoré úlohy ste schopný riešiť a ktoré nie, koľko času Vám zaberie riešenie úlohy, a teda, či má zmysel začínať s riešením. Slovíčko „neviem“ je prejavom vašej sebareflexie. Modelovanie možností systému je modelovaním sebareflexie systému. Uvedieme príklady metaznalostí, modelujúcich možnosti systému:

 

              MP18:        Ak je vzniknutá látka biologicky aktívna

                                 Potom báza znalostí nie je adekvátna na riešenie úlohy

                                 (dokáže riešiť len chemické znečistenie)

              MP19:        Ak sa vzniknutá látka nenachádza v zozname látok

                                 Potom báza znalostí nie je kompetentná pre riešenie úlohy

 

Program, ktorý je vybavený takýmito metaznalosťami, môže na niektoré situácie reagovať pružnejšie a rýchlejšie. MP18 oznamuje, že eventuálne prijaté závery nie sú adekvátne situácii. MP19 umožňuje systému vyhnúť sa odvodeniam, ktoré by aj tak neviedli k výsledku. Modelovanie sebareflexie znalostného systému je nevyhnutné v oblastiach, v ktorých chyby nie sú prípustné.

 

 

29.               Ako je možné získavať znalostí pre znalostný systém?

 

 

Podľa cieľa môžeme metódy používané pre získavanie znalostí deliť na:

ü  získavanie nových znalostí (BZ je na začiatku prázdna)

ü  zjemňovanie (modifikácia, dopĺňanie) existujúcich znalostí (BZ nie je na začiatku prázdna).

Báza znalostí predstavuje explicitné vyjadrenie znalostí obsiahnutých v nejakom znalostnom zdroji. Znalostný zdroj môže byť predstavovaný expertom, databázou, empirickými dátami, knihou, expertízou a podobne. Explicitné vyjadrenie znalostí môže mať formu produkčných pravidiel, predikátovej logiky, rámcov a podobne. Proces získavania znalostí je ilustrovaný nasledovným obrázkom:

 

 

Subjekt získavania znalostí, teda znalostný inžinier, hrá centrálnu úlohu v procese získavania znalostí. Znalostný inžinier v spolupráci so znalostným zdrojom získava buď priamo znalosti, ktoré transformuje do BZ, alebo dáta, ktorých extrakciou získa pravidlá pre BZ.

V princípe existujú tri najznámejšie spôsoby získavania znalostí:

ü  klasickou cestou. Je to historicky najstarší model. V tomto modeli robí znalostný inžinier spojovací medzičlánok medzi BZ a expertom ako znalostným zdrojom. Konzultuje s expertom jeho znalosti a vkladá ich do BZ. Slabým miestom tohto spôsobu získavania znalostí je tak expert ako aj znalostný inžinier. Znalostný inžinier preto, lebo je laikom v danej oblasti. Musí pochopiť aspoň základy domény a toto učenie je zdĺhavé a neefektívne. Expert preto, lebo nie je vždy schopný vyjadriť svoje znalosti ktoré používa na riešenie úloh. Jeho riešenia sú často podvedomé, vychádzajúce zo skúsenosti. Často je zaneprázdnený a niekedy sa obáva konkurencie znalostných systémov.

ü  priamym prenosom. Priamy prenos je pokusom vylúčiť z procesu získavania jedno jeho slabé miesto, a to znalostného inžiniera. Pri tomto spôsobe je BZ vytváraná priamo expertom v príslušnom editore a v dohodnutom formáte. BZ vytvára expert, oboznámený s problematikou programovania. Nevyhnutný je inteligentný modul priameho získavania znalostí, ktorý nie je pasívnym príjemcom znalostí, ale pomáha expertovi vyjadrovať znalosti, navádza ho a kontroluje, dokáže odhaliť logický rozpor, musí mať rozsiahle dialógové schopnosti a musí mať znalosti o štruktúre BZ.

ü  strojovým učením. Strojové učenie je pokusom vylúčiť z procesu získavania ďalšie jeho slabé miesto, a to experta. Strojové učenie sa v princípe delí na induktívne a deduktívne. V znalostných systémoch sa používa induktívne strojové učenie, ktoré indukuje, resp. generuje produkčné pravidlá pre BZ priamo z trénovacích príkladov reprezentujúcich typické situácie.

Všetky metódy získavania znalostí majú svoje výhody a nevýhody. Niektoré sa používajú v počiatočných fázach procesu budovania BZ, iné v neskorších. Väčšinou sa používa klasická cesta doplnená induktívnymi metódami strojového učenia.

Pri dopĺňaní BZ a jej modifikácii sa spravidla aplikuje klasická cesta. Spravidla je BZ dopĺňaná znalosťami, ktoré súvisia s už danými znalosťami v BZ. Práca (Bieliková a kol., 1992) pojednáva o podpore vývoja znalostných systémov.


30.               Čo môžeme získať strojovým učením?

 

 

Pomocou algoritmov strojového učenia môžeme získať produkčné pravidlá pre BZ priamo z typických príkladov. Strojové učenie je vo svojej podstate induktívnym učením (Michalski at all, 1983). Nevychádza z expertných znalostí, ale z typických príkladov. V terminológii strojového učenia sa typický príklad označuje častejšie pojmom trénovací príklad. Množina spravidla veľkého počtu trénovacích príkladov sa nazýva trénovacia množina. Trénovací príklad pozostáva z dátovej a rozhodovacej časti. Dátová časť popisuje prípad. Dátová časť obsahuje množinu atribútov (v nasledovnej tabuľke je množina atribútov = {Inteligencia, Tvorivosť, Usilovnosť} ) s ich hodnotami (v nasledovnej trénovacej tabuľke napríklad: Inteligencia = výnimočná). Rozhodovacia časť slúži pre klasifikáciu daného prípadu do triedy. Ide o rozhodnutie, resp diagnostikovanie napríklad choroby alebo poruchy. V nasledujúcej trénovacej tabuľke ide o diagnostikovanie úspechu na skúške, pretože trieda do ktorej môže byť príklad diagnostikovaný je: Výsledok.        

 

 

Tento typ učenia je takzvané kontrolované učenie, resp. učenie s učiteľom. Predpokladá sa, že je vopred známa množina riešení, množina tried. Našou úlohou je vybrať jedno z možných riešení, resp. klasifikovať úlohu do triedy. Existuje aj opačná alternatíva, keď nie je známa množina možných riešení a ide o nekontrolované učenie. Príkladom nekontrolovaného učenia je zhlukovanie.

Atribúty v dátovej časti trénovacieho príkladu môžu byť rôzneho druhu:

ü  binárne – majú dvoj prvkovú množinu hodnôt napríklad:   

ü  nominálne – majú konečnú neusporiadanú množinu hodnôt, napríklad:

ü  ordinárne – majú konečnú usporiadanú množinu hodnôt, napríklad množina vlnových dĺžok farieb, alebo množina:

ü  numerické – majú numerické hodnoty, spravidla usporiadané

ü  reálne – majú nekonečný počet reálnych hodnôt

ü  hierarchické – majú hodnoty, medzi ktorými sú hierarchické vzťahy, napríklad:

 

Cieľom strojového učenia je nájsť rozhodovaciu štruktúru (produkčné pravidlo, rozhodovací strom), ktorá pre dátovú časť každého príkladu nájde triedu, t.j. jeho rozhodovaciu časť.


31.               Prečo a ako generujeme rozhodovacie stromy?

 

 

Rozhodovacie stromy (Quinlan, 1990), (Quinlan, 1993) generujeme preto, lebo z nich ľahko získame produkčné pravidlá pre BZ znalostného systému. Naviac, rozhodovacie stromy sú prehľadné. Rozhodovací strom je grafická reprezentácia rozhodovacej procedúry. Slúži na klasifikáciu trénovacích príkladov do tried, pričom klasifikácia môže byť dvojtriedna, alebo viactriedna. Napríklad z nasledovnej trénovacej množiny:

 

 

Je možné generovať takýto rozhodovací strom:

Rozhodovací strom je teda orientovaný acyklický graf, ktorý obsahuje koreňové, medziľahlé a listové uzly. Listový uzol odpovedá triede. Nelistový uzol obsahuje špecifický test, ktorý rozdeľuje priestor príkladov podľa výsledku testu, ktorý má spravidla tvar: atribút = hodnota. Atribút, ktorý vyberieme zo všetkých atribútov a umiestnime v nelistovom uzle stromu sa nazýva testovací atribút. Podmienková časť produkčného pravidla potom predstavuje konjunkciu podmienok na ceste od koreňa k listom. Záver pravidla je trieda, ktorá sa nachádza v listovom uzle na konci cesty. Z vyššie uvedeného stromu je možné generovať nasledovné pravidlá:       AK  A1=malý                                                            POTOM trieda (+)

AK  A1=v norme & A2=áno & A3=vyzretý            POTOM trieda (+)

AK  A1=v norme & A2=áno & A3=čiast vyzretý    POTOM trieda (+)

 

Induktívne algoritmy budujú strom zhora nadol, pričom delia priestor príkladov rekurzívne na podpriestory výberom testovacích atribútov, až kým nie je splnená ukončovacia podmienka (spravidla kým všetky príklady v danom uzle nebudú klasifikované do jednej triedy).


32.               Ako generuje rozhodovacie stromy algoritmus ID3?

 

 

Najznámejším algoritmom generujúcim rozhodovací strom metódou zhora nadol je algoritmus ID3 (Iterative Dichotomizer 3) (Quinlan, 1990). Voľne by sa dal názov algoritmu preložiť ako Iteratívny dvojtriedny klasifikátor. Bol vyvinutý Rossom Quinlainom v 1979 v doméne znalostí šachistu o hraní šachových koncoviek.

Ukončovacie kritérium tohto algoritmu je, že každý podpriestor obsahuje iba príklady jednej triedy. Ak je množina atribútov dostatočná, možno uvedeným postupom zostrojiť rozhodovacie stromy korektne klasifikujúce trénovacie príklady. Hovoríme že rozhodovací strom generovaný algoritmom je:

 

Algoritmus ID3 pre výber testovacieho atribútu využíva Shannonovu  teóriu informácie (Russell-Norvig, 1995), ktorá na meranie množstva informácie používa entrópiu. Claude Shannon objavil informačnú teóriu ešte v prvej polovici dvadsiateho storočia. Spôsobila revolúciu v oblasti komunikácie a taktiež prispela k úspechu učenia pomocou rozhodovacích stromov.

Ak správy x1, x2, ... , xn  sú možné s pravdepodobnosťami p(x1), p(x2), ... , p(xN)  a tieto vytvárajú úplný súbor pravdepodobností, teda:

 

potom entrópiu, resp. neurčitosť daného súboru správ možno vyjadriť nasledovne:

 

 

Tento vzťah je známy ako Shannonova entrópia. Čím je entrópia súboru správ vyššia, tým menej určitý je obsah budúcej správy a tým väčšie množstvo informácie získame, keď správu prijmeme.

            Rozhodovací strom môže byť považovaný za zdroj informácie, ktorá pre nejaký konkrétny príklad formuje správu o klasifikácii daného príkladu do nejakej triedy. Keď niektorý uzol stromu obsahuje iba príklady tej istej triedy, entrópia v tomto uzle je nulová, pretože klasifikačné rozhodnutie pre príklady prislúchajúce tomuto uzlu je pevne dané. (Teda pravdepodobnosť jednej triedy je 1 a ostatných nulová.)

Z toho vyplýva, že entrópia v listových uzloch je nulová, zatiaľ čo v koreňovom uzle a medziľahlých uzloch má nenulovú hodnotu. Pre vygenerovanie minimálneho rozhodovacieho stromu by entrópia mala čo najrýchlejšie klesnúť na nulovú hodnotu. Algoritmus ID3 používa heuristiku, ktorá usiluje o čo najvyšší pokles entrópie lokálne v každom kroku.

            Nech uzol S obsahuje n1 príkladov klasifikovaných do triedy T1n2 príkladov zaradených do triedy T2. Potom pravdepodobnosť, že nejaký príklad prislúchajúci uzlu S rozhodovacieho stromu bude klasifikovaný do triedy T1 alebo T2 je

 

 

Teda entrópia v danom uzle S, presnejšie povedané entrópia súboru trénovacích príkladov prislúchajúcich uzlu S, bude určená nasledovne:

 

 

Predpokladajme, že je možné v uzle S použiť atribút A s hodnotami a1a2 pre rozdelenie príkladov z uzla S do dvoch disjunktných podmnožín S1S2. Ak v uzle S má m1 príkladov hodnotu atribútu A rovnú a1m2 príkladov má hodnotu a2, potom celková entrópia v uzle S s použitím atribútu A sa určí ako:

 

 

Informácia získaná použitím atribútu A v uzle S je označovaná ako informačný zisk a počíta sa nasledovne:

 

 

V každej iterácii algoritmu pre generovanie rozhodovacieho stromu metódou zhora nadol sa vyšetrujú všetky ešte nepoužité atribúty a ako testovací atribút sa vyberá ten, ktorý maximalizuje informačný zisk resp. minimalizuje entrópiu t.j. neurčitosť. Stratégiou algoritmu ID3 je čo najrýchlejší pokles entrópie na nulu a tak generovanie minimálneho rozhodovacieho stromu.

            Pre použitie algoritmu musí platiť podmienka neprotirečivosti (nekontradikčnosti) trénovacích príkladov. Nutnosť platnosti tejto podmienky vyplýva z toho, že ID3 nie je odolný voči zašumeným údajom na vstupe. Zo spôsobu určovania pravdepodobností vyplýva, že iba dodržanie dvoch dodatočných podmienok, a to podmienky neredundantnosti príkladov (nepovolenie viacnásobného výskytu trénovacieho príkladu v trénovacej množine) a podmienky vzájomnej nezávislosti atribútov,  garantuje nájdenie minimálneho rozhodovacieho stromu.

 


1.   Čo je to Kombinačná analýza dát?

 

 

Kombinačná analýza dát (KAD) je metóda bežná v štatistike. Výskumníci znalostných systémov ju prispôsobili požiadavkám vlastnej oblasti.  KAD sa zaoberá výskytom rôznych kombinácií selektorov (Atribút = hodnota) v dátach. Zisťuje frekvencie, t.j. početnosti výskytov kombinácií selektorov v dátach. Na vyššej úrovni zisťuje koincidencie, t.j. zhody výskytov kombinácií selektorov a daných tried v dátach. Podstatou použitia KAD je vyhľadávanie takých kombinácií selektorov v dátach, ktoré smerujú k (resp. sú späté so) zadanej cieľovej kombinácii (pre znalostné systémy klasifikačnej triede). Dáta sú dané väčšinou vo forme tabuľky, kde stĺpce obsahujú hodnoty atribútov (vrátane tried – posledný) a riadky obsahujú pozorovania vo forme trénovacích príkladov. Nasleduje príklad takej tabuľky.

 

Frekvencie sa skúmajú iba v dátovej časti, bez uvažovania tried. Koincidencie definujú vzťah kombinácie hodnôt atribútov voči hodnotám triedy. (Pôvodná metóda skúmala vzťah kombinácie hodnôt atribútov voči kombinácii hodnôt tried. Toto chápanie metódy KAD bolo zúžené na hodnoty tried v jednom stĺpci, čím bola pôvodná metóda prispôsobená na použitie v znalostných systémoch.)

Majme N atribútov a jednu klasifikačnú triedu. Nech Vi(Atri) je množina všetkých hodnôt, ktoré môže nadobúdať Atri. Potom kombinácia dĺžky k je:

              , pričom

Nech d je dĺžka skúmanej kombinácie. Potom príklady kombinácie dĺžky d = 2 sú:

                                                    ,

pričom d môže nadobúdať hodnoty z intervalu. Počet možných kombinácií sa dá určiť podľa vzťahu: .

Výpočet frekvencie kombinácie. Výskytom kombinácie v dátach rozumieme každý trénovací príklad, v ktorom sa v príslušných stĺpcoch nachádzajú hodnoty atribútov zo zvolenej kombinácie. Frekvencia kombinácie v dátach sa označujea predstavuje počet príkladov v ktorých sa daná kombinácia nachádza. Fundovanosť kombinácie predstavuje dolnú medzu počtu trénovacích príkladov, v ktorých sa daná kombinácia musí vyskytovať, aby bola fundovaná, t.j. aby sme sa ňou vôbec zaoberali.

Výpočet koincidencie. Tento výpočet smeruje k zisteniu počtu výskytov empirických implikácií v tvare:  alebo. Pojem empirická implikácia znamená platnosť s výnimkami (napríklad na 90%). Platnosť implikácie počítame podľa vzťahu: , kde v čitateli zlomku je vyčíslená frekvencia súčasného výskytu kombinácie C a triedy Ti, zatiaľ čo v menovateli iba frekvencia výskytu kombinácie C. Platí, že . Aj v tomto prípade sa zadáva dolná medza platnosti, ktorá definuje aká minimálna musí byť platnosť implikácie, aby sa s ňou počítalo, t.j. aby bola platná.

 

 

33.               Ako je možné použiť Kombinačnú analýzu dát v znalostných systémoch?

 

 

Kombinačnú analýzu dát (KAD) (Mach, 1997) je možné použiť na vyhľadávanie implikácií v dátach, tieto implikácie je možné prehodnotiť, stanoviť ich neurčitosť a vložiť do BZ znalostného systému. Pomocou tejto metódy je možné získať produkčné pravidlá priamo z dát, bez asistencie experta. Princíp je podobný tomu, ktorý sa používa v strojovom učení.

To, ktoré platné empirické implikácie existujúce v dátach budú zaradené do bázy znalostí, závisí na zvolenom inferenčnom mechanizme (aká operácia skladania neurčitých príspevkov GLOB sa používa), na požiadavke presnosti, s ktorou má byť BZ v súlade s dátami a na požadovaných hodnotách platnosti a fundovanosti. Pre rozhodnutie o zaradení implikácie do BZ možno použiť analógiu s vytváraním axiomatickej teórie nejakého odboru. Z tohto hľadiska musí BZ spĺňať dve požiadavky:

ü  úplnosť. Medzi axiómy sú zaraďované všetky najjednoduchšie tvrdenia. Všetky ostatné zákony odboru, resp. domény sú z nich odvoditeľné. Napríklad, majme dve axiómy A1 a A2.

              A1: Sčítanie jednociferných čísel

              A2: Prenos cez desiatku

              Z nich sa dá odvodiť sčítavanie dvojciferných čísel.

ü  neredundantnosť. Zákony, ktoré sa dajú odvodiť z iných axióm sú odstraňované z bázy znalostí.  

Uvádzaná vlastnosť neredundantnosti sa dá v rámci znalostných systémov interpretovať nasledovne. Do bázy znalostí budú zaradené iba tie implikácie, ktorých platnosť v dátach sa významne líši od váhy odvodenej inferenčným mechanizmom z váh vzťahov do bázy znalostí už zaradených. Odlišnosť váh akoby mala zabezpečiť, že vkladaná implikácia sa nedá odvodiť z implikácií, ktoré už v BZ sú. Napríklad ak riešime problém, či je prípustné zaradiť do BZ nasledovnú implikáciu, ktorej váha wD je väčšia, než požadovaná platnosť implikácie:

. V BZ sa však už nachádzajú implikácie:

.

Združíme váhy týchto implikácií,a vytvoríme združenú váhupomocou grupovej operácie na združovanie príspevkov :          .

Ak, potom nové pravidlo do bázy znalostí nezaradíme, pretože predpokladáme, že sa dá odvodiť z axióm A1 a A2. Aknové pravidlo do bázy znalostí zaradíme, pričom predpokladáme výraznú odlišnosť týchto váh.

Teda, aby sme to zhrnuli vzťahbudeme považovať pre dané dáta za odvoditeľný z BZ (konkrétne z množiny vzťahov vedúcich na), ak platnosť tohto vzťahu v dátach sa významne nelíši od hodnoty odvodenej zložením príspevkov tých pravidiel z BZ, ktorých podmienka je podkombináciou kombinácie. Ak je nejaký vzťah zaraďovaný do BZ, tak s váhou, ktorá koriguje rozdiel medzi platnosťou zaraďovaného vzťahu a zloženou váhou podľa definície .

BZ získaná KAD je použiteľná vo všetkých znalostných systémoch, pracujúcich s numerickým prístupom ku skladaniu neurčitých príspevkov jednotlivých pravidiel do neurčitého záveru.

 

34.               Ako je definovaný algoritmus Kombinačnej analýzy dát?

 

 

Algoritmus vytvárania BZ pomocou KAD má dve etapy:

1)     inicializačnú fázu. Inicializačná fáza pozostáva s nasledovných krokov:

a)     Inicializujeme d = 0, kde d je momentálne skúmaná dĺžka kombinácie ľavej strany hľadanej implikácie.

b)     Nasledovným spôsobom sa určí w0 platnosť prázdneho vzťahu  , kde v čitateli je početnosť výskytov Ti v dátach a v menovateli je počet riadkov tabuľky, pretože prázdny vzťah platí pre všetky trénovacie príklady.

c)     Ak sa w0 líši signifikantne od numerickej hodnoty 0.5, potom sa prázdny vzťah zaradí do BZ s váhou w0. Ak sa w0 nelíši signifikantne od numerickej hodnoty 0.5, potom sa prázdny vzťah zaradí do BZ s váhou 0.5.

 

2)     fázu vyhľadávania vzťahov. Táto fáza pozostáva z nasledovných krokov:

a)     Inkrementuje sa d na d + 1.

               Ak (stanovená maximálna dĺžka kombinácie), potom končíme.

               Ak d > m (počet atribútov), potom končíme.

               Druhé pravidlo je alternatívou pre prípad, že dmax nebolo stanovené.

b)     Pre všetky kombinácie dĺžky d sa nájde fundovaná kombinácia C dĺžky d, definuje sa implikácia  a vypočíta sa jej platnosť, podľa vzťahu .

c)     Ak je wd menšie ako požadovaná platnosť, potom ideme na krok 2b).

      Ak je wd väčšie ako požadovaná platnosť, potom ideme na krok 2d).

d)     Nájdu sa váhyvšetkých implikácií v BZ, ktorých ľavá strana je podkombináciou momentálne skúmanej kombinácie (v podkombinácii smie byť maximálne d -1 podmienok).

e)     Z týchto nájdených váh sa určíopätovným použitím operácie GLOB pre skladanie neurčitých príspevkov do výslednej neurčitosti:

                

f)      Realizuje sa test odlišnosti:

Ak, potom sa do BZ zaradí implikácias váhou.

                        Ak, potom do bázy znalostí implikáciu nezaradíme.

                        Váhu počítame podľa vzťahu: .

 

35.               Čo predstavujú priame metódy získavania znalostí?

 

 

V princípe môžeme znalosti pre BZ znalostného systému získavať priamo a nepriamo, t.j. priamymi metódami získavania znalostí a nepriamymi (Mach, 1997). Priame metódy sú založené na vedomých znalostiach experta. U experta predpokladajú prístup experta k svojim mentálnym procesom (expert dokáže formulovať vedomosti, ktoré používa) ako aj schopnosť a ochotu odovzdať svoje znalosti znalostnému inžinierovi. Rozlišujeme nasledovné triedy priamych metód získavania vedomostí:

1)     rozhovory

2)     prípadové štúdie

3)     pozorovania

4)     získavanie pojmov

5)     špeciálne techniky. Postupne si preberieme každú z týchto tried.

 

1) ROZHOVORY predstavujú plošné pokrytie oblasti. Majú retrospektívny charakter, pretože sú postavené na minulej praxi. Delia sa nasledovne:

ü  Neštruktúrovaný rozhovor je voľné „interview“, pričom ani obsah ani sekvenčnosť rozhovoru nie sú vopred určené. Cieľom je získať kompletný prehľad domény, resp. oblasti. Používa sa hlavne v počiatočných fázach získavania znalostí.

ü  Štruktúrovaný rozhovor môže mať formu vysoko štruktúrovaného rozhovoru, v ktorom aj obsah aj poradie udalostí sú dané, alebo semi-štruktúrovaného, v ktorom je obsah daný, ale poradie otázok sa môže meniť.

ü  Sondy sú krátke zásahy do konverzácie. Znalostnému inžinierovi umožňujú ovplyvňovať konverzáciu. Aditívna sonda povzbudzuje experta k poskytnutiu ďalších informácií a naznačuje, že znalostný inžinier pochopil, čo expert doposiaľ povedal. Reflexívna sonda predstavuje nedirektívnu výzvu pre experta k hlbšiemu ponoreniu sa do námetu. Znalostný inžinier urobí syntézu expertovej predchádzajúcej odpovede a postaví ju ako otázku. Direktívna sonda špecifikuje smerovanie a úroveň všeobecnosti ďalšej konverzácie. Sonda zmeny módu inicializuje prechod na iné hľadisko. Definičná sonda zase inicializuje vysvetlenie významu nejakého pojmu.

ü  Spätné učenie je metódou verifikácie. Znalostný inžinier spätne vysvetľuje expertovi niečo, čo mu on predtým vysvetlil. Robí to dovtedy, kým expert nie je s vysvetlením spokojný.

ü  Dvadsať otázok. Znalostný inžinier volí v duchu nejakú situáciu (diagnózu, poruchu, stav) a expert sa snaží prísť na to, o čo ide. Môže položiť dvadsať otázok, na ktoré dostane odpoveď áno, resp. nie. Typy expertových otázok prezradia znalostnému inžinierovi sekvencie riešiacich krokov a stratégie, ktoré expert používa pri práci.

ü  Dotazníky. Ich výhodou je, že ich expert môže vyplniť v pohodlí a v čase, keď mu to vyhovuje.

 

2) PRÍPADOVÉ  ŠTÚDIE sa sústreďujú na jednotlivé riešené prípady. Kritickým miestom tejto metódy je výber vhodných reprezentatívnych prípadov. Prípady nemajú byť rutinné, ale zaujímavé, zriedkavé, Ľahko zapamätateľné, obtiažne, prípadne zábavné. Patria sem nasledovné techniky:

ü  Analýza prípadových štúdií. Expert sa rozpamätáva na konkrétny prípad. Znalostný inžinier spolu s expertom analyzujú krok za krokom hľadanie riešenia.  K úskaliam tejto metódy patrí deformované vybavovanie – tzv. spomienkový optimizmus, keď rekonštrukcia riešenia zahŕňa aj momentálne znalosti, t.j. znalosti získané po vyriešení prípadu.

ü  Simulácia podľa scenára. Znalostný inžinier poskytne náčrt prvotnej situácie. Expert rieši prípad daný načrtnutou situáciou. Riešenie môže byť reprodukované (riešenie použité v minulosti), alebo konštruované (nový prípad).

ü  Metóda minimálneho scenára. V predloženom scenári chýbajú niektoré kritické informácie. Expert je nútený ich doplniť, alebo sa bez nich zaobísť.

ü  Dynamické spätné učenie. Znalostný inžinier vykonáva simuláciu expertovej práce, pričom už dostatočne chápe riešenia úloh v oblasti. Expert spočiatku navádza znalostného inžiniera na správny postup.

ü  Verbálny off-line protokol. Expert najprv prípad vyrieši bez rušenia znalostným inžinierom. Riešenie je archivované. Expert vytvorí komentár k svojmu postupu.

 

3) POZOROVANIA. Znalostný inžinier sa stáva pasívnym účastníkom procesu riešenia. Do tejto skupiny patria dve techniky: pozorovanie a verbálny on-line protokol.

ü  Pozorovanie. Expert vykonáva svoju prácu a znalostný inžinier ho v tichosti pozoruje za účelom odhalenia stratégií, ktoré nie sú expertovi vedome dostupné, motorických schopností  a automatických procedúr pre verifikáciu expertného popisu. Znalostný inžinier už musí mať znalosti z domény, aby správne interpretoval údaje a pravidlá. Cieľom pozorovania môžu byť známe úlohy, simulované známe úlohy, úlohy s ohraničenou informáciou, úlohy s ohraničeným spracovaním a ťažké prípady.

ü  Verbálny on-line protokol. Expert vykonáva svoju prácu a zároveň slovne komentuje svoj postup riešenia teda „myslí nahlas“. V rámci verbálneho on-line protokolu rozoznávame samoreport a tieňový report. Pri samoreporte expert súčasne rieši problém a poskytuje informácie o jednotlivých krokoch riešenia. Expert má niekedy tendencie poskytovať knižné vedomosti.  Pri tieňovom reporte jeden expert úlohu rieši a druhý expert jeho postup komentuje. Výhodou je, že sú kladené menšie nároky na riešiaceho experta. Na druhej strane, znalosti expertov sa musia zhodovať v dostatočnej miere. Existujú nasledovné modifikácie techniky samoreportu. V metóde kritickej odozvy expert komentuje iba niektoré – kritické časti úlohy. V metóde periodickej odozvy sa stanoví časový interval, po uplynutí ktorého expert preruší svoju prácu a okomentuje, čo do toho času robil. V metóde prerušení expert preruší riešenie úlohy, keď je požiadaný znalostným inžinierom o vysvetlenie svojej činnosti, pretože znalostný inžinier prestal niečomu rozumieť.

 

4)  ZÍSKAVANIE  POJMOV je metóda používaná v počiatočných fázach návrhu BZ na odhalenie štruktúry oblasti. Pojmy sa môžu získavať rôznymi spôsobmi:

ü  Priamym získavaním pojmov, pričom sa môže získavať zoznam pojmov, zoznam krokov alebo zoznam kapitol. V technike zoznam pojmov je expert požiadaný, aby vymenoval všetky kritické pojmy oblasti. V technike zoznam kapitol expert vymenuje všetky kroky, ktoré používa pri riešení rôznych úloh. V technike zoznam kapitol expert vymenuje názvy kapitol a podkapitol hypotetickej knihy.

ü  Landeringom, metódou zameranou na zisťovanie hierarchického usporiadania medzi pojmami, generovaním nadriadených a podriadených pojmov a atribútov. Nehodí sa na nehierarchické oblasti.

ü  Triádové porovnávanie je používané hlavne v spojitosti s repertoárovou sieťou resp. s nepriamymi technikami. Repertoárová sieť bude opísaná v odpovedi na otázku č. 62. Expert vytvára z pojmov oblasti trojice. Zvolí pojem, ktorý sa najviac odlišuje od ostatných pojmov. Potom charakterizuje ostatné dva pojmy tak, aby ich odlíšil od tretieho. Charakteristika má tvar vlastnosti, resp. viacerých vlastností.

ü  Klasifikácia. Expert triedi objekty do skupín na základe ich príbuznosti. Nie je obmedzovaný počtom skupín, alebo počtom objektov v skupine. Často pomenováva skupiny po skončení triedenia, čo je obdoba zhlukovania.

 

5)  ŠPECIÁLNE  TECHNIKY  nie sú všeobecne použiteľné. Často sú viazané na nejaký konkrétny spôsob reprezentácie znalostí. Predstavujú výhodnú skratku. Ich nevhodné použitie vedie ku skresleným znalostiam. Patria sem:

ü  Analýza rozhodnutí, ktorá sa zameriava na vyhodnocovanie alternatív. Vyhodnocuje sa kedy sa problém vyskytuje, aké sú jeho parametre, uskutočňuje sa váženie faktorov a ich kombinovanie, zvažujú sa pravdepodobné následky alternatívnych rozhodnutí. Riešením je výber rozhodnutia z množiny aplikovateľných rozhodnutí.

ü  Rozklad cieľov. Znalostný inžinier stanoví cieľ a expert popisuje, aké úlohy je potrebné vykonať, alebo ktoré podmienky je potrebné splniť. Ide vlastne o postupný rozklad problému na podproblémy.

ü  Systematické spájanie symptómov a diagnóz. Pri tejto metóde sa predpokladá, že sú k dispozícii zoznamy všetkých diagnóz a všetkých symptómov. Systematicky sa preberajú všetky možné kombinácie porúch voči symptómom a expert sa vyjadruje k ich zmysluplnosti.

 

36.               Aké sú to nepriame metódy získavania znalostí?

 

 

Nie vždy má expert prístup k svojim mentálnym procesom. Robí závery, ale nevie exaktne popísať spôsob akým to robí. V takom prípade je vhodné použiť nepriame metódy, v ktorých expert vyjadruje svoje znalosti nepriamo. Znalostný inžinier tak získa to, čo musí vedieť, aby sa správne rozhodoval pri riešení úloh domény.

Pri nepriamych technikách spravidla vychádzame z existujúcej množiny pojmov. Hľadáme podobnosť medzi doménovými pojmami, vyberáme reprezentatívnu množinu pojmov. Existujú rôzne nepriame techniky s rôznou reprezentáciou a rôznymi obmedzujúcimi predpokladmi. Konkrétna metóda sa vyberá na základe „interview“ s expertom. Vo všeobecnosti má nepriame získavanie znalostí nasledovné etapy:

ü  Získavanie dát sa uskutočňuje prostredníctvom odhadov podobnosti pojmov. Tieto odhady majú formu matice podobnosti. Matica podobnosti spravidla reprezentuje podobnosť medzi dvojicami tej istej skupiny pojmov. Riadky a stĺpce matice reprezentujú tie isté pojmy. Je možný aj iný prístup, pri ktorom jedna skupina pojmov slúži na vyjadrenie inej skupiny pojmov. Teda riadky a stĺpce reprezentujú rôzne doménové pojmy. Maticová reprezentácia umožňuje kombinovať dáta, resp. vedomosti viacerých expertov.

ü  Štrukturálna analýza. Jej cieľom je získať predstavu o štrukturálnych vzťahoch medzi pojmami. Štrukturálne vzťahy môžu mať podobu hierarchického usporiadania, alebo typológie vzťahov medzi dvojicami pojmov. Umožňuje zistiť, či medzi nejakou skupinou pojmov existuje nejaký vzťah, odrazový mostík k popisu a charakterizácii tohto vzťahu expertom.

ü  Odvodzovanie kompilovaných znalostí. Štrukturálne znalosti sa nedajú priamo využiť ako procedurálne znalosti pre riešenie úloh. Z toho vyplýva potreba získania produkčných pravidiel, ktoré kompilujú zložité závislosti medzi pojmami do jednoduchých asociácií – pravidiel.

Nepriame metódy sú podobné metódam strojového učenia, ale nevychádzajú z typických príkladov. K metódam nepriameho získavania znalostí patria:

ü  Mnohorozmerné škálovanie

ü  Johnsonovo hierarchické zhlukovanie

ü Repertoárová sieť.

 

 

37.               Čo je to Repertoárová sieť?

 

 

Repertoárová sieť je metóda, ktorá nám umožní z popisu vzťahov medzi pojmami generovať pravidlá pre BZ znalostného systému. Táto metóda je založená na teórii osobných konštruktov. Pod pojmom „konštrukt“ sa rozumie séria bipolárnych vlastností. Táto metóda bola navrhnutá v roku 1995 psychológom Georgom Kellym, ktorý predpokladal, že pomocou konštruktov je človek schopný vyjadriť svoju vnútornú štruktúru pojmov. Na základe tejto štruktúry potom klasifikuje svoje okolie, predvída budúce javy a riadi svoje jednanie. Kelly predpokladal, že problémy jeho pacientov vysporiadať sa s okolitým svetom, sú spôsobené nekonzistenciou v ich sieti konštruktov.

Každý konštrukt je reprezentovaný dvoma opačnými pólmi: ľavým a pravým pólom. Miera príslušnosti pojmu ku konštruktu leží medzi pólmi konštruktu. V nasledovnej tabuľke sú uvedené konštrukty: veľkosť, úžitkovosť, rýchlosť ako aj miera príslušnosti pojmov: pes, kôň, prasa, ovca, králik k týmto konštruktom.    

 

 

Konštrukty, pojmy aj ich mieru príslušnosti ku konštruktom navrhuje expert. Takto nepriamo vyjadruje svoje vedomosti z danej oblasti. Miera príslušnosti je spravidla stupňovitá a počet stupňov je spravidla nepárny, aby existovala stredná hodnota. Konštrukt reprezentuje ohodnotenie pojmov pozdĺž nejakej dimenzie, a to celočíselnou váhou od 1 po N, kde N je nepárne číslo spravidla rovné piatim. 1 – znamená, že pre daný pojem platí určite pravý pól. N – znamená, že pre daný pojem platí určite ľavý pól. Stredná hodnota je . Ak element nie je ohodnotený, potom konštrukt nie je zmysluplne použiteľný. Výber konštruktov realizuje spravidla expert, ale môže to robiť aj znalostný inžinier, a to metódou  triádového porovnávania. Základná sada konštruktov má počet (spravidla tri) rovný počtu pojmov (resp. elementov) zmenšeného o dva.

Podstata triádového porovnávania spočíva v hľadaní takej vlastnosti, ktorá jednoznačne vyčlení z trojice pojmov jeden pojem. Ide o porovnávanie jedného elementu voči zvyšným dvom. Napríklad: {králik, pes, kôň} à veľkosť (kôň)

                                                    {pes, kôň, prasa} à úžitkovosť (prasa)

                                                    {kôň, prasa, ovca} à rýchlosť (kôň).

 

Repertoárová sieť sa analyzuje pomocou

ü  podobnosti pojmov

ü  podobnosti konštruktov

ü  implikačnej analýzy.

Výsledky analýzy sú predkladané expertovi na posúdenie potreby modifikácie Reprtoárovej siete. Spravidla je modifikácia žiadúca pri prekročení prahových hodnôt podobnosti pojmov a konštruktov a pri výskyte dvojznačných vzťahov v implikačnej analýze. Modifikácia sa spravidla uskutočňuje zmenou hodnôt príslušnosti, dopĺňaním a vypúšťaním pojmov, resp. konštruktov, zlučovaním konštruktov a pod. Ak je expert spokojný, resp. ak je repertoárová sieť vyvážená, potom sa zo siete generujú produkčné pravidlá pre BZ znalostného systému.


38.               Ako sa určuje podobnosť pojmov a konštruktov?

 

 

1)     Podobnosť pojmov: Dva pojmy sú si najpodobnejšie (100%) vtedy, keď stĺpce oboch pojmov obsahujú rovnaké hodnoty a najmenej  podobné (0%) vtedy, keď pre každý konštrukt v jednom stĺpci je hodnota 1 a v druhom N. Pre podobnosť pojmov PkPl platí:

                                                                  ,  kde je počet konštruktov, je váha k-teho pojmu a  j-teho konštruktu a je váha l-teho pojmu a j-teho konštruktu. Tak napríklad podobnosť pojmov kôň a prasa vo vyššie uvedenej repertoárovej sieti sa určí nasledovne:

 

 .

 

2)     Podobnosť konštruktov: Tu vystupuje naviac problém určenia, ktoré póly konštruktov patria k sebe. Napríklad, či k sebe patria malá veľkosť a veľká rýchlosť alebo veľká veľkosť a veľká rýchlosť. Alebo či k sebe patria veľká veľkosť a malá rýchlosť alebo malá veľkosť a malá rýchlosť. Najväčšia odlišnosť medzi konštruktami je [(N+1)/2 – 1]*PP, kde PP je počet pojmov. Ak je pri určitom priradení pólov väčšia odlišnosť medzi konštruktami, stačí prevrátiť póly. Hodnoty konštruktu s prevrátenými pólmi sa nazývajú reverzné hodnoty. Pre podobnosť konštruktov CkCl  a reverznú hodnotu  platí:

 

                     .

             

    Tak napríklad pre podobnosť konštruktov veľkosť a úžitkovosť platí:                            

                     


39.               Čo je to Implikačná analýza?

 

 

Implikačná analýza je metóda štrukturálnej analýzy, ktorá sa môže použiť aj ako samostatná metóda, nie len v rámci repertoárovej siete. Nevýhodou tejto metódy je vysoký počet vyžadovaných podobností. Implikačná analýza reprezentuje špeciálny typ analýzy dát v repertoárovej sieti. V pôvodnom chápaní bola implikačná analýza cieľom, pretože sa analyzoval vnútorný systém konštruktov pacienta. V znalostnom inžinierstve sa stáva prostriedkom kontroly znalostí uložených v repertoárovej sieti. Implikačná analýza odkrýva závislosti medzi jednotlivými konštruktami v tvare implikácií. Ak sú dané dva rôzne konštrukty s pólmi A – B a X – Y, potom medzi nimi môžu existovať nasledovné vzťahy:     

ü  paralelný vzťaha, ktorý je prípustným vzťahom v repertoárovej sieti. Príkladom sú konštrukty:

§  milovaný – príjemný

§  nenávidený – nepríjemný

 

 

ü  ortogonálny vzťaha, ktorý je taktiež prípustným vzťahom v repertoárovej sieti. Príklad:

§  zamestnaný – nezamestnaný

§  prijíma potravu – neprijíma potravu

 

 

ü  recipročný vzťaha  , ako aj a, ktorý je zbytočným vzťahom, keďže ide o ekvivalentnosť konštruktov. Je lepšie ho z repertoárovej siete odstrániť. Príklad:

§  nervózny – pokojný

§  napätý – uvoľnený                

 

 

ü  dvojznačný vzťaha , ktorý z repertoárovej siete „musíme“ odstrániť. Nie je prípustné, aby z jedného predpokladu bolo možné odvodiť viac záverov. Subjekt má v tomto prípade nekompletnú predstavu o rozdiele medzi danými konštruktami. Príklad:

§  realizmus – idealizmus

§  žiadúci – nežiadúci

 

 

Ak sa vyskytne viac implikačných vzťahov v rámci jedného prípadu, o ďalšom postupe budeme rozhodovať podľa najnepriaznivejšieho vzťahu. Príklad:

 

 

Vzťahy, ktoré sa v tomto príklade vyskytujú sú nasledovné: paralelný vzťah, recipročný vzťah a dvojznačný vzťah. Keďže v tomto príklade sa vyskytuje dvojznačný vzťah, tak musíme repertoárovú sieť zmeniť.

Implikačná analýza je dosť zdĺhavá, keďže pre dva konštrukty je potrebné overiť 8 implikácií. Sila každej jednotlivej implikácie sa určí podľa nasledovnej tabuľky:

 

 

Implikácia sa určuje iba medzi ľavými pólmi konštruktov. Pre pravé strany sa uvažujú reverzné hodnoty. Výsledná sila implikácie sa určí ako priemer za jednotlivé stĺpce. Príklad:

 

              veľká rýchlosťveľká veľkosť

             

Výsledná hodnota sily implikácie „veľká rýchlosťveľká veľkosť“ sa rovná 0,625.

Sila implikácie musí prekročiť prahovú hodnotu, aby daná implikácia platila.


40.               Ako sa generujú pravidlá z repertoárovej siete?

 

 

Repertoárová sieť môže byť použitá pre generovanie znalostí v tvare produkčných pravidiel. Ku každej dvojici konštrukt – pojem je možné vygenerovať dve pravidlá: 

                                 AK ľavá strana konštruktu POTOM pojem

                                 AK pravá strana konštruktu POTOM pojem

 

Ak označíme konštruktya pojmya váhu l-teho pravidla pl,  potom môžeme tieto pravidlá zapísať aj takto:  AK ľavý pólPOTOM

                                 AK pravý pólPOTOM,

alebo:                       AKPOTOM

 

Pomocou repertoárovej siete sa nedá tvoriť hierarchicky štruktúrovaná BZ. Vyniknutá BZ bude iba dvojstupňová. Vygenerované pravidlá budú mať priradenú váhu – mieru platnosti, ktorá sa určuje podľa vzorca:

                                                                       .

Jednotlivé faktory sa určujú nasledovne:

ü  Faktor F1 reflektuje spôsob narábania s neurčitosťou. Predstavuje spôsob skladania  príspevkov od jednotlivých pravidiel podľa modelu, ktorý používa ZS EMYCIN. Ak skladáme dve pravidlá s váhamia, výsledkom bude:

 

              Ak skladáme n neurčitých svedectiev do jednej váhy w výsledného pravidla:

                                           ,

 

              a ak v rámci určitej tolerancie platí, že všetky príspevky sú rovnaké, potom:

                                          

                                           .

 

ü  Faktor F2 predstavuje váhu pojmu vzhľadom na nejaký konštrukt. Táto váha je číslo z diskrétneho intervalu. Je potrebné pretransformovať ho na interval. Z toho dôvodu vzťah pre výpočet faktoru F2 je:

                                                                        - pre ľavý pól konštruktu, a

                                                                        - pre pravý pól konštruktu.

 

ü  Faktor F3 reprezentuje dôležitosť konštruktu:   , kde d je dôležitosť aktuálneho konštruktu a dmax je maximálna dôležitosť konštruktu. Čím väčšia je dôležitosť konštruktu d, tým vyššia je váha pravidla, v ktorom sa vyskytuje.

 

41.               Čo je to Mnohorozmerné škálovanie?

 

 

Mnohorozmerné škálovanie je nepriama metóda získavania znalostí, ktorá škálu pojmov umiestňuje do mnohorozmerného priestoru, v ktorom každý rozmer predstavuje nejakú vlastnosť, na základe ktorej sa jednotlivé pojmy odlišujú. Metóda vychádza z matice podobnosti dvojíc pojmov a generuje rozloženie týchto pojmov v k – rozmernom priestore. Metóda je vhodná pre odkrytie zhlukov pojmov a relácií podobností. Postupuje sa nasledovne. Expert je požiadaný, aby vyjadril podobnosť dvojíc pojmov číselne. Miera podobnosti je zvyčajne diskrétna a nezáporná, z intervalu, kde 0 znamená totožnosť a m maximálnu nepodobnosť. Teda expert vymenuje charakteristické pojmy oblasti a vyplní polmaticu podobnosti. Najprv si zvolí referenčnú dvojicu, podľa ktorej určí podobnosť ostatných dvojíc. Pre neporovnateľné dvojice určí podobnosť vo forme nepodobnosti – m. Nasleduje príklad takejto polmatice.

 

 

Získané hodnoty polmatice sa zobrazia znalostným inžinierom v mnohorozmernom priestore v takej forme, aby hodnota podobnosti odpovedala vzdialenosti medzi bodmi. Pre vyššie uvedenú polmaticu podobnosti môže mať zobrazenie pojmov v dvojrozmernom priestore nasledovný tvar.

 

 

 

 

 

Pre voľbu dimenzionality cieľového priestoru existuje empirická heuristika: čím viac dimenzií, tým menšia chyba rozmiestnenia pojmov. Pri zvolenej dimenzionalite existuje niekoľko rôznych rozložení pojmov. Znalostný inžinier vyberie najvhodnejšie rozloženie, pre ktoré potom expert navrhne polohu osí a ich možné označenie. Osi odrážajú vlastnosti, pozdĺž ktorých sa pojmy menia.

Metóda má jednoduché použitie, ale objavovanie dimenzií a ich interpretácia sú obtiažne. Plusom tejto metódy je možné objavenie nových neobvyklých zhlukov, resp. nových podobností, ktoré po objasnení expertom môžu viesť k novým znalostiam, teda novým doteraz nepoužívaným pravidlám.


42.               Ako funguje Johnsonovo mnohorozmerné zhlukovanie?

 

 

Johnsonovo mnohorozmerné zhlukovanie vytvára zhluky pojmov podľa príbuznosti, vychádzajúc z polmatice podobností, podobne ako mnohorozmerné škálovanie. Podobnosť sa v tejto metóde interpretuje ako úroveň abstrakcie, na ktorej možno považovať dané pojmy za rovnaké, teda je možné ich zaradiť do toho istého zhluku. Je to čosi ako výška, v ktorej sa pojmy stávajú členmi tej istej kategórie. Postupuje sa nasledovne. Vytvorí sa polmatica podobnosti a tá sa postupne modifikuje – zmenšuje, pretože pojmy, ktoré sú navzájom najpodobnejšie, sa spájajú do jedného zhluku, ktorý v ďalšom vystupuje ako jeden pojem. Napríklad modifikáciou polmatice uvedenej pri predchádzajúcej metóde mnohorozmerného škálovania dostaneme nasledovnú polmaticu.

 

 

Podobnosti novovytvorených zhlukov sa určia ako priemer, minimum alebo maximum hodnôt podobností každého člena novovytvoreného zhluku voči danému pojmu. Algoritmus metódy končí vytvorením hierarchickej reprezentácie podobností všetkých pojmov. Nasleduje príklad takejto hierarchickej reprezentácie podobností pojmov z vyššie uvedenej polmatice podobnosti.

 

 

Metóda vychádza z predpokladu, že pojmy sú navzájom rozlíšiteľné pomocou diskrétnych vlastností, a teda môže byť použitá aj pre skupinu heterogénnych pojmov. Výhodou tejto metódy je, že znalostnému inžinierovi stačí ceruzka a papier. Nevýhodou je vysoký počet vyžadovaných podobností ako aj skutočnosť, že výsledok silne závisí od použitej operácie pre výpočet nových podobností. Rôzne operácie vedú k rôznym hierarchickým zhlukom.


43.               Ako sa uskutočňuje Priamy prenos znalostí?

 

 

Priamy prenos znalostí uskutočňuje priamo expert bez pomoci znalostného inžiniera. Je to jeden z troch možných spôsobov získavania znalostí spolu so strojovým učením a klasickou cestou. Klasická cesta predstavuje všetky priame a nepriame metódy získavania znalostí od experta.

Teda pri priamom prenose znalostí vytvára BZ expert sám v príslušnom editore a dohodnutom formáte. Tento editor je súčasťou inteligentného modulu priameho získavania znalostí od experta. Inteligentný modul získavania znalostí od experta by mal rozumieť znalostiam v syntaktickom zmysle ale aj odhaliť sémantické chyby, mal by navádzať experta pri vkladaní znalostí a určovať, ktorá časť oblasti je slabo pokrytá znalosťami. Ďalej by mal automaticky udržiavať konzistenciu znalostí. Ide o zložitý a nie bežný spôsob získavania znalostí.

Pokusom o takýto typ systému je systém TEIRESIAS (Berka, 1994), ktorý predstavoval modul získavania znalostí pre znalostný systém EMYCIN. Používa metaznalosti, pretože vytvára nielen BZ, ale aj znalosti o reprezentácii znalostí. Metaznalosti o znalostiach vytvárajú očakávania, ako by mala nová znalosť vyzerať. Na nasledovnom obrázku je uvedená schéma činnosti systému TEIRESIAS. 

 

 

Rozlišujú sa dva odlišné typy získavania znalostí: získavanie nových pojmov, resp. konceptov a získavanie vzťahov medzi existujúcimi konceptmi. Pri získavaní vzťahov medzi konceptmi vytvára systém vnútorné modely pravidiel. Modely reprezentujú „typické pravidlá“ v danej podmnožine a sú vytvárané zovšeobecnením pravidiel tejto podmnožiny. Expert nemá potuchy o tom, že sú vytvárané nejaké modely pravidiel. Nasledovný obrázok ilustruje stromovú štruktúru, do ktorej je organizovaná množina vytváraných modelov.

 

 

 

 

44.               Ako je možné vylepšovať znalosti?

 

 

Budovanie BZ neznamená iba neustále rozširovanie znalostí vkladaním nových znalostí. Niekedy je potrebné spätne sa vrátiť k BZ za účelom opravy alebo zjemňovania znalostí. Zjemňovanie znalostí môže mať formu:

ü  dopĺňania znalostí. Nové znalosti sú zaraďované tak, aby nadväzovali na tie znalosti, ktoré už v BZ sú.

ü  redukcie znalostí. V BZ sa nachádzajú okrem globálne platných zákonitostí aj náhodné súvislosti, resp. lokálne platné zákonitosti. Náhodné súvislosti sa do BZ môžu dostať pri použití niektorej metódy strojového učenia. Znalosti, ktoré predstavujú náhodné súvislosti, sú z BZ odstraňované. Ponechané sú iba globálne platné zákonitosti.

ü  modifikácie znalostí. Celkový objem znalostí sa zachováva. Znalosti sa spresňujú, aby lepšie odrážali pomery v doméne t.j. predmetnej oblasti. Modifikáciu znalostí je možné uskutočniť buď zmenou váh jednotlivých pravidiel, alebo zmenou počtu podmienok v pravidlách. Zmena počtu podmienok je najviac využívaná v prípade, keď modifikované pravidlá boli získané strojovým učením z množiny trénovacích príkladov. Tieto pravidlá sa ešte overujú na testovacej množine. Nasleduje zosúladenie BZ na základe dodatočne získaných informácií.

 

Príkladom dopĺňania znalostí je postup, pri ktorom sa nedopĺňajú celkom nové znalosti, ale generujú sa rôzne varianty pravidiel, ktoré už v BZ sú, ale nedávali by dobré výsledky, keby sa používali veľmi striktne. Napríklad, keď lekár popisuje zoznam symptómov nejakej choroby, neznamená to, že u každého pacienta trpiaceho danou chorobou sa musia vyskytnúť všetky symptómy. To znamená, že dané pravidlo by mohlo fungovať aj keby niektoré podmienky v ňom boli negované. Spomenutý postup sa používa v prípade, keď chápanie znalostí expertom je širšie, ako jej explicitné vyjadrenie. Predpokladajme, že znalostný inžinier získa od experta nasledovné pravidlo:  

 

              AK     POTOM

 

Expert explicitne predpokladá, že záver môže byť splnený aj vtedy, ak niektorá podmienka splnená nie je. Preto by BZ mala byť doplnená o pravidlá, ktoré niektoré podmienky neuvažujú. Postup je nasledovný:

1)     Zoradenie podmienok podľa dôležitosti. Podmienky rozdelíme na dominantné a nedominantné. Dominantné sú tie podmienky, bez ktorých splnenia záver neplatí. Nedominantné sú tie podmienky, bez ktorých splnenia záver môže platiť. Každej nedominantnej podmienke priradíme číselnú hodnotu, ktorá vyjadruje dôležitosť tejto podmienky. Potom nedominantné podmienky zoradíme podľa dôležitosti, teda priradenej číselnej hodnoty.

§  najmenej významné     1

§  významnejšie      2      

§  atď.

§  najvýznamnejšie m (počet nevýznamných podmienok)

 

2)     Generovanie doplnkových pravidiel. Každá podmienka ktorá nie je dominantná, môže byť negovaná. Ak máme m nedominantných podmienok, môžeme generovať podmienok.

3)     Usporiadanie doplnkových pravidiel. Každé doplnkové pravidlo sa ohodnotí číslom, ktoré predstavuje sumu číselných ohodnotení z kroku 1) všetkých nedominantných podmienok, ktoré sú v danom pravidle negované. Táto číselná hodnota odráža nakoľko sa doplnkové pravidlo líši od pôvodného pravidla. Doplnkové pravidlá sa zoradia podľa hodnôt od najnižšej po najväčšiu.

4)     Určenie hraničného pravidla. Vyvstáva otázka, kedy je odlišnosť doplnkového pravidla od pôvodného pravidla. Odpoveď na túto otázku dá expert tým, že vyberie hraničné pravidlo. Pravidlá s nižším ohodnotením ako má hraničné pravidlo sa do BZ nezaradia.

5)     Určenie váh. Pre akceptované doplnkové pravidlá je potrebné určiť váhy, s ktorými budú zaradené do BZ. Expert určí váhu hraničného pravidla. Váhy ostatných pravidiel sa určia z lineárnej závislosti:

                                                                      

 

              kde:            - je hodnota pôvodného pravidla

                                 - je váha hraničného pravidla

                                 - suma hodnôt negovaných podmienok pre hraničné pravidlo

                                 - suma hodnôt negovaných podmienok pre aktuálne pravidlo

 

Nasleduje príklad, ktorý bude ilustrovať jednotlivé kroky postupu dopĺňania znalostí. Predpokladajme, že pôvodné pravidlo:

 

              AK          POTOM

 

1)     Zoradenie podmienok podľa dôležitosti: expert určil, že

              je dominantná podmienka

              sú nedominantné podmienky

              je dôležitejšia ako, preto ich ohodnotenie je určené nasledovne:

             

             

 

2)     Generovanie doplnkových pravidiel:

 

              AK          POTOM       

              AK          POTOM        

              AK       POTOM       

 

3)     Usporiadanie doplnkových pravidiel:

 

              AK          POTOM        

              AK       POTOM       

              AK       POTOM           

 

4)     Určenie hraničného pravidla: expert určí hraničné pravidlo

 

              AK          POTOM        

 

              a určí mu váhu napríklad 0,4.

 

5)     Určenie váh. Do bázy znalostí pôjdu okrem pôvodného pravidla aj doplnkové pravidlá:

 

              AK          POTOM                  s váhami:   0,6

              AK          POTOM                                     0,4

             

              Váhu druhého, hraničného pravidla zadal expert. Váha prvého pravidla sa vypočíta:

             

              .

 

 

 

45.               Načo slúži vysvetľovací mechanizmus?

 

 

Existujú dva hlavné dôvody, prečo by mal byť znalostný systém vybavený vysvetľovacím mechanizmom. Po prvé, nedá sa očakávať, že používateľ bude poznať všetky možnosti práce so zložitým znalostným systémom. Preto potrebuje vysvetlenie, čo sa vlastne v systéme robí. Po druhé, znalostné systémy sa najčastejšie používajú v riešení slabo formalizovateľných úloh, ktoré nemajú algoritmické riešenie, preto sa používateľ potrebuje utvrdiť v dôveryhodnosti výsledku a použitých metód. Vysvetľovanie je charakterizované:

1)     cieľom vysvetľovania

2)     objektom vysvetľovania

3)     spôsobom vysvetľovania

4)     adresátom vysvetľovania.

 

 

Cieľ vysvetľovania vyplýva zo spôsobu použitia znalostného systému. Spôsob použitia je zase daný typom používateľa, ktorý systém používa. Súvislosti medzi typom používateľa, spôsobom použitia a cieľom vysvetľovania sú ilustrované nasledovnou tabuľkou.

 

 

 

 

 

 

Objekt vysvetľovania predstavuje to, čo sa bude objasňovať. Od toho, čo bude objasňované závisí spôsob objasňovania. Okruh toho, čo môže byť objasnené, nezahŕňa všetky znalosti a procedúry. Je potrebné špecifikovať, čo môže byť objasnené a čo nie.

 

Spôsob vysvetľovania má niekoľko aspektov, a to úroveň detailnosti, jazyk objasnenia a typ objasnenia. Nevyhnutnosť poskytovať objasnenia na rôznych úrovniach detailnosti je spôsobená rôznosťou cieľov používateľov, rôznosťou úrovní ich znalostí ako aj zmenou v čase. Jazykom objasnenia môže byť buď ohraničený prirodzený jazyk, alebo jazyk grafických obrazov. Spravidla sa rozlišuje päť rôznych typov objasnení:

1)     Kauzálne vysvetľovanie je všeobecne použiteľné, lebo predstavuje príčinné súvislosti. Nieto javu, ktorý by nemal svoje príčiny a nevyvolával by nejaké následky.

2)     Objasnenie pomocou zákona stanovuje, v súvislosti s akým zákonom (teóriou, modelom) vznikol alebo prebehol vysvetľovaný jav. Na takéto objasnenie sa možno pozerať ako na logickú operáciu dedukcie, teda získanie konkrétnych záverov zo všeobecného zákona.

3)     Funkcionálne vysvetlenie vyjadruje funkciu, účel nejakého procesu. Napríklad: „Mimikry je pre hmyz dôležité preto, aby sa skryl pred nepriateľom.“ V sociálnych vedách je toto objasnenie cieľové, motivované cieľavedomou činnosťou ľudí.

4)     Štrukturálne vysvetlenie obsahuje opis štruktúry, ktorá zabezpečuje realizáciu funkcií a chod systému ako celku. Z tejto štruktúry používateľ vysleduje spôsob použitia.

5)     Genetické vysvetlenie sa niekedy označuje názvom historické. Je to objasnenie podmienok, príčin a zákonov, ktoré priviedli systém do daného stavu. Historické preto, lebo vychádza z postupnosti, teda histórie javov, ako idú za sebou.

 

Adresát vysvetľovania je ten, kto prijíma vysvetlenie. Logika práce znalostného systému a jeho spôsob reprezentácie znalostí nie sú identické reprezentácii u používateľa. Preto je potrebné vysvetlenie v tvare relevantnom otázke používateľa, teda pochopiteľné pre používateľa, týkajúce sa toho, na čo sa pýtal a na odpovedajúcej úrovni abstrakcie a detailnosti. Vysvetlenie by sa malo prispôsobiť aj tomu faktu, že kvalifikácia používateľa sa mení s časom. Na začiatku, ako laik, potrebuje detailné vysvetlenie. Neskôr už tak podrobné vysvetlenie nepotrebuje.

 

 

46.               Ako delíme jednotlivé vysvetlenia?

 

 

Existujú tri základné prístupy k objasňovaniu v reálnych znalostných systémoch:

1)     Vopred pripravené vysvetlenia predstavujú najjednoduchší spôsob. S každým krokom činnosti programu je zviazaný nejaký vysvetľujúci text vo forme textu v prirodzenom jazyku. Príkladom môžu byť chybové hlášky. Nevýhodou tohto prístupu je, že ho možno použiť iba v prípade, keď je možné predvídať všetky otázky používateľa. Systém nemá žiadny konceptuálny model toho, čo oznamuje. Všetky texty sú pre neho na rovnakej úrovni. Texty nemôžu zohľadniť dynamickú podstatu vysvetľovania.

2)     Vysvetlenia generované z behu programu. Používateľ najčastejšie žiada o vysvetlenie, keď je dotazovaný (Vysvetli, prečo sa pýtaš?). Rozoznávame tieto druhy vysvetlení, generovaných z behu programu:

ü  GOAL – Používateľ sa pýta, prečo má odpovedať na otázku v danom listovom uzle. Systém odpovedá tak, že zverejní hypotézu, ktorú práve dokazuje.

ü  TRACE – Systém zverejní celú cestu.

ü  WHY – Systém sa pýta na konkrétny listový uzol, lebo chce vedieť, či platí nadradený uzol ten a ten. Rekurzívnym používaním WHY sa vysvetľuje stále vyššia úroveň až po cieľový uzol (čo odpovedá vysvetleniu TRACE).

ü  HOW – Je to komplementárny spôsob k WHY. Pri rekurzívnom použití zostupuje o úroveň nižšie až po posledný predpoklad – listový uzol.

ü  WHAT – Uvádza, aké znalosti sa používajú.

ü  WHAT – IF je najzložitejšie vysvetľovanie. Vysvetlí, čo sa stane, ak nejaký uzol neplatí. Teda bude chodiť po konjunkciách a hľadať, ktoré uzly nebudú v dôsledku toho platiť. Taktiež vysvetlí, čo sa stane, ak nejaký uzol platí. Teda bude chodiť po disjunkciách a hľadať, ktoré uzly budú v dôsledku toho platiť.

3)     Vysvetľovanie podľa modelu. Systém má k dispozícii nielen inferenčnú sieť (ktorú používa výlučne na odvádzanie riešení), ale aj kauzálny model znalostí (ktorý používa na formuláciu vysvetlení). Nasleduje príklad takéhoto modelu.        

 

 

                       Tomuto kauzálnemu modelu odpovedá nasledovná inferenčná sieť:

 

 

 

 

 

 

 

 

 

47.               Ako je možné vyhodnocovať znalostné systémy?

 

 

Znalostný systém sa opakovane vyhodnocuje, resp. testuje v procese tvorby znalostného systému a bázy znalostí (Guida-Tasso, 1994). Vyhodnocovanie v sebe zahŕňa tri rozdielne procesy:

ü  Verifikáciu, teda kontrolu vnútornej konzistentnosti a úplnosti.

ü  Validáciu, ktorá stanovuje či znalostný systém uspokojivo realizuje ciele pre ktoré bol navrhnutý.

ü  Prijatie používateľom, ktorá hodnotí prijateľnosť vytvoreného systému pre konečného používateľa.

Testovanie znalostného systému je jedna z najdôležitejších fáz vývoja. Nejde iba o testovanie už hotového prototypu, ale aj o testovanie v každej fáze (cykle) návrhu. Kedykoľvek je prototyp modifikovaný, musí byť znovu vyhodnotený. Nasleduje podrobnejší popis všetkých troch typov testov znalostných systémov.

 

VERIFIKÁCIA

Znalosti v znalostnom systéme sú reprezentované systémom produkčných pravidiel. To znamená, že sa narába s logickými implikáciami, logickými výrazmi, logickými axiómami a pod. Preto dominantnými testovacími metódami sú logické metódy. V rámci verifikácie sa testuje formálna správnosť, nie významová správnosť. Testuje sa postupne konzistentnosť bázy znalostí, jej kompletnosť a navrhnuté pravidlá.

ü  Konzistentnosť bázy znalostí predstavuje nemožnosť toho, aby pravidlá tvrdili niečo rozporné, teda navzájom kontradikčné pravidlá odvodené z tých istých platných dát. Príkladom kontradikčných pravidiel je dvojica pravidiel, z ktorých jedno potvrdí a iné vyvráti platnosť faktu z tých istých podmienok.

ü  Kompletnosť bázy znalostí je jej schopnosť spracovať každú situáciu, ktorá sa môže vyskytnúť v problémovej oblasti. Ak sa vyskytne nespracovateľná situácia, potom je potrebné doplniť ďalšie pravidlá.

ü  Test na navrhnuté pravidlá. Pri tomto teste sa vyhľadávajú pravidlá, ktoré už sú zahrnuté iným pravidlom. Tak napríklad, z dvoch nasledovných pravidiel je to druhé nadbytočné, pretože je už zahrnuté v prvom pravidle:     

                                                                                                   .

Jedným z existujúcich prostriedkov pre logické testovanie bázy znalostí je COVER, ktorý vykonáva nasledovné kontroly bázy znalostí:

1)     vyhľadáva konfliktné, redundantné a zahrnuté množiny individuálnych pravidiel,

2)     indikuje konfliktné, redundantné a zahrnuté množiny zreťazených pravidiel,

3)     vyhľadáva cyklické reťazenie pravidiel,

4)     nachádza neužitočné pravidlá, ktoré nikdy neboli volané počas reťazenia pravidiel,

5)     indikuje umŕtvujúce pravidlá, ktoré majú záver a ten sa nenachádza v predpokladoch ani jedného pravidla,

6)     vyhľadáva nesplniteľné podmienky, ktoré testujú prvok voči hodnote, ktorú prvok nemôže nikdy dosiahnuť

7)     indikuje chýbajúce pravidlá, ktoré odpovedajú situácii, pre ktorú neexistuje žiadne pravidlo v báze znalostí

8)     odhaľuje bežné syntaktické chyby

 

VALIDÁCIA

V rámci validácie sa skúma, či systém rieši úlohu, na ktorú bol určený a ako dobre ju rieši. Skúma sa správnosť z významového hľadiska, čo je náročná úloha. Existuje niekoľko rôznych prístupov k validácii znalostných systémov:

1)     Empirický prístup je dominantný. Spočíva v spúšťaní prototypu na testovacích príkladoch a v ohodnocovaní výsledkov z hľadiska prijateľnosti, presnosti a správnosti.

2)     Klasická metóda je inšpirovaná Turingovým testom. Predpokladajme, že máme sadu riešení od experta a sadu riešení od znalostného systému. Ak tretí subjekt, nezávislý expert, nedokáže odlíšiť riešenia experta od riešení znalostného systému, potom má systém rovnakú výkonnosť ako expert, teda je validný. V reálnych podmienkach je znalostný systém možné testovať voči štandardu. Ak neexistuje, môžeme použiť mienky niekoľkých expertov, ak sa dokážu dohodnúť na tom, čo je správne. Na vyhodnotenie možno použiť logaritmické, kvadratické, lineárne a iné miery. Napríklad, nech Va je miera kvality práce znalostného systému, Sti je riešenie štandardu ESi a je riešenie znalostného systému. Potom: . Uvažujme nasledovný príklad. Znalostný systém predpovedal na tri dni dopredu, že bude pršať na 30%, 60% a 90%. Štatisticky sa preukázalo, že skutočne pršalo prvý a posledný deň, čo ilustruje nasledovná tabuľka a po nej výpočet validačnej miery Va = 0,287.                                                          

                                

 

                                                                 

3)     Detektor detekuje či nejaká hypotéza nastala, alebo nie. Predpokladajme, že máme dve distribúcie riešení: P – distribúcia pozitívnych hypotéz (platia) a N - distribúcia negatívnych hypotéz (neplatia). Potom miera D, je pravdepodobnosť toho, že dve riešenia po jednom z každej distribúcie, budú v obrátenom poradí, t.j., že váha xp z distribúcie P je nižšia ako váha xn z distribúcie N. Definícia D je:             D = p( xp < xn / xp € P & xn € N).                                                          

PRIJATIE  POŽÍVATEĽOM

Prijatie používateľom (User Acceptance) predstavuje použiteľnosť znalostného systému pre konečného používateľa a jeho ochotu používať znalostný systém. Vyhodnocujú sa nasledovné faktory:

ü  Ľahkosť učenia je psychologickým faktorom. Základné koncepty musia byť rýchlo a ľahko pochopiteľné. Ovládanie systému musí byť konzistentné.

ü  Riadenie je tiež psychologický faktor. Používateľ musí mať dojem, že dialóg je riadený ním. Systém by nemal reagovať nepredvídateľným spôsobom. Používateľ by mal mať možnosť návratu k včasnejším štádiám dialógu.

ü  Stupeň úsilia, ktorý musí používateľ vynaložiť, aby mohol systém použiť. Je potrebné navrhovať systém tak, aby sa vyhlo každému mentálnemu, alebo fyzickému úsiliu používateľa, ktoré nie je nevyhnutné.

ü  Rýchlosť. Systém má držať krok s užívateľom. Výsledky musia byť v reálnom čase.

ü  Vstup a výstup informácií má mať formát, ktorý rešpektuje zvyklosti používateľa.

ü  Odolnosť a korekcia chýb. Náhodné chyby používateľa by mohol systém korigovať. Pri zadávaní údajov je vhodnejšia možnosť výberu alternatívy.

 

 

48.  Proces získavania znalostí v ekonomike

              Tvorba ES je netriviálna záležitosť:

·           Obohacovanie spektra techník o techniky SU, konceptuálne modelovanie, ontológie,...

·           Zlepšenie návratnosti úveru je ukážka ekonomického projektu.

·           Projektové prelínajúce sa role: znalostný inžinier, expert, používateľ, projektový manažér, finančný manažér, softwarový, hardwarový, databázový inžinier...

·           Určenie priorít pod-problémov: centrály a pobočky sú fyzicky oddelené, úvery pobočiek sú obmedzené, odlišná štruktúra vstupných dát pobočiek.

 

 

49.                               Diagramy toku dát

 

 

DFD z Data-Fow Diagrams:

Umožňujú prehľadnejšiu formuláciu problému:

·                   obdĺžniky – procesy

·                   otvorené obdĺžniky – prvky databázy a disponibilné    znalosti

·                   2elipsy – externé entity

 

 

 

 

 

 

 

1. Ktore z nasledovnych tvrdeni su pravdive ?: Podporne metaznalosti spolupracuju so strategickymi metaznalostami ,  Metaznalosti druheho stupna sa pouzivaju ne vyber metaznalosti – metapravidiel prveho stupna

2. Riadenie typu tabula spociva v : v zapise medzivysledkov pri prechode na novy zdroj na pomyselnu tabulu

3. Pri ziskavani znalosti klasickou cestou vytvara bazu znalosti : znalostny inzinier spolu s expertom

4. Cielom objasnenia generovaneho vysvetlovacim mechanizmom pre laika je : objasnenie vyznamu ziskaneho vysledku covania nur

5. Vymenujte kombinacne funkcie extenzionalenho modelu spracovania neurcitosti : NEG , CONJ , DISJ ,GLOB ,CTR

6. Kombinacna analyza dat je metoda : bezna v statistike a prisposobena poziadavkam znalostnych systemov , pouzitena iba v znalostnych systemoch schopnych spracovavat neurcite informacie , vytvarajuca iba dvojstupnovu inferencnu siet

7. Ktore z nasledovnych psychologickych faktorov sa hodnotia pri testovani prijatia pouzivatelom : stupen usilia pri pouzivani , lahkost ucenia , riadenie konzullacie

8. Validacia znalostneho systemu je : testovanie vyznamovej spravnosti (prijatelnosti vysledkov)

9. Ake typy reprezentacie neurcitosti poznate : numericka reprezentacia , symbolicka reprezentacia

10. Ake znalosti nepouziva pri rieseni problemov znalostny system hoci ludsky riesitel ich pouziva : vseobecne znalosti

11. Modifikacia pravidiel sa moze realizovat : zmenou vah jednotlivych pravidiel , zmenou poctu podmienok v pravidlach

12. Ktore vlastnosti znalostneho systemu ho robia kompetentnejsim ako ludsky riesitel : stabilny vykon , lahky prenos znalosti , trvanlivsot kompetencie

13. Aka moze byt reprezentacia vystupu algoritmu strojoveho ucenia : rozhodovaci zoznam , rozhodovaci strom

14. Ktore z nasledovnych funkcii a operacii predstavuju paralelnu kombinaciu v ramci spracovania neurcitosti: funkcia GLOB  

15. Pri neuspesnom spatnom chode sa : postupne od korenovych uzlov k listovym , uzly na ceste neexpanduju

16.Analyza repertoarovej siete pozostava z : analyzy podobnosti pojmov , analyzy podobnosti konstruktov , implikacnej analyzy

17. Pri uplnom spatnom chode sa : uzly na ceste expanduju , postupuje od korenovych uzlov k listom

18. Specialista pouziva znalostny system preto aby : zvysil kvalitu vlastneho riesenia

19. Pri zjemnovani (modifikacii a doplnani) bazy znalosti sa pouziva vyhradne : klasicka cesta