Рефераты. Нові тенденції і прикладні аспекти інженерії знань

Нові тенденції і прикладні аспекти інженерії знань

Психосемантика

1.1 Семантичні простори і психологічне градуювання

Психосемантика досліджує структури свідомості через моделювання індивідуальної системи знань [1] і виявлення тих категоріальних структур свідомості, які можуть не усвідомлюватися.

Основним методом експериментальної психосемантики є метод реконструкції суб’єктивних семантичних просторів. Тут психосемантика тісно сплітається з психолінгвістикою і лінгвістичною семантикою – з методологією виявлення значень слів, лексикографією, «відмінковою граматикою» і структурними дослідженнями [2]. Проте лінгвістичні методи в основному направлені на аналіз текстів, відчужених від суб’єкта, від його мотивів і задумів.

Психолінгвістичні методи звертаються безпосередньо до випробовуваного. Більшість з них пов’язана з різними формами суб’єктивного градуювання. Перед випробовуваним ставиться завдання оцінити «схожість знань» за допомогою деякої градуйованої шкали, наприклад від 0 до 5 або від 0 до 9. В цьому випадку дослідник отримує в руки чисельно представлені стандартизовані дані що легко піддаються статистичній обробці.

Психосемантика, як один з молодих напрямів сучасної психології [3], відразу була оцінена фахівцями в області штучного інтелекту як перспективний інструмент, що дозволяє реконструювати семантичний простір пам’яті як психологічну модель глибинної структури знань експерта. Вже перші додатки психосемантики в штучному інтелекті в середині 80-х років минулого століття дозволили отримати достатньо наочні результати. У психології семантичні простори виступають як модель категоріальної структури індивідуальної свідомості. При концептуальному аналізі знань структуру семантичного простору експерта можна вважати основою для формування поля знань. При цьому окремі параметри семантичного простору відповідають різним компонентам поля (розмірність простору співвідноситься зі складністю поля, виділені понятійні структури з метапоняттями, змістовні зв’язки між поняттями-стимулами – це суть відношення тощо).

Найлегше познайомитися з експериментальною психосемантикою на прикладі, пов’язаному з виявленням структури і розмірності семантичного простору знань з деякої предметної області [3].

В основі побудови семантичних просторів, як правило, лежить статистична процедура (наприклад, факторний аналіз [4], багатомірне градуювання [5] або кластерний аналіз [6]), що дозволяє групувати ряд окремих ознак опису в більш місткі категорії-чинники. Кажучи на мові поля знань, це – побудова концептів вищого рівня абстракції. При геометричній інтерпретації семантичного простору значення окремої ознаки відображається як крапка або вектор із заданими координатами усередині n-мірного простору, координатами якого виступають виділені чинники. Побудова семантичного простору, таким чином, включає перехід до опису предметної області на більш високому рівні абстракції, тобто перехід від мови, що містить великий алфавіт ознак опису, до більш місткої мови концептуалізації, що містить менше число концептів і виступає своєрідною метамовою по відношенню до першої.

Залежно від досвіду і професійної компетентності тих, кого випробовують, розмірність простору і розташування в ній первинних понять може істотно варіюватися. Ця особливість семантичних просторів може бути використана на стадії контролю в процесах навчання, при тестуванні експериментів і користувачів.

На підставі отримуваних методами психосемантики моделей можна проводити контроль знань. При аналізі індивідуальних семантичних просторів виявляються питання, які не засвоєні і не уклалися в систему. Контроль структури знань проводиться на основі зіставлення семантичних просторів хороших фахівців і новачків (студентів, слухачів, молодих фахівців). Ступінь узгодженості семантичних просторів (їх розмірності, ознаки і конфігурації понять) визначатиме рівень знань новачка.

Проте тут необхідно врахувати, що семантичні простори двох кваліфікованих фахівців можуть бути різними, оскільки містять індивідуальні відмінності сприйняття, що відображають досвід і характер діяльності людини. Тому не завжди можна формально порівняти семантичні простори експерта і новачка, слід заздалегідь вивчити семантичні простори декількох фахівців, а потім вже проводити порівняння.

У роботі Кука й Макдональда [7] описаний подібний експеримент. Були отримані когнітивні структури знань досвідченого пілота-винищувача і пілота-новачка, з використанням двох методів: багатовимірного градуювання (алгоритм MDS – Alscal) і мережевого градуювання із зваженими зв’язками (алгоритм Pathfinder). Обидва алгоритми засновано на використанні оцінок психологічної близькості. Досвідчений пілот і пілот-новачок оцінювали всі можливі парні поєднання 30 пов’язаних з польотом понять, приписуючи числа від 0 до 9 кожній парі, де «нулем» позначали найслабший ступінь зв’язку між поняттями, а «дев’яткою» – найсильніший. Ці оцінки потім оброблялися із застосуванням обох алгоритмів градуювання.

Відповідно до алгоритмів MDS кожен концепт, що виражає деяке поняття, поміщається в k-вимірний простір таким чином, що відстань між точками відображає психологічну близькість відповідних концептів.

Алгоритм Pathfinder будує семантичну мережу. Дуги можуть бути або орієнтованими (несиметричне відношення), або неорієнтованими (симетричне відношення). Обидва методи забезпечують стиснення великих об’ємів даних (у формі попарних оцінок) до меншого набору параметрів; проте націлені вони на виявлення різних властивостей досліджуваних структур.

Якщо в алгоритмі Pathfinder центром уваги є локальні відношення між концептами, то алгоритм MDS забезпечує ширше розуміння властивостей метризованого простору концептів.

Результуючі когнітивні структури виявилися близькими для пілотів-винищувачів з однаковим рівнем досвіду, але були різними для різних груп випробовуваних. Автори експериментів виявили, що за когнітивною структурою, характерній для пілота-винищувача, можна встановити, новачок він чи досвідчений пілот.

В результаті, проведений Куком й Макдональдом аналіз когнітивних структур виявив наявність концептів і відношень, загальних для представлень досвідченого фахівця і новачка, і, крім того, ряд концептів і відношень, які з’явилися тільки в одному з представлень. Прямим розвитком розглянутої роботи стала експертна система управління повітряним боєм ACES [8].

Аналогічне дослідження механізмів накопичення досвіду було проведене в області програмування на ЕОМ [9]. За допомогою методів градуювання було показано, що один з аспектів досвіду програміста включає організацію знань відповідно до задуму програми, або семантики, а не відповідно до синтаксису.

Всі згадані вище методи, в тому числі і кластерний аналіз, можна віднести до методів психологічного градуювання. Їх основу складають алгоритми перетворення складних структур даних в більш зрозумілу форму, яка передбачається психологічно змістовною. Результуюче уявлення залежить від методу:

· кластерний аналіз породжує деревовидну структуру;

· багатовимірне градуювання і аналіз чинника – просторову;

· алгоритм MDS;

· репертуарні решітки породжують конструкти або метавимірювання [10].

Формальна методологія психосемантичного градуювання дозволяє частково автоматизувати процес структуризації знань і отримувати «когнітивний розріз» його уявлень про наочну область. Методологія градуювання дозволяє виявляти структури знання непрямим шляхом при отриманні відповідей від експертів на досить прості питання (наприклад, «наскільки близькі поняття x1 і x2» замість «скажіть, який зв’язок між x1 і x2 та як вони впливають один на одного»).

Майже всі експерименти дозволили виявити одну закономірність. Розмірність семантичного простору з підвищенням рівня професіоналізму зменшується. Цей висновок узгоджується з відомими положеннями когнітивної психології про те, що процес пізнання супроводжується узагальненням. Побудова семантичного простору зазвичай включає три послідовні етапи:

1. Вибір і застосування відповідного методу оцінки семантичної схожості. Цей етап включає експеримент з випробовуваними, яким пропонується оцінити спільність стимулюючих ознак, що пред’являються, на деякій шкалі.

2. Побудова структури семантичного простору на основі математичного аналізу отриманої матриці подібності. При цьому відбувається зменшення числа досліджуваних понять за рахунок узагальнення і отримання генералізованих осей.

3. Ідентифікація, інтерпретація виділених факторних структур, кластерів або груп об’єктів, осей тощо. На цьому етапі необхідно знайти значеннєві еквіваленти, мовні «ярлики» для виділених структур. Тут великого значення набуває лінгвістичне чуття і професіоналізм фахівця, який здійснює дослідження, і випробуваних експертів. Часто до інтерпретації залучають групу експертів.

1.2 Методи багатовимірного градуювання

Надалі розвиток методів психосемантики йшов по лінії розробки зручних пакетів прикладних програм, заснованих на методах багатовимірного градуювання, аналізу чинника, а також спеціалізованих методів (статистичного) опрацювання репертуарних решіток. Прикладами пакетів такого типу є системи KELLY [11], MADONNA [12], MEDIS [13]. З іншого боку, специфіка ряду конкретних додатків, в першу чергу – в інженерії знань, вимагала також розвитку інших (не чисельних) методів обробки психосемантичних даних, що використовують, в тій або іншій формі, парадигму логічного виводу на знаннях. Яскравим прикладом цього напряму є система AQUINAS [14]. Проте аналіз практичного застосування систем обох типів до завдань інженерії знань приводить до висновку про недосконалість наявних методик і необхідність їх розвитку відповідно до сучасних вимог інженерії знань. Найбільші перспективи в цій області, мабуть, у методів багатовимірного градуювання.

Сьогодні багатовимірне градуювання – це математичний інструментарій, призначений для обробки даних про попарну схожість, зв’язки або відношення між аналізованими об’єктами з метою представлення цих об’єктів у вигляді точок деякого координатного простору. Багатовимірне градуювання є одним з розділів прикладної статистики, наукової дисципліни, що розробляє і систематизує поняття, прийоми, математичні методи і моделі, призначені для збору, стандартного запису, систематизації і обробки статистичних даних з метою їх лаконічного представлення, інтерпретації і отримання наукових і практичних висновків. Традиційно багатовимірне градуювання використовується для вирішення трьох типів завдань:

Страницы: 1, 2, 3, 4, 5