Теперь к сути дела.
Создавая систему выполняющую голосовые команды мы вынуждены были решать
сразу много разных проблем, сейчас заострим внимание на одной из них, а именно
"понимание смысла команды". Под пониманием мы разумели правильное выполнение команды.
Для организации понимания пришлось делать КМ робота
и команды должны были оставаться в рамках этой КМ.
Например команда: "переместить большой зелёный куб на правую платформу"
должна была привести к соответствующим действиям, а вот команда "почесать
за правым ухом" не укладывалась в КМ и "не понималась" (не приводила ни к каким
действиям, о чём сигнализировал специальный "глаз" - подсвеченная картинка начинающая
моргать лампочкой, это называлось у нас "тупо моргать глазами"
).
Для решения этой проблемы был избран формат для представления смысла
под названием "семантическая сеть" (в переводе на русский - смысловая сеть).
В виде такой сети хранилась КМ и в такой же вид приводились полученные языковые
команды. Единство формата представления позволяло сравнивать одно с другим
и выбирать нужные движения.
Структурными элементами КМ были "объекты" и "связи" (между объектами).
Объекты имели внутреннюю структуру: имя объекта, список свойств объекта и значения
этих свойств. Например:
Имя объекта: куб
цвет объекта: зелёный
размер объекта : большой
расположение объекта: левая платформа
Связи между объектами описывали их пространственное положение относительно друг друга.
Например: малый синий шар НАХОДИТСЯ СПРАВА от большого синего куба.
Узлы семантической сети содержали объекты, а связи указывали где и как
они расположены. Т.е. КМ выглядела не как список чего там есть, а как некая
пространственная структура, над которой были возможны операции перемещения.
Если голосовая команда описывала допустимое пространственное перемещение,
то такая команда понималась и выполнялась. Если не допустимое, то мы наблюдали
тупое хлопанье глазами.
КМ была компактна, наглядна, могла быть легко нарисована на бумаге (собственно
с этого мы и начинали) и так же легко менялась после выполнения действия.
Понятно, что эта картина была намеренно примитивизирована и не содержала
многое из того, что попадало в поле зрения камеры. Например человека
подошедшего к платформе для установки новой диспозиции система "в упор не видела"
Из всего изложенного видно, что смыслы представляют из себя информационные структуры.
Причём степень сложности этих структур определяется несколькими факторами:
1. сложностью "мира" который нужно воспринимать
2. сложностью действий которые нужно выполнять
3. вычислительной мощностью системы (быстродействием и памятью).
Причём последний фактор при определённом уровне первых двух может
стать решающим. Т.е. если бы тех шаров и кубов было не несколько штук,
а несколько тысяч, то система бы захлебнулась и её реакции надо было бы
ждать часами и сутками, что не приемлемо.