Нейросети Microsoft обучают с помощью улыбок

Исследователи из Microsoft попытались воспроизвести механизмы, которые есть и в поведении человека — реакцию на улыбки других людей. Во время обучения их алгоритм следил за лицом инженера и, если он улыбался, это давало знак, что ИИ верно интерпретировал данные, сообщает hitech.vesti.ru.

На самом деле это вполне серьезное исследование — для многих сложных нейросетей важной проблемой является система оценки полученного результата. Как правило, один алгоритм отвечает за решение задачи (например, за создание изображения), а второй — за его оценку. По мнению специалистов, именно такой компонент нейросети — один из самых проблемных.

С оценкой человеком проще, но вопрос в том, как в реальном времени считывать степень одобрения промежуточных решений. Вариантом ответа и стала идея научить алгоритм распознавать какую-то базовую эмоцию человека, который следит за работой нейросети и этой эмоцией естественным образом выражает свое мнение.

Тестировали этот метод на одной из классических задач для нейросетей: найти выход из запутанного лабиринта. Выход должна была найти машинка, которой и управляла нейросеть. А за процессом наблюдал человек. Если он улыбался, то нейросеть понимала, что движется в правильном направлении.

Исследователи говорят, что такой метод подкрепления обучения оказался самым эффективным по сравнению с любыми другими искусственными системами контроля. Они отмечают, что это очень похоже на то, как происходит обучение в реальной жизни. Дети, когда учатся что-то делать, в большой степени полагаются на эмоции тех, кто их учит.

Если эта технология разовьется, то мы, возможно, будем обучать домашних роботов именно таким образом: демонстрируя им положительные или отрицательные эмоции.