#10yearschallenge нужен для обучения ИИ по распознаванию лиц?

Челленджи в соцсетях вроде #10yearschallenge (когда пользователи выкладывают свое фото сейчас и десять лет назад) могут использоваться для тренировки алгоритмов распознавания лиц в Facebook или Twitter, предположила колумнистка Wired Кейт О’Нилл. Она написала:

«Представьте, что вы хотите натренировать алгоритм по распознаванию лиц на основе возрастных характеристик и, если точнее, возрастной прогрессии (то есть узнать, как люди будут выглядеть с возрастом). В идеале, вам нужен большой массив данных с кучей фотографий людей. Еще лучше, если большинство снимков сделаны с одной и той же разницей. К примеру, десять лет.

Конечно, можно просто брать фото из страниц в Facebook, но там [хранится] много бесполезного. А здесь — огромный, но в то же время уже «очищенный» и маркированный набор данных».


КСТАТИ: недавно мы писали, как технологии computer vision меняют маркетинг.


Мы спросили у российских экспертов из BeMyEye (еще вчера они были командой сервиса Streetbee, провайдером распознавания изображений, которую купила иностранная компания), что они думают по этому поводу. Вот что нам ответил Head of Image Recognition Development BeMyEye Владимир Лызо:

«У большинства социальных сетей есть право использовать изображения, которые вы публикуете. Нужно сказать, что на самом деле у Facebook и без этого челленджа есть много данных. Не секрет, что компания давно использует фотографии пользователей для обучения алгоритма распознавания лиц.

Это необходимо по разным причинам. Из очевидного: просто ради улучшения качества идентификации человека по фото. Также это может позволить точнее предсказать, как будет выглядеть человек спустя несколько лет. Скорее всего, сеть сможет увидеть и воспроизвести общие закономерности. Как пример, вам необходимо снять фильм, где по сценарию нужно показать актера 20 лет назад. Тогда просто «свайпом» (как меняется фильтр в Instagram) можно будет сделать его моложе.

Есть вероятность, что это просто кто-то придумал «теорию заговора». И даже возможно, тем самым подтолкнул Facebook и других на сбор еще одного датасета (т.е. набора данных). В открытом доступе можно найти несколько подобных датасетов, но в основном в них собраны лица известных людей».

Другие хорошие статьи