» » Как работает распознавание картинок в сервисах Google

Как работает распознавание картинок в сервисах Google

Для поиска по графическим файлам даже в том случае, когда к ним нет подписи, а имя файла не несёт полезной информации, в Google+ Photos, как и в Google Drive, используется технология распознавания изображения. «Эта технология базируется на компьютерном распознавании изображений и машинном самообучении, в результате на основании содержания картинки генерируются поисковые теги (searchable tags), что в сочетании с другими источниками, такими как текстовые теги и метаданные EXIF, делает возможным поиск таких обобщённых образов, как цветы, еда, автомобили, самолёты, черепахи…», объясняет Google.

 

Недавно Google приобрёл компанию DNNresearch, стартап, который создали профессор Джеффри Хинтон (Geoffrey Hinton) и два его дипломника из Университета Торонто. Они построили «систему, которая использует глубокое обучение и свёрточные нейронные сети и показала своё значительное превосходство по сравнению с традицонными подходами к распознаванию образов на конкурсе компьютерного распознавания ImageNet». Затем Google построил аналогичную модель большего масштаба, которая при испытаниях показала в среднем вдвое лучшую точность по сравнению с другими методами распознавания объектов. «Мы взяли исследование с переднего края науки прямо из исследовательской лаборатории и запустили его в жизнь — немногим более чем за шесть месяцев», говорит Чак Розенберг (Chuck Rosenberg) из команды сервиса Картинки (Google Image Search).

 

Доклад под названием «Классификация изображений с помощью глубоких свёрточных нейронных сетей» (PDF-файл) разъясняет принципы работы алгоритма. В нём используются контролируемое обучение, 7 скрытых весовых слоёв и особые биграфы, выстраиваемые на основании данных. «Наша нейронная сеть включает 60 млн оцениваемых параметров и 650 тыс. нейронов. Она обладает серьёзным запасом мощности. Мы обучаем её распознавать образцы размером 224×224 пикс., случайным образом получаемые из изображений размера 256×256, и их горизонтальные отражения».

Google сообщает, что общедоступная функция поиска по фотографиям распознаёт 1 100 тегов. «Мы довели набор визуальных классов до 2 000, отталкиваясь от популярных меток в Google+ Photos и выраженного визуального компонента (то есть человек должен легко идентифицировать класс, просто глядя на изображение), то есть значительно улучшили систему: на конкурсе ImageNet набор составлял 1 000 классов. Как и в прототипе, классы представляют собой не текстовые строки, а понятия, категории (entities); мы используем категории базы знаний Freebase, на основе которых создана наша Сеть знаний (Knowledge Graph), которая применяется в Поиске (Google Search). Категория — это способ уникальным образом определить нечто независимо от языка. <…> Поскольку мы хотели достичь высокой точности в присвоении меток, к запуску функции мы уточнили наш набор классов, сократив его с начальных двух тысяч до 1 100 высокоточных классов».

 

Вот несколько примеров распознаваемых классов: автомобиль, танец, поцелуй, гибискус, георгин, закат, белый медведь, медведь гризли. Система распознаёт общие понятия и конкретные объекты. «В отличие от других систем, с которыми мы экспериментировали, ошибки данной системы выглядят по-человечески обоснованными: они похожи на ошибки, которые делает человек, когда путает похожие вещи».

Возможно веб-мастерам будет интересно узнать о профессиональном агентстве SKYGARANT, которое предлагает своим клиентам продвижение сайтов. Ребята из агентства предлагают раскрутку сайта "под ключ" по выгодной цене. Важно так же отметить что опыт работы компании на рынке составляет более 6 лет. Правильная и качественная seo раскрутка сайтов поможет вам увеличить продажи.
Ключевые теги: image recognition





Добавить комментарий

КОММЕНТАРИИ

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.
Быстрый вход: 

ВОЗМОЖНО ВАС ЭТО ЗАИНТЕРЕСУЕТ

  • Немецкий гражданин выиграл суд у корпорации Google
    Список подсказок к наиболее востребованным поисковым запросам Google, которые делают возможным продвижение сайтов в Интернете и формируются на основании количества обращений пользователей к
  • В Google Street View добавлено более 1000 новых локаций
    Быстроразвивающийся сервис от Google Street View пополнился более чем 1000 локаций. В этот раз были добавлены новые места в Азии, Европе, Латинской Америке, Канаде и США. Более того, теперь можно
  • 11 советов по использованию конвертера валют Google
    Конвертер валют (Google Currency Conversion) — далеко не новая OneBox-функция Поиска (Google Search), однако недавно она обновилась и стала информативнее и удобнее. Запросы заключаются в
  • Находим свои фотографии Поиском
    В Поиске (Google Search), оказывается, есть классная функция: если задать поисковый запрос [my photos], то Поиск выдаст недавно опубликованные через Google+ Photos изображения. Разумеется, нужно
  • Google объявил, что Checkout закрывается
    Google не стесняется закрывать сервисы, не предлагая адекватной замены. В последнее время Google закрыл несколько сервисов, которыми пользовались миллионы людей. Уверенной поступью он идёт к тому,
Информация
Комментировать статьи на сайте возможно только в течении 90 дней со дня публикации.