» » Internet Archive опубликовала на Flickr миллионы изображений из старых книг

Internet Archive опубликовала на Flickr миллионы изображений из старых книг

Организация Internet Archive опубликовала миллионы изображений из своей коллекции книг, сделав их доступными бесплатно на ресурсе Flickr. В настоящее время уже опубликовано более 2,6 миллионов изображений, но это только начало — общее число извлечённых из отсканированных книг изображений составляет 14 млн.
Internet Archive опубликовала на Flickr миллионы изображений из старых книг
Это стало возможным благодаря работе научного сотрудника Джорджтаунского университета Калева Литару (Kalev Leetaru), который создал алгоритм, автоматически извлекающий изображения более чем из 2 млн книг, доступных в настоящее время в публичной коллекции Internet Archive. Благодаря технологиям автоматического оптического распознавания текста к каждому извлечённому изображению привязано около 500 слов, идущих до и после него в книге — другими словами, по коллекции можно осуществлять текстовый поиск.
После добавления указанных 14 млн изображений коллекция на Flickr будет постоянно пополняться новыми изображениями из более чем 1000 новых книг, сканируемых ежедневно Internet Archive. Глава Библиотеки Уэлкома Доктор Саймон Чаплин (Simon Chaplin) отмечает, что новые способы поиска изображений являются большим шагом вперёд и откроют для новых аудиторий коллекцию оцифрованных книг.
Internet Archive опубликовала на Flickr миллионы изображений из старых книг
В собрании Internet Archive присутствуют книги за более чем 500 лет. В будущем специалисты планируют сделать эту коллекцию ещё более интересной — увеличить число изображений, добавить подкатегории, а также использовать некоторые средства анализа изображений, чтобы добиться более качественного описания и каталогизации.
Ключевые теги: Internet Archive, Flickr, книги





Добавить комментарий

КОММЕНТАРИИ

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.
Быстрый вход: 

ВОЗМОЖНО ВАС ЭТО ЗАИНТЕРЕСУЕТ

  • Крах доткомов 2000 года
    Кризис доткомов произошел в США 10 марта 2000 года. Дотком производное понятие от английского dot.com. Dot в переводе с английского означает точка. Com – это домен в системе доменных имен интернет
  • 10 онлайн-площадок для продажи предметов искусства
    Продажа предметов искусства в сети снова набирает обороты. Художники и раньше этим занимались, но в последнее время обороты онлайн-продаж картин значительно возросли. Существуют данные, что за 2013
  • Twitch достался Amazon.com
    Крупнейший мировой интернет-ритейлер - Amazon.com объявил о достижении согласия в сделке по приобретению видеоресурса Twitch. Сумма сделки составит $970 миллионов, и эксперты уже расценили это
  • Yahoo! начала публиковать блоки с рекомендованным контентом на сторонних ресурсах
    Корпорация Yahoo! приступила к публикации рекламных блоков с рекомендованным контентом на сторонних сайтах: например, на Vox Media's SB Nation и ресурсах CBS Interactive's GameSpot и TV Guide. За
  • В Бразилии запретили анонимные приложения Secret и Cryptic
    Бразильский судья Паулу Сезар де Карвалью из пятого Гражданского суда города Виктория удовлетворил иск прокурора Марселу Зенкера, в котором изложено требование к американским корпорациям Apple и
Информация
Комментировать статьи на сайте возможно только в течении 90 дней со дня публикации.