ДИЗАЙН ВСЕГО Дизайн всего‎ — это жизнь, ориентированная на вопрос: «Где я нахожусь?» Давайте различать то, что должно быть интересно, от того, что интересно на самом деле.

Новые материалы и комментарииУбрать рекламу на сайтеПожертвовать проекту «Дизайн всего»Защита передачи информации от постороннего вмешательства

«Зоркий вместо главного видит мелочи»

Дизайн всего | Каталог сайтов | Регистрация | Вход

Случайные фото

Приветствую Вас Гость | RSS
Дизайн всего » Каталог сайтов » Культура и искусство » Изобразительное искусство

Internet Archive Book Images
https://www.flickr.com/photos/internetarchivebookimages/ 26.03.2015, 01:07
Американский исследователь создает гигантскую базу данных из 12 миллионов исторических изображений, предоставляя возможность пользоваться ей по своему усмотрению любому желающему.

    К этому моменту Калев Литару выложил 2,6 млн изображений. Благодаря автоматически проставляемым ярлыкам база данных позволяет проводить поиск по всем картинкам. Фотографии и рисунки взяты из более чем 600 млн книжных страниц, отсканированных в библиотеках организацией Internet Archive. До сего дня получить доступ к подобным изображениям было довольно затруднительно.

    Как говорит Литару, до сих процесс оцифровывания концентрировался в основном на текстах и игнорировал изображения. "Все эти годы все библиотеки оцифровывали свои книги, однако их выкладывали в формате PDF или текстовых файлов с возможностью поиска по ним, - рассказал он в интервью Би-би-си. - Они сосредотачивались на книгах как на массивах слов. Мы же видоизменяем этот подход". "Погружаясь на полтысячелетия в историю, удивительно наблюдать весь набор визуальных образов и как изображение предметов менялось с течением времени", - признается ученый. По словам Литару, большинство иллюстраций, сохранившихся в книгах, уже не найти ни в одной галерее в мире, поскольку оригиналы давным-давно утрачены. Выкладываемые на Flickr изображения охватывают период с 1500 до 1922 года, то есть до времени, с которого начинаются ограничения в связи с авторскими правами.

    Калев Литару начал работу над своим проектом во время изучения технологии коммуникаций в Джорджтаунском университете в Вашингтоне по программе, спонсируемой интернет-гигантом Yahoo, которому принадлежит фотохостинг Flickr. Для достижения своей цели Литару сам разработал программное обеспечение, чтобы видоизменить тот способ, которым книги оцифровывались первоначально. Internet Archive ранее пользовалась программой оптического распознавания символов для анализа каждой из 600 млн отсканированных книжных страниц - чтобы перевести изображение каждого слова в электронный текст, пригодный для поисковых систем.

    В качестве составной части процесса программа определяла, какая часть страницы содержала изображение, для того чтобы пропустить ее. Написанный Литару программный код использовал эту информацию, повторно обращаясь к оригинальным сканам, - на этот раз уже для того, чтобы выделить ранее отвергнутые фрагменты и сохранить их как картинку в формате JPG. Программа также автоматически копировала подпись, сопровождающую каждое изображение, если она была, а также абзацы книжного текста, непосредственно предшествующие и идущие сразу вслед за иллюстрацией. Каждый сформированный таким образом JPG-файл с сопутствующим текстом выкладывался после этого на отдельную страницу во Flickr, давая возможность пользователям вволю копаться в гигантском каталоге при помощи поиска по сайту.

    По словам Литару, путешествие сквозь старинные изображения оставляет незабываемые ощущения: "Это одно из прекраснейших занятий. Наберите, например, в поиске слово "телефон", и вы увидите, что на самых первых картинках изображены бизнесмены, в большинстве своем это мужчины. Затем вы увидите, как постепенно все больше превращается в устройство для поддержания связи между близкими людьми". Еще один пример такого развития, по словам ученого, - это железная дорога. "Самые первые образы, связанные с ней, повествуют об инновациях и прогрессе, который должен был изменить мир. Затем вы наблюдаете ее эволюцию, пока она не превращается в часть нашей повседневной жизни".

    Архивные работники говорят, что весьма впечатлены этим проектом. "Обнаружение картинок внутри текста и снабжение тегами обширных коллекций изображений - невероятно трудное дело, - признается старший архивариус Университета Кембриджа доктор Алисон Перн. - Это очень умный способ обеспечить одновременно и количество, и возможность для поиска. И замечательно, что это доступно бесплатно и для для всех".

    В амбициозных планах Литару - связать свой проект с самой известной энциклопедией в интернете. Он намерен заняться этим в следующем году, как только завершит работу над проектом. По его словам, он хотел бы, чтобы этими картинками были проиллюстрированы статьи в Википедии. "Возьмите наугад любую статью об историческом событии, и есть большие шансы, что вы найдете в этой коллекции картинку, которая так или иначе связана с этим событием или с местом, где оно произошло, - говорит исследователь. - Возможности обогатить их таким образом были бы колоссальными".

    Он также собирается предоставить исходный код своей программы для пользования всем желающим.

    "Любая библиотека могла бы воспроизвести этот процесс у себя, - объясняет он. - На самом деле, я очень надеюсь, что библиотеки по всему миру воспользуются подобным процессом для своих оцифрованных книг, чтобы неуклонно расширять эту вселенную изображений".

Текст статьи опубликовал в ЖЖ 30 августа 2014 philologist Это перепост статьи с сайта bbc.co.uk (Сайт блокируется в российском интернете, потому что bbc и потому что uk, а это уже двойная крамола).
 
Переходов: 376 | Добавил: vitkit3 | Рейтинг: 5.0/1 | Теги: Photos, Internet Archive Book Images, Flickr
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Форма входа

Поделиться ссылкой
Категории раздела
Архитектура [0]
Музыка [8]
Обозрения, новости, издания [0]
Декоративно-прикладное искусство [0]
Дизайн [0]
Танец и хореография [1]
Изобразительное искусство [5]
Театры [6]
Киноискусство [15]
Фотоискусство [1]
Литература [9]
Цирк [0]
Музеи и галереи [1]
Поиск Яндексом
Поиск по сайту Google
Орфография
Словари русского языка
www.gramota.ru
Система Orphus
Правила орфографии и пунктуации русского языка онлайн
Друзья сайта
Хранилище файлов
Dropbox
Хранилище файлов
yapfiles
Открытое небо
ВКонтакте
Открытое небо
facebook
ONLINE ETYMOLOGY DICTIONRY
Этимологические онлайн-словари русского языка
КиноПоиск
Кино онлайн
zona.plus
Мир сериалов
zserials.tv
Сериалы тут
Seasonvar
Книги
royallib.com
Создать GIF анимацию
rutracker.org
kinozal.tv
poiskm.me
gallerix.ru
Статистика


Онлайн всего: 1
Гостей: 1
Пользователей: 0

Мини-Чат
Меню
Пожертвовать проекту «Дизайн всего»Убрать рекламу на сайтеНовые материалы и комментарииЗащита передачи информации от постороннего вмешательства«Дизайн всего» работает с 28.08.2009Сделать бесплатный сайт с uCoz Copyright MyCorp © 2024