Поисковик Google научился различать слова на изображениях

01.11.2008, 10:28 2972 просмотров

Поисковая выдача Google, включащая ссылки на PDF-документы :::
Компания Google разработала систему оптического распознавания текста. Она позволяет поисковику различать текст на отсканированных изображениях. Об этом сообщается в официальном блоге Google.
В настоящее время Google способен распознать текст на изображениях, сохраненных в формате PDF. О планах Google по расширению возможностей системы не сообщается.
Поисковик уже начал индексировать PDF-файлы. Наибольшую сложность представляет поиск по старым отсканированным документам, где бумага, например, испачкана следами от чашки с кофе, либо имеются различные пометки, сделанные от руки.
Ранее Google запустил в экспериментальном режиме сервис Google Audio Indexing, распознающий звуковую дорожку в видеоклипах. Он конвертирует звук в текст и индексирует последний.
Кроме того, в начале сентября Google сообщил о планах по размещению в интернете отсканированных страниц старых газет и журналов. Они будут помещены в новостной архив поисковика и появятся в результатах поисковой выдачи.

Лента.Ру

Поисковик Google научился различать слова на изображениях

Комментарии

IT новости

Искусственный интеллект: от мечты фантастов до реальности XXI века

Китай запустил спутник для сети мобильной связи 5G

Эксперт рассказал, почему нельзя оставлять смартфон заряжаться на ночь

ФБР назвало угрозой российские мобильные приложения

WSJ сообщила о секретном проекте Google по сбору личных медицинских данных

Илон Маск засомневался в полезности Twitter

ZTE приступила к продаже первого 5G-смартфона

Беларусь, Литва и Латвия обсуждают использование радиочастот для 5G в приграничных районах