Поисковик Google научился различать слова на изображениях
IT новости 01 11 2008 2612 просмотров

Поисковик Google научился различать слова на изображениях

Поисковая выдача Google, включащая ссылки на PDF-документы :::
Компания Google разработала систему оптического распознавания текста. Она позволяет поисковику различать текст на отсканированных изображениях. Об этом сообщается в официальном блоге Google.
В настоящее время Google способен распознать текст на изображениях, сохраненных в формате PDF. О планах Google по расширению возможностей системы не сообщается.
Поисковик уже начал индексировать PDF-файлы. Наибольшую сложность представляет поиск по старым отсканированным документам, где бумага, например, испачкана следами от чашки с кофе, либо имеются различные пометки, сделанные от руки.
Ранее Google запустил в экспериментальном режиме сервис Google Audio Indexing, распознающий звуковую дорожку в видеоклипах. Он конвертирует звук в текст и индексирует последний.
Кроме того, в начале сентября Google сообщил о планах по размещению в интернете отсканированных страниц старых газет и журналов. Они будут помещены в новостной архив поисковика и появятся в результатах поисковой выдачи.
 
Лента.Ру
Привлечение инвестиций или нерациональная трата бюджета города?
Привлечение инвестиций или нерациональная трата бюджета города?

Члены Фракции регионов Литвы И. Некрошене и Н. Лебедявичюс - о дорогостоящих проектах и пошлине на вывоз мусора

Все авторские имущественные права и смежные права на размещенную на сайте news.tts.lt информацию принадлежат ЗАО "Telekomunikacinių technologijų servisas", если не указано иное.
Подробнее об использовании материалов сайта