ABBYY Recognition Server IFilter для поисковых систем Microsoft

Thu, 28 Apr 2022 03:09:37 +0300 Thu, 28 Apr 2022 03:09:37 +0300

Компания ABBYY представила свою новую разработку под названием Recognition Server IFilter. Этот софт позволяет поисковым системам Microsoft индексировать графические документы для последующего поиска по их содержимому. Теперь пользователи корпоративной сети смогут легко и быстро находить нужные для работы данные, даже если они хранятся в таких форматах как TIFF, JPEG, PDF и DjVu.

Зачастую крупные организации сталкиваются с отсутствием оперативного доступа к корпоративной информации. Для того чтобы найти необходимые документы в электронных архивах компании, сотрудникам приходится прикладывать значительные усилия, что повышает временные издержки и, соответственно, снижает эффективность работы. Семейство продуктов Microsoft SharePoint в числе прочего предлагает мощный сервис корпоративного поиска, позволяющий быстро и гарантированно находить нужную информацию как в структурированных, так и в неструктурированных источниках данных. Схема работы сервиса такова: поисковый агент SharePoint периодически обходит корпоративные библиотеки и автоматически индексирует новые или недавно изменённые документы, после чего они становятся доступными для поиска.

Однако не все документы хранятся в форматах, пригодных для полнотекстового индексирования. Так, важные для организации документы (копии отсканированных договоров, факсы, входящая корреспонденция, а также архивы газет, журналов и книг) нередко сохраняются в графическом виде, что делает поиск по их содержимому невозможным. Интегрируясь в поисковый модуль SharePoint, софт ABBYY успешно решает эту проблему: в его состав входит специальный плагин IFilter, благодаря которому поисковый сервис Microsoft может задействовать программный продукт Recognition Server для непосредственного извлечения содержимого из файлов графических форматов.

Текстовые файлы поисковый агент SharePoint индексирует самостоятельно, а для извлечения данных из изображений привлекает решение ABBYY: IFilter передает изображения в Recognition Server, система распознает документы и затем возвращает распознанный текст в Microsoft SharePoint Server для индексирования. Важно, что обработка изображений не приводит к дополнительной загрузке ресурсов SharePoint: ABBYY Recognition Server устанавливается на отдельный сервер, причем производительность решения может быть в любой момент повышена путем подключения к нему дополнительных мощностей.

Помимо интеграции с Microsoft SharePoint, ABBYY Recognition Server IFilter может работать и с Microsoft Windows Search, системой локального поиска на компьютере пользователя. Один установленный в корпоративной сети ABBYY Recognition Server дает возможность всем сотрудникам организации осуществлять полнотекстовый поиск документов, хранящихся на их персональных компьютерах в виде изображений. При этом все ресурсоемкие процессы происходят незаметно для пользователей – им становится доступен окончательный результат поиска. На компьютеры сотрудников требуется установить всего лишь легкий плагин к Microsoft Windows Search, непосредственная обработка документов будет осуществляться на сервере.

Recognition Server IFilter создан на базе всемирно известных технологий распознавания ABBYY и способен обрабатывать документы на более чем 190 языках. Также система успешно “читает” многоязычные документы, при этом в одном и том же документе могут быть использованы языки различных видов письменности (например, китайский и немецкий, иврит и французский). Решение поддерживает самые популярные графические форматы: TIFF, JPEG, PDF, DjVu, BMP, PCX, DCX и PNG. Таким образом, ABBYY Recognition Server применим не только в процессе индексации документов: он может служить и в качестве удобного инструмента для обработки бумажных и конвертации электронных документов.

Компания ABBYY продолжает расширять линейку решений для корпоративных поисковых систем (Enterprise Search Systems, ESS) на основе Recognition Server: ранее было выпущено аналогичное дополнение для Google Search Appliance (GSA).

Редакция Hi-Fi.ru