Компания ABBYY добавила в программу FineReader новые эталоны, позволяющие распознавать «медицинский» почерк. Благодаря дополнительному модулю MedText пользователям больше не придется самостоятельно расшифровывать выписанные врачами рецепты или направления на лечение: достаточно отсканировать бумажную версию документа, чтобы легко разобраться в ней при помощи софта. Арабская письменность выглядит для людей, не знающих язык, как сложная последовательность связанных элементов, где зачастую визуально довольно сложно выделить в словах отдельные буквы. Для распознавания арабского языка традиционно применяется подход, при котором распознаются не отдельные символы, а слова целиком. Схожие проблемы обычно возникают и при попытке разобрать почерк докторов, поэтому опыт распознавания языков со сложной письменностью был крайне полезен при создании
ABBYY FineReader MedText. Система распознавания медицинских текстов основана на вероятностных графических моделях (PGM), байесовских сетях (BN) и скрытых марковских моделях (HMM). ABBYY FineReader распознает почерк врача большими блоками. В наиболее сложных случаях обрабатываются целые строки как один объект распознавания, превращая изображение в граф вероятностных состояний, из которых потом кристаллизуется осмысленный текст. Разработчики модуля MedText впервые задействовали метод детектирования внутренней логики письма: с его помощью можно определить, какие из завитушек в строке соответствуют реальным буквам, а какие были добавлены для красоты. А настоящим прорывом здесь стала система расшифровки врачебных сокращений, позволяющая не только перевести рецепт в читаемый текст, но и объясняющая пользователю, что же все-таки автор имел в виду. Сейчас в ABBYY трудятся над мобильной версией FineReader MedText, чтобы люди могли разобраться в выписанных рецептах сразу после выхода из кабинета врача.
Редакция Hi-Fi.ru